softwaretechnologie für fortgeschrittene teil thaller stunde vii: information revisited köln 2....

63
Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Upload: carlene-stief

Post on 06-Apr-2015

110 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Softwaretechnologie für FortgeschritteneTeil Thaller

Stunde VII: Information revisited

Köln 2. Februar 2012

Page 2: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Information I

Page 3: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Claude Shannon: "A Mathematical Theory of Communication", Bell System Technical Journal, 1948.

Enthält eine quantitative Definition von Information.

Zweck: Wie kann ein Signal zwischen einem Sender und einem Empfänger mit dem geringstmöglichen Aufwand "korrekt" übertragen werden.

Information

3

Page 4: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Shannon hat also eine technische Definition von "Information", die die Bedeutungsebene völlig ausklammert. Er betont, dass "die semantischen Aspekte der Kommunikation für die ingenieurwissenschaftliche Seite irrelevant sind".

Information

4

Page 5: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Nahezu alle mir bekannten Lehrbücher der Informatik beginnen mit Shannons Definition der Information.

Räumen aber ein, dass die ingenieurwissenschaftliche Definition von Information defizitär sei. Insbesondere:

Information

5

Page 6: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

(1) Bildet sie nur einen Teil des intellektuellen Umfanges des Konzepts "Information„ (syntaktisch, semantisch, pragmatisch) ab.

(2) Gibt es dagegen keine operable Definition die dieses Konzept in seiner vollen Breite abdeckt.

Aber: Die vorhandenen Konzepte reichen aus, um Information auf einem Digitalrechner so darzustellen, dass man sie sinnvoll verarbeiten kann.

*

Information

6

Page 7: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Informationsebenen

Syntax: Beziehungen der „Zeichen“ untereinander.

Semantik: Beziehungen zwischen „Zeichen“ und „Gegenständen“.

Pragmatik: Beziehungen zwischen „Zeichen“ und ihren „Benutzern“.

7

Page 8: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Bernard Favre-Bulle

Information und Zusammenhang. Informationsfluß in Prozessen der Wahrnehmung, des Denkens und der Kommunikation.

Springer: 2001

Information und Wissen

8

Page 9: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Daten sind speicherbare Angaben - 22°C.

Information stellt Daten in einen Kontext:

"In diesem Hörsaal herrscht eine Temperatur von 22°C".

Dieser Kontext ist jedoch noch fest (und für alle Informationsempfänger identisch).

Information und Wissen

9

Page 10: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Wissen ist das Ergebnis von Erkenntnisprozessen. Es bezieht die praktische Anwendung der Daten und Informationen ein. Es muss nicht "absolut wahr" sein, sondern adäquates Handeln zu ermöglichen.

Z.B. die Entscheidung einen Pulli (nicht) auszuziehen, um sich angenehm zu fühlen, ohne sich zu erkälten.

Information und Wissen

10

Page 11: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

*

„Ladder of Knowledge“

11

Weisheit

Wissen

Information

Daten

Page 12: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Information II

Page 13: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Testfile in Word 2007

Page 14: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Testfile in Word 2003 (2007)

Page 15: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Testfile in Open Office ODT

Page 16: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Testfile in PDF

Page 17: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Seite aus der Rendering Umgebung ausschneiden.

Auf gleiche Größe abbilden: 371 +/- 1 x 521 +/- 1

Meßpunkte:

1. Das am weitesten links unten stehende völlig schwarze Pixel des Buchstaben “A” in der ersten Zeile des Haupttexts.

2. Das am weitesten links oben stehende völlig schwarze Pixel des Buchstaben “E” in der ersten Zeile des Haupttexts.

3. Das geometrische Zentrum des Punktes am Ende des Haupttexts.4. Das geometrische Zentrum des Punktes am Ende der Fußnote.

Seiten messen

Page 18: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

(i) = 45 / 134;

(ii) = 57 / 470;

(iii) = 215 / 322 ;

(iv) = 254 / 483

Word 2003 vermessen

Page 19: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

(i) = 45 / 134;

(ii) = 57 / 470;

(iii) = 215 / 322 ;

(iv) = 254 / 483

Word 2007 vermessen

Page 20: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

(i) = 44 / 132;

(ii) = 52 / 469; (iii) = 214 / 320 ;

(iv) = 247 / 482

Open Office ODT vermessen

Page 21: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

(i) = 45 / 130;

(ii) = 59 / 467;

(iii) = 215 / 317 ;

(iv) = 254 / 480

PDF vermessen

Page 22: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Der Vergleich der vier Renderingvarianten der Beispielsseite zeigt deutlich, dass eine Migration von der Word-Format-Familie nach PDF ein besseres Verfahren zur langfristigen Sicherung des Inhalts eines Dokuments ist, als eine Migration ins Open Office Format.

Zusammenfassung

Page 23: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Relationship tagged explicitly.

Text / footnote separation clear.

Rendering / layout not (totally) predicatble.

Footnote indicator unpredictable.

Word 2003 vermessen

Page 24: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Relationship tagged explicitly.

Text / footnote separation extremely clear.

Rendering / layout pretty predictable.

Footnote indicator not predictable.

Word 2007 vermessen

Page 25: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Relationship tagged explicitly.

Text / footnote separation extremely clear.

Rendering / layout a little bit predictable.

Footnote indicator predictable.

Open Office ODT vermessen

Page 26: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Relationship expressed by layout.

Text / footnote separation missing.

Rendering / layout very much predictable.

Footnote indicator predictable.

PDF vermessen

Page 27: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Der Vergleich der vier Inhaltstrukturen der Beispielsseite zeigt deutlich, dass eine Migration von der Word-Format-Familie nach PDF ein schlechteres Verfahren zur langfristigen Sicherung des Inhalts eines Dokuments ist, als eine Migration ins Open Office Format.

Zusammenfassung

Page 28: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Man sollte nie vergessen, dass die ganze Bewegung, die durch SGML in Gang gesetzt wurde, durch HTML das WWW bestimmte und durch XML als Basistechnologie übernommen wurde ...... davon ausgeht, dass Layout ziemlich unwichtig ist.

“Separation of content and form.”

Technische Anmerkung

Page 29: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Authentizität I

Page 30: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

A canticle for Leibowitz

Page 31: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

blue·print  (blōō'prĭnt')    n.  (1) A contact print of a drawing or other image rendered as white lines on a blue background, especially such a print of an architectural plan or technical drawing. (2) A mechanical drawing produced by any of various similar photographic processes, such as one that creates blue or black lines on a white background.(3) A detailed plan of action. See Synonyms at plan.(4) A model or prototype.

A canticle for Leibowitz

Page 32: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

A canticle for Leibowitz

Page 33: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Authentizität II

Page 34: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

…… no further discussion.----------------------------- 2Except, if we assume …

Foreign Ministry, The Hague

So: What do we preserve?

Page 35: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

…… no further discussion.Except, if we assume …----------------------------- 2

Dutch Embassy, Washington DC

So: What do we preserve?

Page 36: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

…… no further discussion.----------------------------- 2Except, if we assume …

Foreign Ministry, The Hague

It took us some time to convince the techies, but now we really see on the screen what appears on the printer.

So: What do we preserve?

Page 37: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

…… no further discussion.Except, if we assume …----------------------------- 2

Dutch Embassy, Washington DC

It took us some time to convince the techies, but now we really see on the screen what appears on the printer.

So: What do we preserve?

Page 38: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

…… no further discussion.----------------------------- 2Except, if we assume …

…… no further discussion.Except, if we assume …----------------------------- 2

Each party has seen this document only in its own settings.

Which view shall we preserve?

aka: Who has seen the authentic document?

So: What do we preserve?

Page 39: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Was ist die authentische Form einer digitalen „Aussage“ die so gestaltet ist, dass sie wahlweise auf einem PC, einem Ipad und einem Smartphone dargestellt werden kann?

If the medium is the message, what is the message if there is more than one medium?

Frage:

39

Page 40: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Cologne Information Model

Page 41: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Data which represent stored information do so in two forms:

1. As a set of tokens, which describe atomic items of information.

2. By a set of independent parameters, which describe, in a formalized way, the semantic interpretation of these items of information.

Assumption I

Page 42: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

1. Most algorithms today are based on “data types”, which are

reflecting hardware characteristics (char, int, float ...).

2. “Objects”, which are constructed from these data types, are transient concepts, which are meaningful only within a specific implementation / environment.

3. What we would need are considerably higher order objects, which are persistent by themselves and independent of a specific implementation / environment.

Assumption II

Page 43: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

The need formulated as assumption II can be fulfilled using

assumption I.

Assumption III

Page 44: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

I = i (D, S, t)

I ::= Information

i() ::= interpretative process

D ::= Data

S ::= Previous knowledge

t ::= time

Langefors “Infological Equation”

Börje Langefors, Essays on Infology, Studentliteratur: Lund, 1995

Page 45: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

(1) I = i (D, S, t)

(2) I2 = i (I1, S2, t)

(3) Ix = i (Ix-1, Sx, t)

(4) Sx = s (Ix-1, t)

(5) Ix = i (Ix-α, Sx-β, t)

(6) Ix = i (Ix-α, s(Ix-β, t), t)

Generalisation of Langefors “Infological Equation”

Page 46: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

(1) <person><surname><bold>Biggin</bold></surname></person>

(2) <person><surname><italics>Biggin</italics></surname></person>

(3) <airfield><name><bold>Biggin</bold></name></airfield>

(4) <airfield><name><italics>Biggin</italics></name></airfield>

Which of the chunks are more similar to each other: (1) and (2) or (1) and (3)?

Four texts

Page 47: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Coordinates:

Page 48: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Coordinates:

Liber exodi glosatus

Page 49: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Generalization 1

49

BigginVisualization {bold, italic}Interpretation {surname, topographic name}

Page 50: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Generalization 2

50

Series of atomic content tokensConceptual dimension 1Conceptual dimension 2

Page 51: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Generalization 3

51

{ T, C1, C2}

Page 52: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Generalization 4

52

{ T, { C1, C2, …, Cn } }

Page 53: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Generalization 5

53

{ T, Cn }

(1) Texts are sequences of content carrying atomic tokens.

(2) Each of these tokens has a position in an n-dimensional conceptual universe.

Page 54: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Generalization 6

54

{ X, Y, Cn }

Page 55: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Generalization 7

55

{ T1, T2, Cn }

(1) Images are planes of content carrying atomic tokens.

(2) Each of these tokens has a position in an n-dimensional conceptual universe.

Page 56: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Generalization 8

56

I ::= { { T1, T2, … Tm}, Cn }

(1) Information objects are m-dimensional arrangements of content carrying atomic tokens.

(2) Each of these tokens has a position in an n-dimensional conceptual universe.

Page 57: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Generalization 9

57

I ::= {Tm, Cn }

(1) Information objects are m-dimensional arrangements of content carrying atomic tokens.

(2) Each of these tokens has a position in an n-dimensional conceptual universe.

(3) All of this, of course, is recursive …

*

Page 58: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Claude Shannon: "A Mathematical Theory of Communication", Bell System Technical Journal, 1948.

Enthält eine quantitative Definition von Information.

Zweck: Wie kann ein Signal zwischen einem Sender und einem Empfänger mit dem geringstmöglichen Aufwand "korrekt" übertragen werden.

Information

58

Page 59: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Zweck: Wie kann ein Signal zwischen einem Sender und einem Empfänger mit dem geringstmöglichen Aufwand "korrekt" übertragen werden.

Wie sieht das aber aus, wenn die Botschaft des Senders nicht verifizierbar ist?

Information im HK Kontext (1)

59

Page 60: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Wie sieht das aber aus, wenn die Botschaft des Senders nicht verifizierbar ist?

Könnte es sein, dass es Sender gibt, die die Botschaft selbst nur zum Teil kennen?

Information im HK Kontext (2)

60

Page 61: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Könnte es sein, dass es Sender gibt, die die Botschaft selbst nur zum Teil kennen?

Könnte es sein, dass Information nicht statisch existiert, sondern der Zustand eines dynamischen Prozesses ist?

Information im HK Kontext (3)

61

Page 62: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Könnte es sein, dass Information nicht statisch existiert, sondern der Zustand eines dynamischen Prozesses ist?

Könnte es sein, dass daher Information nicht als Datenstruktur, sondern nur als Algorithmus verstanden werden kann?

Information im HK Kontext (4)

62

Page 63: Softwaretechnologie für Fortgeschrittene Teil Thaller Stunde VII: Information revisited Köln 2. Februar 2012

Danke für heute;Schöne Ferien!

63