einführung in die informationsverarbeitung teil thaller stunde i: der informationsbegriff köln 18....

52
Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Upload: katrina-egelhoff

Post on 06-Apr-2015

103 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Einführung in die InformationsverarbeitungTeil Thaller

Stunde I: Der Informationsbegriff

Köln 18. Oktober 2012

Page 2: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

I. Häufige Missverständnisse 1

2

Page 3: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Print, film, magnetic, and optical storage media produced about 5 exabytes of new information in 2002. Ninety-two percent of the new information was stored on magnetic media, mostly in hard disks.

Wissensexplosion

3

Page 4: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

How big is five Exabytes? If digitized, the nineteen million books and other print collections in the Library of Congress would contain about ten terabytes of information; five Exabytes of information is equivalent in size to the information contained in half a million new libraries the size of the Library of Congress print collections.

Wissensexplosion

4

Page 5: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

University of California at Berkely, School of Information Management and Systems: How much Information? 2003

http://www.sims.berkeley.edu/research/projects/how-much-info-2003/printable_report.pdf "Executive Summary" auf Seite 1

Wissensexplosion

5

Page 6: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

19 Millionen Bücher 10 TB

10 x 2 40 Bytes

10 000 000 000 000 Bytes

1 Buch 10 000 000 000 000 /

19 000 000

526,315.79 Bytes

1 Seite 3000 Zeichen

1 Buch 175 Seiten

Wissensexplosion

6

Page 7: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Wissensexplosion

7

Page 8: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Wissensexplosion

8

Page 9: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

1 Seite 128 000 000 Bytes

1 Buch 22 400 000 000 Bytes

19 Millionen Bücher 22 400 000 000 x

19 000 000

425 600 000 000 000 000 B

425 Petabyte

Wissensexplosion

9

Page 10: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Print, film, magnetic, and optical storage media produced about 5 exabytes of new information in 2002. Nintey-two percent of the new information was stored on magnetic media, mostly in hard disks.

Wissensexplosion

10

Page 11: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

How big is five exabytes? If digitized, the nineteen million books and other print collections in the Library of Congress would contain about 0.5 exabytes of information; five exabytes of information is equivalent in size to the information contained in ten new libraries the size of the Library of Congress print collections

Wissensexplosion

11

Page 12: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Seite 17: Ein gedrucktes Buch aus rezenter Produktion wird mit 7,8 MB bewertet (ca. 10 mal so gross, wie bei der Abschätzung der Größe der Library of Congress).

*  

Wissensexplosion

12

Page 13: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

1. Es ist schön in Köln zu Ihnen zu sprechen.

2. Es ist schön in Kln zu Ihnen zu sprechen.

3. Es ist schön in Kön zu Ihnen zu sprechen.

4. Es ist schn in Kön zu Ihnen zu sprchen.

5. S'is schö in Kölle zu Ihnen zu sprchen.

Information

13

Page 14: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Luat enier sidtue an eienr elgnhcsien uvrsnäiett, ist es eagl in wcheler rhnfgeeloie die bstuchbaen in eniem wrot snid. Das eniizg whictgie ist, dsas der etrse und der lztete bstuchbae am rtigeichn paltz snid. Der rset knan tatol deiuranchnedr sien und man knan es ienrmomch onhe porbelm lseen. Das legit daarn, dsas wir nhcit jeedn bstuchbaen aeilln lseen, srednon das wrot als gzanes.

Information

14

Page 15: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Claude Shannon: "A Mathematical Theory of Communication", Bell System Technical Journal, 1948.

Enthält eine quantitative Definition von Information.

Zweck: Wie kann ein Signal zwischen einem Sender und einem Empfänger mit dem geringstmöglichen Aufwand "korrekt" übertragen werden.

Information

15

Page 16: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Shannon hat also eine technische Definition von "Information", die die Bedeutungsebene völlig ausklammert. Er betont, dass "die semantischen Aspekte der Kommunikation für die ingenieurwissenschaftliche Seite irrelevant sind".

Information

16

Page 17: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Nahezu alle mir bekannten Lehrbücher der Informatik beginnen mit Shannons Definition der Information.

Räumen aber ein, dass die ingenieurwissenschaftliche Definition von Information defizitär sei. Insbesondere:

Information

17

Page 18: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

(1) Bildet sie nur einen Teil des intellektuellen Umfanges des Konzepts "Information„ (syntaktisch, semantisch, pragmatisch) ab.

(2) Gibt es dagegen keine operable Definition die dieses Konzept in seiner vollen Breite abdeckt.

Aber: Die vorhandenen Konzepte reichen aus, um Information auf einem Digitalrechner so darzustellen, dass man sie sinnvoll verarbeiten kann.

*

Information

18

Page 19: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

II. Begriffe rund um die “Information”

19

Page 20: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Informationsebenen

Syntax: Beziehungen der „Zeichen“ untereinander.

Semantik: Beziehungen zwischen „Zeichen“ und „Gegenständen“.

Pragmatik: Beziehungen zwischen „Zeichen“ und ihren „Benutzern“.

20

Page 21: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Bernard Favre-Bulle

Information und Zusammenhang. Informationsfluß in Prozessen der Wahrnehmung, des Denkens und der Kommunikation.

Springer: 2001

Information und Wissen

21

Page 22: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Daten sind speicherbare Angaben - 22°C.

Information stellt Daten in einen Kontext:

"In diesem Hörsaal herrscht eine Temperatur von 22°C".

Dieser Kontext ist jedoch noch fest (und für alle Informationsempfänger identisch).

Information und Wissen

22

Page 23: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Wissen ist das Ergebnis von Erkenntnisprozessen. Es bezieht die praktische Anwendung der Daten und Informationen ein. Es muss nicht "absolut wahr" sein, sondern adäquates Handeln zu ermöglichen.

Z.B. die Entscheidung einen Pulli (nicht) auszuziehen, um sich angenehm zu fühlen, ohne sich zu erkälten.

Information und Wissen

23

Page 24: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

*

„Ladder of Knowledge“

24

Weisheit

Wissen

Information

Daten

Page 25: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

III. Häufige Missverständnisse 2

… und was heisst “Information darstellen?”

25

Page 26: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

George Bool (1815-1864), "The Laws of Thought". Formales Rechnen mit logischen Ausdrücken, die nur die Zahlenwerte "1" (wahr) und "0" (falsch) kennen.

Aussage: Computer kennen nur wahr oder falsch, keine "Zwischentöne".

Wahrheit

26

Page 27: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Umgesetzt in Programmiersprachen als:

if (aussage == 1) nimm an, dass Aussage wahr.

else nimm an, dass Aussage falsch.

Wahrheit

27

Page 28: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

… aber auch als:

if (aussage == 0) nimm an, dass Aussage falsch.

else nimm an, dass Aussage wahr.

Wahrheit

28

Page 29: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Z.B. in folgendem Programm:

int aussage; aussage=bewerteZustandDerWelt(); if (aussage == 0) nimm an, dass Aussage falsch.

else nimm an, das Aussage wahr.

Wahrheit

29

Page 30: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Z.B. in folgendem Programm:

int aussage;

"int" kennzeichnet eine ganze Zahl, die die Zahlenwerte von 0 bis 232

-1 annehmen kann.

aussage=bewerteZustandDerWelt(); if (aussage == 0) nimm an, dass Aussage falsch.

else nimm an, das Aussage wahr.

Wahrheit

30

Page 31: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Z.B. in folgendem Programm:int aussage;

"int" kennzeichnet eine ganze Zahl, die die Zahlenwerte von 0 bis 232

-1 annehmen kann.

aussage=bewerteZustandDerWelt(); if (aussage == 0) nimm an, dass Aussage falsch.

else nimm an, das Aussage wahr.

Es gibt also genau eine Art "falsch" auszudrücken, aber 4.294.967.294 Varianten von "wahr"?

Wahrheit

31

Page 32: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Unabhängig von dem, was George Bool gesagt hat, gilt also in Wirklichkeit nicht

"0" = falsch. "1" = wahr.

Wahrheit

32

Page 33: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

... sondern in Wirklichkeit:

"0" = falsch.

"1" bis "4.294.967.295" = wahr.

Wahrheit

33

Page 34: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

dann könnte aber genau so gut gelten:

"0" = falsch. "1" bis "4.294.967.294" = unklar. "4.294.967.295" = wahr.

Wahrheit

34

Page 35: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

oder genauso willkürlich:

"0" bis "255" = falsch. "256" bis "4.294.967.039" = unklar. "4.294.967.040" bis "4.294.967.295" = wahr.

Wahrheit

35

Page 36: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

oder auch:

"0" = sicher falsch. "20.000" = ziemlich sicher falsch. "100.000" = ziemlich sicher falsch, aber mit fünfmal größerer Wahrscheinlichkeit richtig als "20.000". "4.000.000.000" = ziemlich sicher richtig. "4.294.967.295" = sicher wahr.

Wahrheit

36

Page 37: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Binäre Logik

Kennt nur "wahr" und "falsch".

n-äre oder mehrwertige Logik

Kennt n Wahrheitswerte.

Kontinuierliche Wahrheitsfunktionen

Nehmen unendlich viele Wahrheitswerte an.

*

Wahrheit - Begriffe

37

Page 38: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

IV. Häufige Missverständnisse 3

… oder: Die Mystik des Digitalen

38

Page 39: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Das korrekte Begriffspaar in der Informatik:

„diskret“ v. „kontinuierlich“.

Digital - Analog

39

Page 40: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

1,00134… + 0,48723… = 1,48857…

Eine Addition kontinuierlicher Zahlenwerte.

Digital - Analog

40

Page 41: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Nach diesem Prinzip – heute nur mehr für Spezialanwendungen – verwendete Computer, die z.B. Spannungen oder Stromstärken „addieren“ heißen „Analogrechner“.

Digital - Analog

41

Page 42: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

4,00000 + 2,00000 = 6,00000

Eine Addition diskreter Zahlenwerte.

Digital - Analog

42

Page 43: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

0,00004 + 0,00002 = 0,00006

Ebenfalls eine Addition diskreter Zahlenwerte.

Digital - Analog

43

Page 44: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

0,00004 + 0,00002 = 0,00006

Auch eine Addition diskreter Zahlenwerte.

Digital - Analog

44

Page 45: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

0,00004 + 0,00002 = 0,00006

Kontinuierlich oder diskret?

Digital - Analog

45

Page 46: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Ob eine Darstellung „analog“ oder „digital“ ist, hängt in erster Linie von der Meßgenauigkeit ab.

Merke: Digitaluhren sind analoger als analoge mechanische Uhren!

*

Digital - Analog

46

Page 47: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

V. Repräsentation von Information

47

Page 48: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Shannon, C.E.: A Mathematical Theory of Communiction. The Bell Systems Technical Journal, 27 (1948), 379-423

Informationsgehalt als Wahrscheinlichkeit dass eine bestimmte Angabe zufällig zustande kommt.

Wird in der Signaltheorie verwendet um beispielsweise das korrekte Übertragen von Bildern zu beurteilen.

Der Informationsbegriff

48

Page 49: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Problem: Bezieht sich ausschließlich auf syntaktischen Aspekt von Zeichen. (= Beziehung zwischen Zeichen.) Zeichen stehen aber nicht nur zu anderen Zeichen in Beziehung, sondern auch:

• zu ihren Bedeutungen. (Semantischer Aspekt.)

• zu den bezeichneten Objekten. (Sigmatischer Aspekt.)

• zu den Systemen / Teilsystemen (zu deren Zielen, Zwecken, etc.) zwischen denen Zeichen übermittelt werden.

So schon: Wörterbuch der Kybernetik, hrsg. v. G. Klaus / H. Liebscher, Berlin, 41976, Artikel "Information", p. 281.

Der Informationsbegriff

49

Page 50: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Daher in der Informatik "Information" meist als nicht weiter definierter Grundbegriff.

Z.B.: U. Rembold / P. Levi: Einführung in die Informatik für Naturwissenschaftler und Ingenieure, München etc., 3 1999.

Informatik als Wissenschaft, die sich damit beschäftigt, wie dieser "Rohstoff" in Rechnern

• dargestellt (Strukturen) und

• verarbeitet (Algorithmen) wird.

Der Informationsbegriff

50

Page 51: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

1. "Selbstabbildende Information". Es kann "gerechnet" werden. Bilder.

2. "Kodierte Information". Zeichenketten und Teilketten können verglichen werden. Texte.

3. "Symbolische Information". Terme können verglichen werden. Terminologien, "Ontologien" u.ä.

*

„Arten“ von Information

51

Page 52: Einführung in die Informationsverarbeitung Teil Thaller Stunde I: Der Informationsbegriff Köln 18. Oktober 2012

Danke für heute!

52