Archiv der Kategorie: Information

Die platonische Welt

Warum ‹platonisch›?

Penrose bezeichnet eine der drei Welten in der Drei-Welten-Theorie als platonisch. Weshalb?

Platon

Der reiche Athener Bürger Platon war ein Anhänger des Philosophen Sokrates. Er hat im 4. Jahrhundert vor Christus eine Philosophenschule gegründet, die für die europäische Philosophie grundlegend war und die philosophische Diskussion bis in unsere Zeit entscheidend prägte. Wenn also Roger Penrose eine der drei Welten ‹platonisch› nennt, bezieht er sich auf Platon und im Speziellen auf eine bestimmte Frage und den Diskurs darüber, der bis heute ausstrahlt. Die Frage lautet: Sind Ideen real?

Platons Ideenrealismus

Oft wurde von den nachfolgenden Philosophen das Thema als ein Konflikt zwischen Platon und seinem Schüler Aristoteles dargestellt. Platon wird die Haltung zugeschrieben, dass die Ideen nicht nur real seien, sondern sogar die eigentliche Realität, und das, was wir als Realität bezeichnen, nur ein Abklatsch der Ideen. Penrose bezeichnet nun die abstrakte Welt der Mathematik als ‹platonische› und nimmt damit Bezug auf den Gedanken Platons, dass nämlich den abstrakten Ideen ein Realitätswert zukommt.

Die Ideenwelt als eine der drei Welten

Die platonische Realität der Ideen wurde natürlich auch bestritten und Europas Philosophiegeschichte ist voll von Pros und Contras dazu, die unter den Stichworten Realismus, Nominalismus und Universalienstreit den Diskurs der Philosophen über viele Jahrhunderte geprägt haben und im Hintergrund auch heute noch wirksam sind. Die Theorie von Penrose ordnet nun wie Platon der abstrakten platonischen Welt eine Realität zu, aber nicht die der einzigen Realität, wie das ein kompromissloser platonischer Realismus tun würde, sondern als eine der drei Realwelten, die miteinander im Austausch stehen. Es geht also bei der Drei-Welten-Theorie nicht darum, welche Welt die reale oder wahre sei – wie etwa im Universalienstreit –, sondern darum, wie der Austausch zwischen ihnen stattfindet.

Doch zurück zur platonischen Welt. Was zeichnet sie gegenüber den anderen beiden aus?

Charakteristika der platonischen Welt

Nicht-Lokalität

Wo ist die Zahl ‹3›? Können Sie irgendwo in Ihrer Umgebung darauf zeigen?

Sie können natürlich auf drei Äpfel zeigen, auf drei Bleistiftstriche oder auf drei Kaffeetassen, aber das ist nicht die Zahl Drei, sondern das sind Äpfel, Bleistiftstriche und Kaffeetassen. Die Zahl Drei bleibt abstrakt. Niemand kann darauf zeigen.

Selbstverständlich können Sie auch das Wort ‹drei› oder auf die ‹3› in diesem Text zeigen, aber das sind nur die Symbole für die Zahl und nicht die Zahl selber. Die Zahl selber bleibt abstrakt; sie existiert gleichzeitig überall und nirgendwo.

Symbole stehen immer an einem bestimmten Ort, sie sind also lokalisiert. Die Zahl selber aber ist nicht-lokal, d.h. es gibt keinen Ort im Universum, an dem sich die Zahl befindet, sie befindet sich vielmehr überall. Es gibt sie auf der Erde, dem Mond und ebenso auf der Andromeda. Diese Nicht-Lokalität ist eine ganz elementare Eigenschaft der Objekte der platonischen Welt, und sie zeichnet sie insbesondere gegenüber den Objekten der physikalischen Welt aus, in der die Objekte örtlich definiert, d.h. lokalisiert sind.

Zeitlosigkeit

Mit der Zeit verhält es sich analog zum Ort:

1 plus 2 sind 3 – das ist wahr, und zwar gestern, heute, morgen und in alle Ewigkeit. Man kann die platonische Welt in diesem Sinn als einen Ort der ewigen Wahrheiten bezeichnen, ganz im Gegensatz zur physikalischen Welt, die dem steten Wandel unterworfen ist. Wenn es heute regnet, kann morgen die Sonne scheinen, 1 plus 2 hingegen ergibt an allen Tagen drei. Diese Zeitlosigkeit gilt für alle mathematische Aussagen, aber auch für ihre Objekte, wieder im Gegensatz zu den Objekten der physikalischen Welt: die Zahl 3 ist zeitlos, 3 Äpfel hingegen sind es nicht.


Dies ist ein Beitrag zur 3-Welten-Theorie.

Das Bit hat keine Bedeutung

Das Bit ist die Basis der IT

Unsere Informationstechnologie baut auf dem Bit auf. Alles, was in unseren Computern geschieht, basiert auf diesem kleinsten Basiselement der Information. Wenn Sie gefragt werden, was ein einzelnes Bit bedeutet, werden Sie möglicherweise antworten, dass das Bit zwei Zustände einnehmen kann, von denen der eine 0 ist und der andere 1 bedeutet. Auf diese Weise können wir bekanntlich beliebig hohe Zahlen schreiben, wir müssen einfach genügend Bits hintereinander reihen.

Aber stimmt das auch? Bedeutet wirklich der eine Zustand im Bit 0 und der andere 1? Können die beiden Zustände nicht auch ganz andere Bedeutungen annehmen?

Dem Bit können beliebige Bedeutungen zugeschrieben werden

In der Tat können die beiden Zustände des Bits irgendeine Bedeutung einnehmen. Beliebt sind neben 0/1 auch Wahr/Falsch, Ja/Nein, Positiv/Negativ, aber im Prinzip und in der Praxis können dem Bit von aussen irgendwelche Bedeutungen zugeschrieben werden. Selbstverständlich sind auch Umkehrungen erlaubt, also neben 0/1 auch 1/0.

Die Zuschreibung der Bedeutung des Bits erfolgt von aussen

Ob das konkrete Bit im Computerprogramm nun 0/1 oder 1/0 oder irgendetwas anderes bedeutet, spielt selbstverständlich eine entscheidende Rolle. Die Bedeutung liegt aber nicht im Bit selber, denn das Bit ist eine höchst radikale Abstraktion. Es sagt nur aus, dass zwei Zustände existieren und welcher zur Laufzeit gerade aktuell ist. Was die beiden aber bedeuten, ist eine ganz andere Geschichte, die über das einzelne Bit weit hinausgeht. In einem Computerprogramm kann z.B. deklariert werden, dass das Bit dem Wertepaar TRUE/FALSE entspricht. Das gleiche Bit kann aber auch mit anderen Bits zusammen als Teil einer Zahl oder eines Buchstabencodes interpretiert werden – sehr unterschiedliche Bedeutungen also, je nach Programmkontext.

Digitaler und analoger Kontext

Das Softwareprogramm ist der digitale Kontext und er besteht selbstverständlich aus weiteren Bits. Diese Bits aus der Umgebung können verwendet werden, um die Bedeutung eines Bits zu bestimmen. Nehmen wir an, unser Bit sei mit weiteren Bits daran beteiligt, den Buchstaben ‹f› zu definieren. Unser Programm sei auch so organisiert, dass dieser Buchstabe in eine Tabelle zu stehen kommt, und zwar in eine Spalte, die mit ‹Geschlecht› überschrieben ist. All dies ist in der Software klar geregelt. Legt nun die Software die Bedeutung des Bits fest? Sicher sind Sie nicht überrascht, wenn das ‹f› die Bedeutung ‹feminin› hat und die Tabelle vermutlich verschiedene Personen auflistet, die männlich oder weiblich (f) sein können. Was aber bedeuten männlich und weiblich? Erst in der analogen Welt bekommen diese Ausdrücke eine Bedeutung.

Das Bit, die perfekte Abstraktion

Das Bit stellt in der Tat den Endpunkt einer radikalen Informationsabstraktion dar. Die Information ist im einzelnen Bit soweit auf das absolut Elementare reduziert, dass die Information über die Bedeutung aus dem Bit vollständig herausgenommen worden ist. Das Bit sagt nur noch aus, dass zwei – ausserhalb des Bits beschriebene – Zustände existieren und welcher der beiden zu einem bestimmten Zeitpunkt aktuell ist.

Diese radikale Abstraktion ist gewollt und in einer Software sehr sinnvoll. Denn so kann das gleiche physische Bit im Chip des Computer immer wieder neu verwendet werden, einmal als TRUE/FALSE-Paar, einmal als 0/1, einmal als JA/NEIN usw. Das ist sehr praktisch und ermöglicht dem Computer, beliebige Aufgaben zu erfüllen. Die dadurch gewonnene perfekte Abstraktion nimmt dem einzelnen Bit aber gleichzeitig seine individuelle Bedeutung und diese kann und muss dann für jede Anwendung von aussen neu gegeben werden.

Der unendliche Regress

Wenn die Bedeutung des Bits von aussen gegeben wird, dann können natürlich andere Bits diese Aufgabe übernehmen und die Bedeutung des einen Bits definieren. Dazu müssen aber diese äusseren Bits die entsprechende Wirkkraft haben, die natürlich nicht ohne deren eigenen Bedeutung zu haben ist. Und selbstverständlich liegen die Bedeutungen der Bits dieses äusseren Kreises nicht in diesen Bits selber – aus den gleichen Gründen wie oben – sondern sie müssen von aussen, d.h. von einem weiteren Kreis von Bits gegeben werden. Die Bits dieses zweiten äusseren Kreises müssen in einem weiteren Kreis erklärt werden und die Bedeutung der Bits dieses weiteren Kreises wiederum von einem noch äusseren  …  Selbstverständlich kommt dieser Prozess der Bedeutungszuordnung in einer Welt von Bits nie an sein Ende, der Regress ist unendlich.

Erst im Analogen endet der unendliche Regress

Erst wenn wir aus dem Programm in die Realwelt heraustreten, können wir den Informationen aus dem Computer wirkliche eine Bedeutung zuordnen.

Selektiver und deskriptiver Informationsgehalt

Wenn wir das oben Beschriebene rekapitulieren können wir im Bit Folgendes unterscheiden:

Der deskriptive Informationsgehalt sagt aus, was das Bit bedeutet, er beschreibt die beiden Zustände des Bits, sagt aber nicht aus, welcher Zustand aktuell gewählt ist.  Der selektive Informationsgehalt andererseits sagt aus, welcher der beiden Zustände aktuell ist, weiss aber nichts über die Eigenschaften der beiden Zustände, und somit auch nichts über ihre jeweilige Bedeutung.

Die Unterscheidung zwischen selektivem und deskriptivem Informationsgehalt wurden vom britischen Radar-Pionier und Informationswissenschaftler Donald McKay in den 40-er Jahren des letzten Jahrhunderts geprägt, praktisch gleichzeitig mit der ersten Erwähnung und Beschreibung des klassischen Bits durch den Amerikaner Shannon. McKay hat auch bereits sehr klar erkannt, dass das Bit von Shannon nur einen selektiven Informationsgehalt trägt und der deskriptive muss von aussen gegeben werden.

Erstaunlicherweise ist diese Erkenntnis von McKay heute beinahe in Vergessenheit geraten.

Fazit:

1. Das Bit liefert den selektiven Informationsgehalt.
2. Der deskriptive Informationsgehalt liegt nicht im Bit.
3. Das Bit hat allein somit auch keine Bedeutung.
4. Die Bedeutung des Bits wird stets von aussen gegeben.
5. Dadurch wird ein unendlicher Regress initiiert.
6. Erst im Analogen endet der unendliche Regress.

Kombinatorische Explosion

Objekte und Relationen

Als erstes schauen wir eine Menge von Objekten an und überlegen uns, wie viele Verbindungen (Relationen) es zwischen ihnen gibt. Dabei legen wir unser Augenmerk nicht auf die Art der Beziehung zwischen den Objekten, sondern beschränken uns darauf, die Relationen zu zählen. Das ist ganz einfach ist, denn im Prinzip besteht zwischen jeweils zwei Objekten immer genau eine Relation. Auch wenn die zwei Objekte nichts miteinander zu tun haben, ist das eine Information, die etwas aussagt, und somit eine gültige, d.h. aussagekräftige Relation. Wir zählen also die Zahl der möglichen Verbindungen zwischen den Objekten zusammen und vergleichen die Zahl der Objekte mit der Zahl der Relationen.

7 Objekte und ihre Relationen
Abb 1: Sieben Objekte und ihre Relationen

In Abb 1 sehen wir sieben Objekte (blau) und ihre Relationen (rot). Jedes Objekt ist mit jedem anderen Objekt verbunden, in unserem Beispiel also jedes der 7 Objekte mit 7-1 = 6 weiteren Objekten. Insgesamt erhalten wir so 7 *6 / 2 = 21 Relationen. Die allgemeine mathematische Formel dafür ist oder NR = (NO2 – NO) / 2. Dabei ist NR die Zahl der Relationen und NO die Zahl der Objekte.
Die Zahl der Relationen nimmt, wie wir aus der Formel ersehen können, im Quadrat zur Zahl der Objekte zu. Nicht-mathematisch ausgedrückt:

Es gibt immer viel mehr Relationen als Objekte, und zwar sehr viel mehr!

Hier eine kleine Tabelle mit den Zahlen für Objekte und Relationen:

NO  NR
———————-
1    0
2    1
3    3
4    6
5    10
6    15
7    21
8    28
9    36
10     45
100   4950
1000    499’500

Tab 1: Objekte und Relationen

Bei kleinen Zahlen fällt die quadratische Steigerung nicht so auf, bei nur leicht grösseren fällt sie aber schon deutlich ins Gewicht. Wir können uns jetzt schon überlegen, was diese Zunahme in der Praxis bedeutet, schauen uns aber vorher noch die Zahl der möglichen Kombinationen an.

Objekte und Kombinationen

Bei Kombinationen geht es darum, wie mehrere Objekte miteinander kombiniert werden können. Während bei den Relationen eine Relation immer genau zwei Objekte verbindet, können Kombinationen beliebig viele Objekte enthalten, also jede Anzahl Objekte von 1 bis alle (= NO).

Tab 2: Objekte und Kombinationen
Tab 2: Objekte und Kombinationen

Tabelle 2 zeigt Mengen mit 1 bis 4 Objekten. Die Anzahl der Objekte ist in der ersten Spalte, diejenige der Kombinationen in der zweiten aufgeführt. Die Objekte sind mit Buchstaben (a, b, c ,d) bezeichnet. In der Spalte ganz rechts sind die jeweils möglichen Kombinationen aufgezählt. Bei nur einem Objekt (a) gibt es gerade einmal eine Kombination, die aus genau diesem Element besteht, bei 2 Objekten gibt es 3 Kombinationen und bei 4 Elementen sind es bereits 15. Die Zahl der Kombinationen pro Objekt nimmt also noch stärker zu als vorher die Zahl der Relationen. Die Formel dafür ist: NC = 2No – 1.

Bei den Relationen wird NO quadriert, während es bei den Kombinationen im Exponenten vorkommt. Dies bewirkt eine noch grössere, nämlich eine exponentielle Steigerung. Die Zahl der möglichen Kombinationen steigt dabei exponentiell zur Zahl der vorhandenen Objekte. Bei 10 Objekten gibt es bereits 1023 Kombinationen, bei 100 Objekten sind es in der Tat 1’267’650’600’228’229’401’496’703’205’375 Kombinationen.

Die Zahl der Kombinationen steigt somit sehr schnell extrem stark an.

Diese exponentielle Zunahme ist die Basis der kombinatorischen Explosion.

Kombinatorische Explosion

Nehmen wir an wir haben verschiedene Objekte mit verschiedenen Eigenschaften, z.B.:

4 Formen: rund, quadratisch, dreieckig, sternförmig.
8 Farben: rot, orange, gelb, grün, blau, braun, weiss, schwarz.
7 Materialen: Holz, PVC, Aluminium, Karton, Papier, Glas, Stein.
3 Grössen: klein, mittel, gross.

Diese vier Klassen mit ihren insgesamt 22 Eigenschaften können wir nun beliebig kombinieren, ein Objekt kann also z.B. dreieckig, grün, mittelgross und aus PVC sein. Wie viele verschiedenartige Objekte können wir mit den 22 Eigenschaften nun insgesamt unterscheiden?

Die Antwort ist, dass aus jeder der vier Klassen (Form, Farbe, Material, Grösse) je eine Eigenschaft unabhängig gewählt werden kann. Das ergibt insgesamt 4x8x7x3 = 672 Möglichkeiten der Kombination. Mit 22 Eigenschaften können also 672 verschiedene Objekte beschrieben werden. Für jede weitere Klasse multipliziert sich die Zahl der Möglichkeiten.

Schon nach wenigen zusätzlichen Klassen explodiert die Zahl der möglichen Kombinationen regelrecht.

Das ist die kombinatorische Explosion. Sie spielt in ganz vielen Situationen eine entscheidende Rolle.


Nachtrag vom 23.3.2020

Beispiele für exponentielles Wachstum:
– Epidemien
– Zins und Zinseszins
– Gewisse Treibhausgase
– Kettenreaktionen, z.B. in nuklearen Explosionen
– «Going viral» im Internet
– «Going viral» von Unternehmen
– Popularitätskurven von Showstars und Politikern

Grenzen des Wachstums:
Da in der Realität kein unbegrenztes Wachstum möglich ist, stösst ein exponentielles Wachstum immer an Grenzen, weil entweder die Ressourcen für weiteres Wachstum erschöpft sind, oder kein Raum für weitere Ausbreitung mehr vorhanden ist.  Oft bricht dann das Wachstum plötzlich und unerwartet ab.

Lineares und exponentielles Wachstum:
Wir tendieren dazu, Wachstum als linear, d.h. als gleichmässig anzusehen. Wachstum ist aber in vielen Gebieten exponentiell, was wir oft ausblenden. Weshalb ist das so? Wenn wir nur einen kleinen Zeitraum eines exponentiellen Wachstums anschauen, erscheint die Kurve linear, erst bei einer längeren Betrachtungsweise zeigt sich die exponentielle Steigung. Die Steigung kann zu Beginn sogar sehr  klein sein und  quasi vernachlässigbar erscheinen, doch das ist eine Täuschung, wenn das Wachstum exponentiell ist.

Mein Perpetuum mobile

Die  Erfindung

Ich habe ein Perpetuum mobile erfunden. Obwohl es schon lange her ist, kann ich mich noch genau daran erinnern. Ich war ungeheuer stolz darauf und konnte nicht verstehen, warum meine Umgebung mir meine einleuchtende Idee nicht abnahm.

Aufgrund der Details kann ich die Erfindung auch zeitlich genau datieren. Ich war damals zehn Jahre alt. Und wie bei jeder anderen Erfindung war es ein Zusammentreffen von zwei Beweggründen, die mir die Erfindung ermöglichten. Der eine Grund war das Ziel (Causa finalis) und der andere die formale Möglichkeit (Causa formalis), die es ermöglichte, das Ziel zu erreichen. Der Trick bei einer Erfindung besteht darin, die beiden Gründe zusammenzubringen, obwohl sie auf den ersten Blick gar nichts miteinander zu tun haben. Das war auch bei meiner Erfindung so.

Der Rasenmäher

Das Ziel (Causa finalis) war ein Rasenmäher. Mein Vater wollte einen anschaffen und ich hörte eine Diskussion darüber. Möglicherweise ging es darum, ob es ein benzingetriebener oder ein moderner elektrischer sein sollte. Jedenfalls erkannte ich eine dritte Möglichkeit. Hier kommt nun der zweite Grund, nämlich die Causa formalis zum Zug. Ich war zu der Zeit fasziniert von Zahnrädern (Wilber-Adepten:  das muss wohl das orange Mem gewesen sein) und kannte auch die Möglichkeit von gespannten Metallfedern. Das ermöglichte mir die Verbindung von Form und Ziel.

Ich hatte bereits begeistert eine Serie von ineinander greifenden Zahnräder verschiedener Durchmesser auf ein Papier gezeichnet, welche die Kraft einer gespannten Metallfeder übertrugen. Die Erfindung bestand nun darin, dass am Ende der Kraftübertragung eine zweite Metallfeder stand, die von der ersten angespannt wurde. Diese zweite Metallfeder hatte natürlich die Möglichkeit – über eine weitere phantastische Anordnung von Zahnrädern – die erste Feder zu spannen. Somit war die erste wieder bereit, über ihre Serie von Zahnrädern die zweite zu spannen – und so fort. Ein perfektes Perpetuum mobile. Ich verstand meinen Vater nicht, der es ablehnte, auf der Basis meiner genialen Idee einen Rasenmäher zu konstruieren. der weder Strom noch Benzin braucht.

Aber ich liess mich nicht beirren. Trotz diesem Rückschlag versuchte ich meine Idee weiter zu perfektionieren. Es war mir nämlich klar, dass das Konzept noch vereinfacht werden konnte. Es waren ja gar nicht alle Zahnräder nötig. Also erstellte ich eine neue Skizze. Und dann mit noch weniger Zahnräder eine weitere.  Ich kam gut vorwärts. Schliesslich gelang es mir, das Konzept auf eine einzige Achse mit zwei Metallfedern zu reduzieren. Die erste zog die zweite auf, die zweite dann wieder die erste. Genial einfach, nicht wahr?

In diesem Moment aber geschah etwas. Ich sah die Achse mit den beiden Metallfedern vor mir und mir wurde ganz gegen meinen Willen, aber auch ganz deutlich klar, dass das nicht funktionieren konnte. Ich sah die beiden Metallfedern auf der einen gemeinsamen Achse vor meinem geistigen Auge, wie sie ihre Kräfte gegeneinander ausspielten und sich schliesslich bei einem Kräftegleichstand trafen, und dass die Anlage in diesem Moment keinen Grund mehr hätte, sich in irgend einer Richtung zu bewegen. Es war bitter, aber meine Perpetuum mobile war gestorben.

Und die Lehre daraus?

Nicht alles, was sich super anfühlt, funktioniert auch. Aber dafür hatte ich ein anschauliches Beispiel für den Energieerhaltungssatz, das ich nicht so leicht vergessen konnte. Und noch ein weiteres Prinzip steckt in der Geschichte meiner gescheiterten Erfindung, nämlich das Parsimonitätsprinzip. Vermutlich kennen Sie den Namen nicht, aber das Prinzip kennen Sie bestimmt. Es handelt sich um ein allgemeines Konstruktionsprinzip, das besagt, dass man in Konstruktionen stets das Einfache suchen soll und alles überflüssige wegstreiche. Keep it simple, mit anderen Worten. Genau das hatte ich getan, als ich die überflüssigen Zahnräder wegstrich und nur noch die eine Achse mit den Federn behielt. Dadurch war es mir möglich, die Essenz meiner Erfindung zu erkennen – und gegen meinen Willen auch ihr Scheitern.

Parsimonitätsprinzip (nach Ockham)

Das Parsimonitätsprinzip ist auch unter den Namen Ökonomieprinzip und Ockham’s Razor bekannt. Wilhelm von Ockham (1288-1347) formulierte es so: «frustra fit per plura quod fieri potest per pauciora»  (Umsonst geschieht durch Mehreres, was sich mit Wenigem tun läßt ). Er wandte diesen Satz auf Begriffe an und plädierte dafür, die Zahl der Begriffe nicht ohne Notwendigkeit zu vermehren. Dem kann ich nur zustimmen.

Mein Vater hat übrigens einen elektrischen Rasenmäher gekauft.

Informationsreduktion (Übersicht)

Wollen wir möglichst wenig wissen?

Natürlich nicht, je mehr wir wissen, umso besser, werden Sie denken. Im Prinzip stimme ich Ihnen ja zu, doch so allgemein und absolut würde ich das nicht formulieren. Es gibt durchaus Details, die mich nicht interessieren und in meinem Kopf ist auch nicht unbeschränkt Platz.

Also muss ich haushalten. Dabei ist eine Reduktion der unmittelbar verfügbaren Informationsmenge hilfreich. Schon aus diesem Grund ist das Thema «Informationsreduktion» bedenkenswert. Bei näherem Hinsehen aber erweist sich der Gedanke, die Menge an Information zu reduzieren, nicht nur als nützlich in vielen praktischen Situationen, sondern vielmehr als eine Art Schlüssel dafür, wie wir mit Information sinnvollerweise umgehen. Dieser Schlüssel mag auf den ersten Blick absurd erscheinen, doch weniger ist oft mehr, und ich lade Sie gern zur Überlegung ein, weniger zu wissen um mehr zu wissen. Zum Thema Informationsreduktion also.

Informationsreduktion ist der Schlüssel für unseren Umgang mit Information

Zu dieser These habe ich die folgenden Internetbeiträge geschrieben:

IR1: Kodierung
Das ist mein persönlicher Einstieg ins Thema. Ich habe 1989 damit begonnen, Programme zu schreiben, um medizinische Diagnoseformulierungen von Rechnern kodieren zu lassen. Dabei wurde mir schnell klar: Diese Art Kodierung ist immer eine Informationsreduktion.  Und die Informationsreduktion macht Sinn. In der Zeit habe ich auch die vier Thesen zur Informationsreduktion bei der Kodierung formuliert.

IR2: Quantifizierung der Informationsreduktion
Das Ausmass der Reduktion der Datenmenge bei der Diagnosekodierung ist immens.

IR3: Informationsreduktion bedeutet Selektion
Sobald die Informationsmenge reduziert wird, stellt sich die Frage, welche Information behalten wird und welche verloren geht. Eine Frage der Selektion also. Gleichzeitig wird klar: Es sind unterschiedliche Selektionen möglich.

IR4: Framing
Informationsreduktion hat Konsequenzen. Hier ein Beispiel aus einem ganz anderen Gebiet, der Politik nämlich. Es zeigt, wie die Informationsreduktion und die entsprechende Selektion unsere Wahrnehmung bestimmen kann.

IR5: Informationsreduktion in der Physik
Das klassische Exempel für Informationsreduktion findet sich in der Wärmelehre. Wie hängt die Information über die Bewegungen der Moleküle in einem Wasserglas (genauer: in einem idealen Gas) mit der Information über die Temperatur zusammen? Die Antwort auf diese Frage führt über die Konzepte von Mikro- und Makrozustand.

IR6: Das Wasserglas, revisited
Die Überlegungen zum Wasserglas werden präzisiert.

IR7: Mikro- und Makrozustand
Der detailreichere Mikrozustand ist näher bei der Realität, aber der informationsärmere Makrozustand interessiert uns mehr. Die Unterscheidung von Mikro- und Makrozustand ist nicht nur in der Wärmelehre, sondern auch in der Informationstheorie anwendbar.

IR8: Unterschiedliche Makrozustände
In der Wärmelehre wird der Makrozustand vollständig vom Mikrozustand bestimmt. Ist das aber auch für andere Mikro-/Makrozustände so? Neben dem klassischen thermodynamischen Fall (wo das so ist) können zwei weitere beschrieben werden, in denen der Makrozustand wesentlich «eigenmächtiger» erscheint. In der Biologie zum Beispiel.

Informationsreduktion 8: Unterschiedliche Makrozustände

Zwei Zustände gleichzeitig

Im Vorbeitrag habe ich dargestellt, wie ein System auf zwei Ebenen beschrieben werden kann, auf der Ebene des Mikro- und auf der des Makrozustandes. Auf der Ebene des Mikrozustandes finden sich alle Detailinformationen, auf derjenigen des Makrozustandes finden sich weniger, dafür stabilere Informationen. Das klassische Beispiel ist das Wasserglas, wo der Mikrozustand die Bewegung der einzelnen Wassermoleküle beschreibt, der Makrozustand dafür die Temperatur der Flüssigkeit kennt. In diesem Beitrag möchte ich darauf eingehen, wie unterschiedlich die Beziehung zwischen Mikro- und Makrozustand sein kann.

Hängt der Makrozustand vom Mikrozustand ab?

Der Makrozustand ist informatisch, d.h. bezüglich seines Informationsgehaltes, zwar immer kleiner als der Mikrozustand, doch es stellt sich darüber hinaus die Frage, ob er überhaupt eine eigene Existenz hat. Ist er nicht einfach eine Folge des Mikrozustandes? Wie weit ist der Makrozustand durch den Mikrozustand wirklich determiniert? M.E. gibt es in dieser Hinsicht grosse Unterschiede. Das wird deutlich, wenn wir uns überlegen, wie wir die Zukunft der Systeme vorhersagen können:

Wasserglas

Wenn wir die Bewegungsenergien der vielen einzelnen Moleküle kennen, dann kennen wir auch die Temperatur. Das Wissen über den Mikrozustand erlaubt uns, den Makrozustand zu kennen. Wir wissen in diesem Fall auch, wie er sich weiterentwickelt. Wenn das System geschlossen bleibt, dann bleibt die Temperatur konstant. Der Makrozustand bleibt gleich, während im Mikrozustand jede Menge Informationen umher wuseln. Die Temperatur ändert sich erst, wenn Einflüsse von aussen dazu kommen, insbesondere Energieflüsse. Weshalb bleibt die Temperatur gleich? Der Grund liegt im Energieerhaltungssatz. Die Gesamtenergie des geschlossenen Systems bleibt gleich, somit bleibt auch der Makrozustand gleich, wie auch immer die Variablen im Mikrozustand sich ändern.

Weshalb aber gilt der Energieerhaltungssatz? Es bestehen enge Beziehungen zum Hamilton-Prinzip, dem Prinzip der kleinsten Wirkung. Das Hamilton-Prinzip ist eines der grundlegendsten Regeln in der Natur und gilt keinesfalls nur in der Thermodynamik.

Das geschlossene thermodynamische System ist ein ideales System, das so rein in der Natur kaum vorkommt. Es ist real immer nur eine Annäherung. Diesem abstrakten System möchte ich nun einige in der Natur wirklich vorkommende Systeme gegenüber stellen:

Wasserwellen und Bénard-Zellen

Dieser Typus System lässt sich als Welle auf einer Wasseroberfläche beobachten. In die gleiche Kategorie gehören für mich auch die Bénard-Zellen, über die Prigogine berichtet. In beiden Fällen entstehen die makroskopischen Strukturen als offene Systeme. Wellen und Zellen können nur durch äussere Einwirkungen entstehen, nämlich durch den Temperaturgradienten und die Gravitation bei den Bénard-Zellen und den Wind und die Gravitation bei den Wasserwellen. Die Strukturen entstehen durch das Einwirken dieser äusseren Kräfte, die in ihrem Zusammenspiel die makroskopische Strukturen entstehen lassen, welche interessanterweise über längere Zeit bestehen bleiben. Das Fortbestehen dieser Strukturen erstaunt. Weshalb behält die Welle ihre Form, obwohl immer wieder andere Materieteilchen ihre Grundlage bilden?

Im Unterschied zum isolierten thermischen System sind die in solchen offenen Systemen gebildeten makroskopischen Strukturen wesentlich komplexer. Einander gegenläufige Kräfte von aussen lassen völlig neue Formen – Wellen und Zellen – entstehen. Die äusseren Kräfte sind nötig, damit die Form entstehen und fortdauern kann, aber die entstandene makroskopische Form selber ist neu und nicht bereits in den informatisch (d.h. bezüglich Informationsgehalt) sehr einfachen äusseren Kräften angelegt.

Gleich wie im thermischen System haben wir neben der Makroebene der einfachen äusseren Form (Zelle oder Welle) eine Mikroebene mit den vielen Molekülen, welche z.B. die Form bilden. Und wieder ist die Makroebene, also die Form informatisch wesentlich einfacher als die Mikroebene der vielen Moleküle. Die Welle bleibt in ihrer Form über längere Zeit erhalten, während die vielen Moleküle, die sie bilden, sich wild durcheinander bewegen. Die Welle läuft weiter und erfasst neue Moleküle, welche jetzt die Welle bilden. In jedem Moment erscheint die Form, d.h. das Zusammenkommen des Makrozustandes aus den einzelnen Molekülen vollständig determiniert, aber informatisch viel einfacher erklärbar als durch die vielen Einzelmoleküle ist die Form auf der Makroebene selber, nämlich als einfache Fortsetzung der Welle, einfach mit neuen Molekülen auf der Mikroebene. Es sieht so aus, als wäre der neue Makrozustand am besten erklärbar durch den alten.

Im Gegensatz zu höher entwickelten Formen gilt bei Wasserwellen und Bénard-Zellen: Sobald die Kräfte von aussen nachlassen, verschwindet die Form. Unser Leben ist wie jedes organische aber darauf angewiesen, dass die Formen nicht so schnell verschwinden. Das bedeutet: Der Makrozustand muss gegenüber dem Mikrozustand gestärkt werden.

Der Thermostat

Wir können den Makrozustand stärken, indem wir ihm eine Steuerung beigeben. Denken Sie an eine Heizung mit einem Temperaturfühler. Sobald es kalt wird, wird geheizt, wenn die Temperatur zu hoch wird, hört das Heizen auf. Auf diese Weise wird die Temperatur, d.h. der Makrozustand konstant gehalten. Natürlich ist dieses Heizungssystem thermodynamisch alles andere als geschlossen. Und Temperaturfühler und Steuerung zur Unterstützung und Konstanthaltung des Makrozustandes sind vom Menschen gebaut, entstehen also nicht wie die Wasserwellen auf natürliche Weise. – Oder gibt es so etwas auch in der Natur?

Autopoese und Autopersistenz

Natürlich gibt es solche Steuerungen auch in der Natur. Während meines Medizinstudiums war ich beeindruckt von den vielen und komplexen Steuerungskreisen im menschlichen Organismus. Steuerung hat immer mit Information zu tun. Das Medizinstudium hat mir nahegelegt, Information als wesentlichen Bestandteil der Welt anzusehen.

Man nennt die automatische Entstehung der Welle oder der Bénard-Zelle Autopoese. Welle und Zelle sind aber nicht beständig, die biologischen Organismen jedoch schon, jedenfalls wesentlich beständiger als es die Welle ist. Dies geschieht mit Hilfe von Steuerungen, die Teile des Organismus selber sind. Man muss sich das so vorstellen, als ob eine Welle realisiert, dass sie völlig vom Wind abhängig ist und darauf reagiert, in dem sie die Quelle ihrer Existenz (ihre Nahrung, den Wind) aktiv sucht, bzw. in sich eine Struktur schafft, die seine Energie für die schlechten Zeiten konserviert, wo es nicht weht.

Genau das tut der Körper, jeder biologische Körper. Er ist ein Makrozustand, der sich selber erhalten kann, indem er über Steuerungsvorgänge seinen Mikrozustand kontrolliert und auf die Umwelt reagiert.

Biologische Systeme

Diese Art System unterscheidet sich von isolierten thermischen Systemen durch seine Fähigkeit, Formen entstehen zu lassen und von einfachen, zufällig entstehenden natürlichen Formen wie einer Wasserwelle durch seine Möglichkeit, die Form aktiv überleben zu lassen. Dies ist möglich, da solche biologischen Systeme auf die Umgebung mit dem Ziel reagieren können, ihr Überlebens zu sichern. Von den einfacheren autopoietischen Systemen unterscheidet sich ein biologisches System durch eine länger andauernde Formkonstanz dank komplexen inneren Steuerungen und eine gezielte Aktivität gegenüber der Umgebung.

Damit die Formkonstanz möglich ist, braucht es ein wie immer geartetes Gedächtnis, das das Muster bewahrt. Und um auf die Umgebung gezielt zu reagieren, hilft eine wie immer geartete Vorstellung über diese Aussenwelt. Beides, das Gedächtnis für das eigene Muster und die wie auch immer vereinfachte Vorstellung über die Aussenwelt müssen im biologischen System informatisch fixiert sein, sonst kann die Formkonstanz nicht erhalten werden. Das biologische System hat somit einen wie immer gearteten informatischen Innenraum.

Biologische Systeme sind wegen den oben beschriebenen Eigenschaften immer interpretierende Systeme.


Dies ist ein Beitrag aus der Serie Informationsreduktion.

Informationsreduktion 7: Mikro- und Makrozustand

Beispiele von Informationsreduktion

In den bisherigen Texten haben wir Beispiele von Informationsreduktion in folgenden Gebieten angesehen:

  • Kodierung / Klassifizierung
  • Sinneswahrnehmung
  • Fallpauschalen
  • Meinungsbildung
  • Wärmelehre

Was ist gemeinsam?

Mikro- und Makrozustand

Allen diesen Beispielen ist gemeinsam, dass wir bezüglich Informationen zwei Zustände haben, einen Mikrozustand mit vielen Details und einen Makrozustand mit wesentlich weniger Information. Sehr anschaulich und den meisten noch aus der Schule bekannt, ist das Verhältnis der beiden Ebenen in der Wärmelehre.

Beide Zustände existieren gleichzeitig. Sie betreffen weniger das betrachtete Objekt, als vielmehr die Sichtweise des Betrachters. Will er viel wissen? Oder weniger? Oder gar nur die Essenz, beziehungsweise das, was für ihn die Essenz darstellt? Je nach dem richtet sich sein Blick mehr auf die vielen Details des Mikrozustandes oder die einfache Information des Makrozustandes.

Mikro- und Makrozustand in der Informationstheorie

Die Bedeutung von Mikro- und Makrozustand wurde zuerst in der Wärmelehre erkannt. Meines Erachtens handelt es sich aber um ein ganz allgemeines Phänomen, das eng mit dem Prozess der Informationsreduktion verknüpft ist. Insbesondere bei der Untersuchung von Informationsverarbeitung in komplexen Situationen ist es hilfreich, die beiden Zustände zu unterscheiden.
Überall dort, wo die Informationsmenge reduziert wird, kann ein Mikro- und ein Makrozustand unterschieden werden. Dabei ist der Mikrozustand derjenige, der mehr Information enthält, beim Makrozustand ist die Informationsmenge reduziert.

Der detailreichere Mikrozustand gilt als «realer»

Je mehr Details wir sehen, umso besser glauben wir eine Sache zu erkennen. Deshalb sehen wir den detailreichen Mikrozustand als die eigentliche Realität an. Der Makrozustand ist dann entweder eine Interpretation oder eine Konsequenz des Mikrozustandes.

… aber der informationsarme Makrozustand interessiert mehr

Bemerkenswerterweise sind wir am informationsarmen Zustand aber mehr interessiert als am Mikrozustand. Die vielen Details des Mikrozustandes sind uns zu viele. Entweder sind sie uninteressant (Wärmelehre, Sinneswahrnehmung) oder sie verhindern die gewünschte klare Sicht auf das Ziel, für das der Makrozustandes steht (Kodierung, Klassifizierung, Meinungsbildung, Fallpauschalen).

Seltsamer Antagonismus

Es besteht somit ein seltsamer Antagonismus zwischen den beiden Zuständen: Während wir den einen als realer ansehen, sehen wir den anderen als für uns relevanter an. So als stünden real und relevant im Gegensatz zueinander. Je realer, d.h. detailreicher die Sichtweise wird, umso irrelevanter erscheint die einzelne Information, und je intensiver die Sichtweise sich um Relevanz bemüht, umso mehr löst sie sich von der Realität. Dieses paradoxe Verhältnis von Mikro- zu Makrozustand ist charakteristisch für alle Verhältnisse von Informationsreduktion und zeigt die Bedeutung aber auch die Herausforderung, die solche Prozesse an sich haben.

Gibt es Unterschiede zwischen den informationsreduzierenden Prozessen?

Auf jeden Fall. Gemeinsam ist ihnen nur, dass eine Darstellung auf einer detailreichen Mikro- und informationsarmen Makroebene möglich ist und die Makroebene meist relevanter ist.

Solche Prozesse beinhalten immer eine Informationsreduktion, aber die Art, wie reduziert wird, unterscheidet sich. Es ist nun äusserst erhellend, die Unterschiede genauer zu untersuchen. Die Unterschiede spielen nämlich entscheidend in viele Belange hinein. Mehr dazu im Fortsetzungsbeitrag.


Dies ist ein Beitrag zu einer Serie über Informationsreduktion. Der vorhergehende Beitrag beschäftigte sich mit Informationsreduktion in der Wärmelehre.


 

Informationsreduktion 6: Das Wasserglas, revisited

Ist das Physik?

In meinem Beitrag Informationsreduktion 5: Das klassische Wasserglas habe ich als Beispiel für die Informationsreduktion das Wasserglas erwähnt. Dort reduziert sich die komplexe und detailreiche Information über die Bewegungsenergie der Wassermoleküle (Mikroebene) zur simplen Information über die Temperatur des Wassers.

Ein Physiker könnte dieses Beispiel natürlich kritisieren. Zu Recht, denn das Wasserglas ist viel komplizierter. Die Berechnungen von Boltzmann gelten nur für das ideale Gas, also für ein Gas, dessen Moleküle keine Interaktionen untereinander haben, ausser den Stössen, die sie untereinander erfahren und dabei ihre individuellen Bewegungsinformationen untereinander austauschen.

Ein ideales Gas

Ein solches Gas existiert auf der Erde nicht, es handelt sich um eine Idealisierung. Zwischen den einzelnen Molekülen existieren nämlich noch ganz andere Kräfte als die rein mechanischen. Im Wasserglas sowieso. Denn Wasser ist kein Gas, sondern eine Flüssigkeit, und weil zwischen Molekülen in Flüssigkeiten viel stärkere Bindungen existieren als zwischen Gasmolekülen, komplizieren diese zusätzlichen Bindungen das Bild.

Wasser

Beim Wasser ist es darüber hinaus nochmals besonders. Denn das Wassermolekül (H2O) ist ein starker Dipol, d.h. dass es einen starken elektrischen Ladungsunterschied zwischen seinen beiden Polen aufweist, dem negativ geladenen Pol mit dem Sauerstoffatom (O) und dem positiv geladenen Pol mit den beiden Wasserstoffatomen (H2). Diese starke Polarität führt dazu, dass sich mehrere Wassermoleküle aneinander lagern. Wenn solche Zusammenballungen auf Dauer bestehen würden, wäre das Wasser keine Flüssigkeit, sondern ein fester Stoff (wie Eis). Da die Zusammenballungen aber nur temporär sind, ist das Wasser eine Flüssigkeit, allerdings eine besondere, die sich ganz speziell verhält. Siehe dazu z.B. die aktuelle Forschung von Gerald Pollack.

Physik und Informationswissenschaft

Ein Physiker hätte das Wasserglas also wohl kaum als Beispiel gewählt. Ich möchte es allerdings nicht ändern. Um das Verhältnis zwischen der Information auf dem Mikro- und dem Makrozustand zu erklären, eignet sich das Wasserglas genauso gut. Boltzmanns Berechnungen stimmen zwar nur noch ungefähr, aber seine These bleibt: Die Temperatur eines Gegenstands ist auf der Makroebene die Information, die die vielen Informationen über die chaotischen Bewegungen der einzelnen Moleküle der Mikroebene quasi zusammenfasst.

Für einen Physiker ist das Wasserglas ein schlechtes Beispiel. Für einen Informationsphilosophen macht es aber keinen Unterschied. Ob ideales Gas oder Wasserglas, immer besteht ein Informationsgefälle zwischen dem Makrozustand und dem Mikrozustand. Darauf kommt es an. Im Wasserglas enthält der Mikrozustand Milliarden mal mehr Informationen als der Makrozustand. Und obwohl der Mikrozustand informationsmächtiger ist, interessiert uns der Makrozustand interessanterweise mehr.

Wie verläuft der Übergang?

Wie verläuft nun der Übergang vom Mikro- zum Makrozustand in den verschiedenen Fällen?  Offensichtlich verläuft er im Wasserglas wegen den speziellen Eigenschaften des H2O – Moleküls etwas anders als beim idealen Gas. Und in unseren weiteren, völlig unphysikalischen Beispielen Klassifizierung, Begriffsbildung und Framing verläuft dieser Übergang vom Mikro- zum Makrozustand nochmals völlig anders, und auf diese Besonderheiten sollten wir jetzt eingehen. Siehe dazu den Fortsetzungsbeitrag.


Zum Thema Informationsreduktion finden Sie hier die Übersichtsseite.


 

Informationsreduktion 5: Das klassische Wasserglas

Informationsreduktion in der Wärmelehre

In der Wärmelehre findet sich ein ganz besonderes Beispiel für die Informationsreduktion. Das Beispiel ist deshalb besonders, weil es so einfach ist. Es zeigt das Grundgerüst der Informationsreduktion in aller Deutlichkeit, ohne die Komplexität anderer Beispiele, z.B. solchen aus der Biologie. Es ist vielen von uns auch aus dem Physikunterricht bereits bestens bekannt.

Was ist Temperatur?

Ein Wasserglas enthält viele Wassermoleküle, die sich mit unterschiedlichen Geschwindigkeiten in unterschiedlichen Richtungen bewegen, dabei immer wieder mit anderen Wassermolekülen zusammenstossen und bei jedem Stoss Geschwindigkeit und Bewegungsrichtung ändern. Mit anderen Worten: Das Wasserglas ist der typische Fall eines realen Objektes, das eine von aussen unüberblickbare Informationsmenge enthält.

Das ist die Darstellungsweise mit den Wassermolekülen. Was ist nun die Temperatur der Flüssigkeit im Wasserglas?

Wie Ludwig Boltzmann erkannte, ist die Temperatur nichts anderes als die Folge der Bewegungen der vielen einzelnen Einzelmoleküle in einem Gasbehälter oder einem Wasserglas. Je schneller sie sich bewegen, umso mehr Energie haben sie und umso höher wird die Temperatur.

Wie er zeigte, lässt sich die Temperatur statistisch eindeutig aus den Bewegungsenergien der vielen Moleküle berechnen. Milliarden von Molekülen mit ihren dauernden Bewegungsänderungen ergeben genau eine Temperatur. Aus vielen Informationen wird eine.

Die Mikroebene und die Makroebene

Bemerkenswerterweise kann auf der Ebene der einzelnen Moleküle nicht von Temperatur gesprochen werden. Dort findet sich nur die Bewegung der vielen einzelnen Moleküle, die sich bei jedem Stoss ändert, abrupt und z.T. massiv. Die Bewegungsenergie der Moleküle ist abhängig von ihrer Geschwindigkeit und ändert sich entsprechend bei jedem Stoss mit.

Obwohl sich auf der Mikroebene der Wassermoleküle die Bewegungen dauernd ändern, bleibt auf der Makroebene des Wasserglases die Temperatur vergleichsweise konstant. Und für den Fall, dass sich die Temperatur ändert, weil z.B. Wärme vom Wasser an die Wände des Glases abgegeben wird, gibt es Formeln, die die Bewegung der Wärme und somit die Temperaturänderung berechnen lassen. Diese Formeln bleiben auf der Makroebene, d.h. sie kommen ganz ohne den Einbezug der vielen und komplizierten Stösse und Bewegungen der Wassermoleküle aus.

Man kann den Temperaturverlauf somit vollständig auf der Makroebene beschreiben und berechnen, ohne die Details der Mikroebene mit den vielen Wassermolekülen kennen zu müssen. Obwohl die Temperatur (Makroebene) vollständig und ausschliesslich durch die Bewegung der Moleküle (Mikroebene) definiert wird, ist die Kenntnis der Detailinformationen für ihre Voraussage (Temperaturverlauf auf der Makroebene) gar nicht nötig. Die Details der Mikroebene scheinen auf der Makroebene zu verschwinden. Wir haben einen typischen Fall von Informationsreduktion.


Im Fortsetzungsbetrag wird das Bild vom Wasserglas präzisiert. Anschliessend schauen wir das Verhältnis von Mikro- und Makrozustand genauer an.


Zum Thema Informationsreduktion finden Sie hier die Übersichtsseite.


 

Informationsreduktion 4: Framing

Framing macht den Unterschied

Aktuell wird der Framing-Effekt häufig erwähnt. Es geht bei dem Effekt darum, dass die gleiche Botschaft ganz unterschiedlich wahrgenommen wird, je nachdem, welche Zusatzinformationen mit der Botschaft mitgesendet werden. Diese zusätzlichen Informationen dienen dazu, der Botschaft den passenden Rahmen (Frame) zu geben, sodass die Empfänger der Botschaft entsprechend reagieren.

Auch wenn die eigentliche Botschaft neutral gesehen die gleiche wäre und die Zusatzinformationen der Wahrheit entsprechen, kann der Empfänger mit Framing gehörig manipuliert werden – nur schon durch die Auswahl der (an sich korrekten) Details. Framing wird selbstverständlich in der Werbung verwendet, ganz besonders aktuell und heikel ist aber das Verwenden von Framing in der politischen Berichterstattung.

Natürlich gehört zum Framing in Politik und Werbung immer die Wortwahl, die einen Fact mit den entsprechenden emotionalen Inhalten verbindet. Doch schon die simple Tatsache, welche Aspekte (Details) des Geschehens in den Vordergrund gerückt werden und welche in den Hintergrund, verändert das Bild, das sich der Empfänger von der Botschaft macht. Bei der Rezeption der Tatsache, dass viele Flüchtlinge/Migranten nach Europa wollen, kommt es zum Beispiel darauf an, welche der vielen Menschen man im Blick hat und auf welche der vielen Aspekte, Gründe, Umstände und Folgen ihrer Reise man das Hauptgewicht legt. Berichte über kriminelle Aktivitäten einzelner Migranten lassen in uns ein ganz anderes Bild entstehen als Schilderungen der unmenschlichen, unfassbar schrecklichen Bedingungen der Reise. Die Tatsache, dass Menschen kommen, ist ein Fact. Wie man aber den Fact bewertet, d.h. seine Interpretation, ist eine Sache der Vereinfachung, d.h. der Fact-Auswahl. Damit sind wir ganz klar beim Phänomen der Informationsreduktion angekommen.

Framing und Informationsreduktion

Die Realität enthält immer viel mehr Detailinformationen als wir verarbeiten können. Und weil wir deshalb immer eine Vereinfachung durchführen müssen, spielt die Auswahl der Information eine entscheidende Rolle: Was wird in den Vordergrund gerückt wird und was in den Hintergrund? Je nachdem verändert sich unsere Wahrnehmung und in der Folge auch unser Urteil. Dieses Phänomen der Informationsreduktion ist das gleiche wie bei der medizinischen Kodierung, wo auch die unterschiedlichsten Merkmale zur Kodezuweisung verwendet werden – oder eben nicht –  (siehe Beitrag Zwei Arten von Codierung-1). Die Reduktion und Selektion der Information findet ganz prinzipiell bei allen Wahrnehmungsprozessen statt. Wir müssen (um zu urteilen und zu handeln) stets vereinfachen. Die Selektion der Details macht unsere Wahrnehmung aus, und die Selektion ist nicht vom betrachteten Objekt abhängig, sondern vom Subjekt, das die Auswahl durchführt.

Verschiedene Interpretationen sind möglich (siehe früheren Beitrag)

Die Realität (oben im Diagramm) enthält alle Fakten, unsere Interpretation der Realität ist aber immer eine Auswahl aus den vielen Details der Fakten, und wir können dadurch zu unterschiedlichen Ansichten gelangen. Ich glaube, dass dieses Phänomen der Informationsreduktion (das Interpretationsphänomen) etwas Grundlegendes und Unausweichliches ist, und dass es an den unterschiedlichsten Orten eine wichtige Rolle spielt. Der Framing-Effekt ist nur eines, aber ein typisches Beispiel dafür.


Links zum Framing:
Spiegelbeitrag «Ab jetzt wird zurückgeframt» vom 22.2.2019
Wikipedia zum Framing-Effekt
Interview mit Kommunikationstrainer Benedikt Held


Die Phänomene Informationsreduktion und Selektion hängen eng zusammen. Damit beschäftigt sich der Vorbeitrag dieser Serie.

In der Fortsetzung dieser Serie geht es um Informationsreduktion in der Physik.


Zum Thema Informationsreduktion finden Sie hier die Übersichtsseite.


 

IF-THEN / statisch oder dynamisch?

Zwei Typen von IF-THEN

Viele glauben, dass das IF-THEN in der Logik eine klare Sache sei. Meiner Ansicht nach wird dabei aber oft übersehen, dass es vom IF-THEN zwei verschiedene Typen gibt. Der Unterschied zwischen den beiden besteht darin, ob das IF-THEN eine interne zeitliche Komponente besitzt oder nicht.

Dynamisches (reales) IF-THEN

Für viele von uns ist das IF-THEN dynamisch, d.h. es besitzt eine spürbare zeitliche Komponente. Bevor wir zum Schluss, d.h. zum THEN gelangen, schauen wir das IF genau an, d.h. die Bedingung, die anschliessend den Schluss erlaubt. Mit anderen Worten: Die Bedingung wird ZUERST angesehen, DANN kommt der Schluss

Das ist nicht nur im menschlichen Denken, sondern auch bei Computerprogrammen so. Computer erlauben die Kontrolle von ausgedehnten und komplexen Bedingungen (IFs). Diese müssen durch den Prozessor des Rechners im Memory abgelesen werden. Vielleicht müssen noch kleinere Berechnungen durchgeführt werden, die in den IF-Statements enthalten sind, und die Resultate der Berechnungen müssen dann mit den verlangten IF-Bedingungen verglichen werden. Natürlich brauchen die Abfragen Zeit. Auch wenn der Computer sehr schnell ist, und die Zeit, die für die Kontrolle des IFs benötigt wird, minimal ist, ist sie trotzdem messbar. Erst NACH der Kontrolle, kann der in der Computersprache formulierte Schluss, das THEN, ausgeführt werden.

Im menschlichen Denken, wie auch bei der Ausführung eines Computerprogramms, sind also das IF und das THEN zeitlich eindeutig getrennt. Das wird Sie nicht erstaunen, denn beides, der Ablauf des Computerprogramms wie das menschliche Denken sind reale Vorgänge, sie laufen in der realen, physischen Welt ab, und in dieser benötigen alle Prozesse Zeit.

Statisches (ideales) IF-THEN

Etwas mehr erstaunen wird Sie vielleicht, dass in der klassischen mathematischen Logik, das IF-THEN keine Zeit braucht. Das IF und das THEN bestehen simultan. Wenn das IF wahr ist, ist automatisch und sofort das THEN wahr. Eigentlich ist es sogar falsch, von vorher und nachher zu sprechen, da Aussagen in der klassischen mathematischen Logik immer ausserhalb der Zeit stehen. Wenn eine Aussage wahr ist, ist sie immer wahr, wenn sie falsch ist, ist sie immer falsch (=Monotonie, siehe vorhergehende Beiträge).

Das mathematische IF-THEN wird oft mit Venn-Diagrammen (Mengen-Diagrammen) erläutert. In diesen Visualisierungen ist das IF z.B. durch eine Menge repräsentiert, die eine Teilmenge der Menge des THEN ist. Es handelt sich für die Mathematiker beim IF-THEN um eine Relation, die vollständig aus der Mengenlehre abgeleitet werden kann. Dabei geht es um (unveränderbare) Zustände von Wahr oder Falsch, und nicht um Prozesse, wie beim Denken in einem menschlichen Hirn oder beim Ablauf eines Computerprogramms.

Wir können also unterscheiden
  • Statisches IF-THEN:
    In Idealsituationen, d.h. in der Mathematik und in der klassischen mathematischen Logik.
  • Dynamisches IF-THEN:
    In Realsituation, d.h. in real ablaufenden Computerprogrammen und im menschlichen Hirn.
Dynamische Logik verwendet das dynamische IF-THEN

Wenn wir eine Logik suchen, die der menschlichen Denksituation entspricht, dann dürfen wir uns nicht auf das ideale, d.h. das statische IF-THEN beschränken. Das dynamische IF-THEN entspricht dem normalen Denkvorgang besser. Die dynamische Logik, für die ich plädiere, respektiert die Zeit und braucht das natürliche, d.h. das dynamische, das reale IF-THEN.

Wenn Zeit eine Rolle spielt, und nach dem ersten Schluss die Welt anders aussehen kann als vorher, kommt es darauf an, welcher Schluss zuerst gezogen wird. Man kann nicht beide gleichzeitig ziehen – ausser man lässt zwei gleichzeitig ablaufende Prozesse zu. Die beiden parallel laufenden Prozesse können sich aber gegenseitig beeinflussen, was die Sache natürlich auch nicht einfacher macht. Die dynamische Logik ist aus diesem und vielen anderen Gründen wesentlich komplexer als die statische. Umso nötiger brauchen wir, um die Sache in den Griff zu bekommen, einen klaren Formalismus.

Statisches und dynamisches IF-THEN nebeneinander

Die beiden Arten des IF-THENs widersprechen sich nicht, sondern ergänzen sich und können durchaus koexistieren. So beschreibt das klassische, statische IF-THEN logische Zustände, die in sich geschlossen sind, und das dynamische beschreibt logische Vorgänge, die von einem logischen Zustand zum anderen führen.

Dieses Zusammenspiel von Statik und Dynamik ist vergleichbar mit dem Zusammenspiel von Statik und Dynamik in der Physik, z.B. mit der Statik und Dynamik in der Mechanik oder der Elektrostatik und der Elektrodynamik in der Elektrizitätslehre. Auch dort beschreibt der jeweils statische Teil die Zustände (ohne Zeit) und der dynamische die Änderung der Zustände (mit Zeit).


Dies ist ein Beitrag zur dynamischen Logik. Er wird fortgesetzt mit der Frage, was passiert, wenn zwei dynamische IF-THENs miteinander konkurrieren.

Informationsreduktion 3: Information ist Selektion

Informationsreduktion ist überall

Im vorhergehenden Beitrag habe ich beschrieben, wie bei der Kodierung medizinischer Sachverhalte – einem Vorgang, der von der Realität bis zu den Fallpauschalen (DRGs) führt – eine in der Tat drastische Reduktion der Informationsmenge stattfindet:

Informationsreduktion
Informationsreduktion

Diese Informationsreduktion ist nun keinesfalls auf die Information in der Medizin und ihre Kodierung beschränkt, sondern ist ein ganz allgemeines Phänomen. Immer wenn wir wahrnehmen, führen schon die Sinnesorgane, z.B. die Retina, eine Reduktion der Informationsmenge durch, im Hirn werden die Daten weiter vereinfacht, und im Bewusstsein kommt nur die für uns wichtige Essenz der Eindrücke an.

Informationsreduktion ist nötig

Wenn man die Frage stellt, wollen Sie viel wissen oder wenig, werden die meisten antworten, dass sie möglichst alles wissen möchten. Zum Glück wird ihr Wunsch nicht erfüllt. Bekannt ist das Beispiel des «Savants», der nach einem Flug über eine Stadt jedes einzelne Haus korrekt aus dem Gedächtnis zeichnen konnte. Der gleiche Mensch war aber unfähig, sich im Alltag allein zu bewegen. Die Informationsflut hindert ihn daran. Wir wollen keinesfalls alle Details wissen.

Informationsreduktion bedeutet Selektion

Wenn wir gezwungener- und vernünftigerweise Daten verlieren, dann stellt sich sofort die Frage, welche wir verlieren und welche wir behalten. Manche Leute stellen sich vor, dass die Auswahl naturgegeben sei, und dass im betrachteten Objekt begründet liegt, welche Daten wichtig sind und welche nicht. Diese Annahme ist m. E. schlicht falsch. Es ist der Betrachter, der entscheidet, welche Informationen für ihn wichtig sind und welche er vernachlässigen kann. Es hängt von seinen Zielen ab, welche Informationen er behalten will.

Natürlich kann der Betrachter aus dem Objekt nicht Informationen herausholen, die nicht drin stecken. Doch welche Informationen für ihn wichtig sind, entscheidet er selber – oder das System, dem er sich verpflichtet fühlt.

Ganz sicher ist das in der Medizin so. Wichtig sind diejenigen Informationen über den Patienten, die dem Arzt erlauben, eine sinnvolle Diagnose zu stellen – und das System der Diagnosen hängt wesentlich davon ab, was und wie therapiert werden kann. Der medizinische Fortschritt führt dann dazu, dass immer wieder andere Aspekte und Daten eine Rolle spielen.

Mit anderen Worten: Wir können nicht alles wissen, und wir müssen die Menge der erhältlichen Informationen aktiv verkleinern, um zu urteilen und zu handeln. Die Informationsreduktion ist unumgänglich und sie bedeutet immer eine Selektion.

Unterschiedliche Selektionen sind möglich

Welche Information geht verloren, welche bleibt erhalten? Die Antwort auf diese Frage entscheidet, wie unser Bild des betrachteten Objektes aussieht.

Interpretation der Realität
Verschiedene Informations-Selektionen (Interpretationen) sind möglich

Weil der Betrachter – bzw. das ihn prägende System – entscheidet, welche Information behalten wird, sind verschiedene Selektionen möglich. Je nachdem, welche Merkmale wir in den Vordergrund stellen, werden unterschiedliche Individualfälle in die gleiche Gruppe oder Schublade gezählt und unterschiedliche Betrachter gelangen so zu unterschiedlichen Interpretationen derselben Realität.


Diese Serie wird fortgesetzt mit einem ein konkreten Beispiel von Selektion, dem Framing.


Zum Thema Informationsreduktion finden Sie hier die Übersichtsseite.


 

Informationsreduktion 2: Der drastische Trichter

Der Trichter der Informationsreduktion

Im vorhergehenden Beitrag Informationsreduktion 1 habe ich eine Kette der Informationsverarbeitung vom Patienten bis zur Fallpauschale (DRG) beschrieben:

Bei dieser Kette handelt es sich um einen Trichter, der die verfügbare Informationsmenge bei jedem Schritt reduziert. Das Ausmass der Reduktion ist drastisch. Stellen Sie sich vor, sie haben den Patienten vor sich. Um ihn zu beschreiben, können Sie z.B. die roten Blutkörperchen zählen. Es gibt 24–30 Billionen (= 24–30·1012 ) davon, jedes hat eine bestimmte Form, einen Ort im Körper, eine Bewegung zu einem bestimmten Zeitpunkt und eine bestimmte Menge an rotem Blutfarbstoff im Innern. Das ist in der Tat eine Menge Information. Natürlich wollen sie diese Details gar nicht alle wissen. In der Regel genügt es zu wissen, ob sich im Blutkreislauf genug roter Blutfarbstoff (Hämoglobin) findet. Nur wenn das nicht der Fall ist (bei Anämie), wollen wir mehr wissen. So reduzieren wir die Information über den Patienten und wählen nur das Nötige aus. Das ist sehr vernünftig – obwohl wir dabei Information verlieren.

Der Trichter, quantifiziert

Um das Ausmass der Informationsreduktion zu quantifizieren, habe ich in der oben stehenden Abbildung rechts bei jeder Stufe der Informationsverarbeitung die Anzahl der möglichen Zustände aufgeführt. Von unten her sind dies:

  • DRGs (Fallpauschalen): Es gibt unterschiedliche DRG-Systeme. Stets sind es aber ca. 1000 verschiedene Pauschalen, also 103 Zustände. Auf der Stufe Fallpauschale sind also 10verschiedene Zustände möglich. Dies ist die Information, welche auf dieser Stufe erhältlich ist.
  • Codes: Die ICD-10 Klassifikation bietet in der Schweiz ca. 20’000 verschiedene Codes an. Jeder Code entspricht einer Diagnose. Da  ein Krankenhaus-Patient in der Regel mehr als eine Diagnose hat, nehme ich als Näherung zwei Diagnosen an. Die Information kann also zweimal zwischen 20’000 Zuständen auswählen, das ergibt 400’000’000 = 4 x 108.
  • Texte: SNOMED, eine ausgedehnte medizinische Nomenklatur, enthält ca. 500’000 (5 x 105 )verschiedene Wörter. Da in einer Krankengeschichte viele Wörter vorkommen, ist die Informationsmenge hier natürlich sehr viel detailreicher. Meine Schätzung von 1015 ist hier gewiss untertrieben.
  • Wahrnehmung (Perception) und Realität: Ich verzichte auf eine Schätzung. Das oben genannte Beispiel mit den roten Blutkörperchen zeigt, was für riesige Informationsmengen in der Realität vorliegen.

Dieser Text zur Informationsreduktion wird fortgesetzt mit einem Beitrag zur Selektion. Eine solche ist immer dann nötig, wenn die Menge an Detaildaten unübersichtlich wird – also eigentlich immer.


Zum Thema Informationsreduktion finden Sie hier die Übersichtsseite.


 

Informationsreduktion 1: Kodierung

2 Arten von Kodierung

Im einem früheren Beitrag zur Kodierung habe ich zwei Arten von Kodierung beschrieben, die sich grundsätzlich unterscheiden. In der ersten Art wird versucht, die komplette Information der Quelle in die kodierte Form zu übertragen, in der zweiten Art wird bewusst darauf verzichtet. Es ist zweite, also die informationsverlierende Form, die uns besonders interessiert.

Als ich vor 20 Jahren in meinen Präsentationen auf diesen Unterschied hinwies und das Wort «Informationsverlust» prominent in meinen Folien auftauchte, wurde ich von meinen Projektpartnern darauf aufmerksam gemacht, dass das Wort bei den Zuhörern möglicherweise schlecht ankommt. Schliesslich wollen alle gewinnen, niemand will verlieren. Wie kann ich ein Produkt anpreisen, das den Verlust als Qualitätsmerkmal führt?

Nun, manchmal muss man über den Schatten springen und erkennen, dass gerade das, was man um jeden Preis zu vermeiden sucht, einen besonderen Wert hat. Und das ist bei der informationsverlierenden Kodierung mit Sicherheit der Fall.

Medizinische Kodierung

Unsere Firma spezialisierte sich auf die Kodierung von medizinischen Freitext-Diagnosen. Die Ärzte schreiben in die Krankengeschichten ihrer Patienten die Diagnose in Freitext und unser Programm las sie und ordnete ihnen automatisiert einen Kode zu. Dieser Kode (ICD-10) ist ein Standard mit nicht ganz 20’000 verschiedenen Kodes. Das klingt nach viel, die Zahl ist aber klein in Anbetracht der Milliarden von unterscheidbaren Diagnosen und Diagnoseformulierungen in der Medizin (siehe Beitrag). Der einzelne Kode kann natürlich nicht mehr Information enthalten als der Standard an dieser Stelle unterscheidet. In den Volltext-Diagnosen stand meist mehr und unsere Aufgabe war es, automatisiert die relevante Information aus den Freitexten zu ziehen, um den korrekten Kode zuzuweisen, was uns auch ganz gut gelang.

Die Kodierung ist Teil einer grösseren Kette

Doch die Kodierung ist nur ein Schritt. Einerseits geht die Kette der Informationsverarbeitung von den Kodes weiter zu den Fallpauschalen (DRGs), und andererseits sind die zu kodierenden Freitexte in den Krankengeschichte bereits Ergebnisse einer mehrstufigen Kette von früheren Informationsverarbeitungen und -reduktionen. Insgesamt liegt bei einem Krankenhausfall vom untersuchten Patienten bis zur Fallpauschale eine Kette mit folgenden Stufen vor:

  • Patient: Menge der im Patienten enthaltenen Information.
  • Arzt: Menge der Information über den Patienten, die der Arzt erkennt.
  • Krankengeschichte: Menge der Information, die der Arzt dokumentiert.
  • Diagnosen: Menge der Information, die in den Diagnosetexten steckt.
  • Codes: Menge der Information, die in den Diagnosecodes steckt.
  • Fallpauschale: Menge der Information die in der Fallpauschale steckt.

Bei jedem Schritt wird Information reduziert und die Informationsreduktion ist meistens drastisch. Es stellt sich die Frage, wie das funktioniert. Lässt die Reduktion automatisieren? Und wenn ja, wie?


Serie über Informationsreduktion

Mit diesem Beitrag starte ich eine Serie von Texten zum Thema Informationsreduktion, das in meinen Augen ein Schlüsselthema für das Verständnis von Information und unserem Umgang damit ist. Informationsreduktion ist so omnipräsent und alltäglich, dass wir sie leicht übersehen können.

Im nächsten Beitrag stelle ich dar, wie drastisch das Ausmass der Reduzierung sein kann.


Hier geht es zur Übersicht über die Beiträge zur Informationsreduktion.


 

Zwei Arten von Kodierung 2

Die beiden Arten von Kodierung in Mengendarstellungen

Ich möchte an den ersten Beitrag zu Zwei Arten von Codierung anschliessen und den Unterschied zwischen den beiden Arten von Kodierung mit Mengen-Diagrammen verdeutlichen, denn ich denke, dass der Unterschied für das Gebiet der Semantik und für die allgemeine Informationstheorie wichtig genug ist, um allgemein verstanden zu werden.

Informationserhaltende Kodierung

Den informationserhaltenden Typus der Kodierung, kann man mit folgendem Diagramm darstellen:

Mengendiagramm 1:1-Kodierung
Abb 1: Informationserhaltende Kodierung (1:1, alle Kodes erreichbar)

Links sei die ursprüngliche, rechts die kodierte Form. Der rote Punkt könnte links z.B. der Buchstabe A sein, rechts der Morsekode Punkt-Strich. Da es sich um eine 1:1 – Abbildung handelt, findet man von jedem Element rechts sicher wieder zum Ausgangselement links, vom Punkt-Strich des Morsecodes also wieder den Buchstaben A.

Mengendiagramm 1:1-Kodierung, nicht alle Kodes erreicht
Abb. 2: Informationserhaltende Kodierung (1:1, nicht alle Kodes erreichbar)

Eine 1:1 Kodierung ist natürlich auch dann informationserhaltend, wenn nicht alle Kodes benützt werden. Da die unbenutzten bei der Kodierung nie entstehen können, spielen sie gar keine Rolle. Von jedem für einen Kode benützten Element der Abbildungsmenge rechts gibt es genau ein Element der Ausgangsform. Der Kode ist dadurch ohne Informationsverlust reversibel, d.h. dekodierbar und die ursprüngliche Form kann für jeden entstehenden Kode verlustfrei wieder hergestellt werden.

Mengendarstellung: Informationserhaltende Kodierung (1:n)
Abb. 3: Informationserhaltende Kodierung (1:n)

Auch bei einer 1:n – Kodierung kann die ursprüngliche Form verlustfrei rekonstruiert werden. Ein Ursprungselement kann zwar auf verschiedene Weise kodiert werden, doch jeder Kode hat nur ein Ursprungselement. Somit kann der Ausgangswert zweifelsfrei wieder erreicht werden. Auch hier spielt es keine Rolle, ob alle möglichen Kodes (Elemente rechts) gebraucht werden oder nicht, da nicht verwendete mögliche Kodes nie erreicht und somit auch nicht rückübersetzt werden müssen.

Bei allen bisher dargestellten Kodierverhältnissen (1:1 und 1:n) kann die ursprüngliche Information wieder vollständig rekonstruiert werden. Dabei kommt es nicht darauf an, ob 1:1 oder 1:n, und ob alle möglichen Kodes verwendet werden oder manche auch frei bleiben. Wichtig ist nur, dass jeder Kode immer nur von einem Ursprungselement erreicht werden kann – mathematisch gesprochen handelt es sich bei den informationserhaltenden Kodierungen um linkseindeutige Relationen.

Informationsreduzierende Kodierung
Mengendiagramm: Informationsreduzierende Kodierung
Abb. 4: Informationsreduzierende Kodierung (n:1)

Hier gibt es nun in der Ausgangsmenge mehrere Elemente, die auf den gleichen Kode, d.h. auf das gleiche Element in der Menge der entstehenden Kodes zeigen. Dadurch kann die ursprüngliche Form später nicht mehr rekonstruiert werden. Der rote Punkt in der Abbildungsmenge rechts repräsentiert einen Kode für den es drei unterschiedliche Ausgangsformen gibt. Die Information über den Unterschied zwischen den drei Punkten geht dadurch rechts verloren und kann nicht mehr rekonstruiert werden. Mathematiker sprechen von einer Relation, die nicht linkseindeutig ist. Kodierungen von diesem Typ verlieren Information.

Dies Art Kodierung ist zwar weniger «sauber»,  trotzdem ist sie aber genau diejenige, die uns besonders interessiert, da sie in der Realität für viele Vorgänge typisch ist.