Schlagwort-Archive: Exponentielles Wachstum

Künstliche Intelligenz: Daniel Kehlmann und CTRL

Ist künstliche Intelligenz intelligent? Oder kann sie es werden?

Der bekannte Schriftsteller Daniel Kehlmann («Die Vermessung der Welt») hat letztes Jahr mit einem Sprachalgorithmus (CTRL) in Silicon Valley  zusammen den Versuch unternommen, eine Kurzgeschichte zu schreiben. Fasziniert und gleichzeitig kritisch berichtet er über dieses aufschlussreiche Experiment.

CTRL

Das Programm CTRL ist ein typisches corpusbasiertes KI-System, d.h. ein System mit einer grossen Datensammlung – dem Corpus – und einem statistisch funktionierenden Auswertungsalgorithmus. Konkret haben die Betreiber den Corpus von CTRL mit Hunderttausenden von Büchern, Zeitungen und Online-Foren gefüttert, wodurch das System auf ein Gedächtnis aus Abermillionen von Sätzen zurückgreifen kann. Die Auswertung dieses Datenschatzes erfolgt aufgrund der Wahrscheinlichkeit: Wenn statistisch auf Wort A das Wort B das wahrscheinlichste ist, bringt das System nach Wort A auch das Wort B. Dank des immensen Corpus kann sich das System darauf verlassen, dass A nach B für uns durchaus eine wohlklingende Fortsetzung des Textes ist. Die schiere Wahrscheinlichkeit ist ist das Prinzip jeder korpusbasierten KI.

Natürlich ist anzunehmen, dass die Betreiber nicht nur die unmittelbaren Nachbarwörter berücksichtigen, sondern die Tiefenschärfe um das Ausgangswort weitreichender einstellen, also mehr Kontext berücksichtigen, doch stets gilt auch bei der Fortschreibung des gemeinsamen Textes durch Kehlmann und CTRL, dass der Algorithmus den bisher geschriebenen Text mit seinem grossen Corpus vergleicht und dann die Fortsetzung basierend auf der Wahrscheinlichkeit in seinem Korpus vorschlägt. Dadurch wird uns die Fortsetzung stets irgendwie vertraut und möglich vorkommen. – Wird sie aber auch sinnvoll sein? Wir kommen hier an die Grenzen jeder corpusbasierten Intelligenz: Das Wahrscheinlichste ist nicht immer das Beste.

Die Grenzen von CTRL

Daniel Kehlmann beschreibt die gemeinsame kreative Welt, die er zusammen mit dem Programm CTRL erkundet hat, gleichzeitig fasziniert und kritisch. Kritisch vermerkt er u.a. folgende Mängel:

a) Abstürze des Algorithmus
Beim Experiment ist es nicht gelungen, eine Kurzgeschichte über eine bestimmte Länge weiterzuschreiben; offenbar war dann der Algorithmus rechnerisch nicht in der Lage, die Informationen der bisherigen Geschichte kohärent mit dem Corpus zusammenzubringen. Sobald die Geschichte über einige Sätze hinausging, stürzte das Programm regelmässig unrettbar ab – Ende der Gesichte.

Meines Erachtens ist das kein KO-Kriterium, denn Abstürze eines neuen Programms sind stets zu erwarten (ich weiss, wovon ich spreche … ). Zudem erwecken solche Abstürze stets den Eindruck, als könnten sie mit noch besserer Hardware und robusteren Algorithmen überwunden werden.

Doch dies ist m.E. hier nicht der Fall. Ich glaube vielmehr, dass diese Abstürze einen grundsätzlichen Schwachpunkt der corpusbasierten KI offenbaren, der auch mit verbesserter Hardware und besseren Auswertungsalgorithmen nicht angegangen werden kann. Der Mangel liegt vielmehr prinzipiell in der wahrscheinlichkeitsbasierten Anlage dieser corpusbasierten Programme. Je mehr Kontext (Tiefenschärfe) sie berücksichtigen müssen, umso grösser muss ihr Corpus werden. Doch der Bedarf an Daten und Rechenpower wächst, wenn es um die Vergrösserung des Kontexts geht, nicht linear, sondern exponentiell. Selbst wenn der riesige Corpus und die immense Rechenpower von CTRL weiter vergrössert werden würden, stösst ein solches Programm systembedingt immer und rasch an seine Grenzen.

Um Sinn und Bedeutung einzufangen, braucht es grundsätzlich andere Methoden, solche, die Bedeutung nicht indirekt aus statistischen Daten ausmitteln, sondern sie direkt repräsentieren und behandeln. Erst dann können die Programme direkt mit Bedeutung umgehen.

b) Zweitverwertung
CTRL kennt nichts Neues, dafür Abermillionen alter Sätze. Dies birgt die Gefahr des «Garbage In, Garbage Out». Wenn Fehler oder Schwächen in den bisherigen Texten vorhanden sind, können sie auch in den Sätzen von CTRL auftauchen. Diese Gefahr ist zwar an sich klein, denn durch die grosse Menge an Sätzen wird es wahrscheinlicher, dass gleiche korrekte Sätze auftauchen als gleiche falsche, und somit wird CTRL sicher nur grammatikalisch, oder mindestens umgangssprachlich korrekte Sätze liefern. Doch trifft dies auch auf den Inhalt zu?

Wenn mehrere Menschen den gleichen Fehler machen, wird er dadurch zwar nicht korrekt, aber für eine corpusbasierte KI wird er so salonfähig. Rechtsextreme Messanger wird CTRL zwar kaum als bevorzugte Quelle benutzen, doch es geht nicht nur darum, gefährlichen Nonsens zu vermeiden. Vielmehr wollen wir spannende neue Geschichten. Wir wollen im CTRL-Projekt Kreativität und neue Ideen. Geht das mit einer Zweitverwertung?

c) Fehlende innere Logik
Die gewünschte Kreativität kann zwar durch Zufall simuliert werden. Wenn zwei für uns unzusammenhängende Informationen in einen direkten Zusammenhang gesetzt werden, sind wir erst einmal überrascht. Wir horchen auf und hören die Geschichte weiter. Aber macht das Zusammengebrachte auch Sinn? Folgt es einer inneren Logik? – Wenn es rein zufällig ist, tut es das nicht, dann fehlt die innere Logik.

Zufall ist nicht Kreativität. Erst wenn ein logischer Zusammenhang zwischen den Zufällen gefunden wird, entsteht eine funktionierende Geschichte. Diese innere Logik fehlt einem corpusbasierten Programm prinzipiell.

Fazit 

Daniel Kehlmann hat seine Erfahrungen präzis und gut nachvollziehbar beschrieben. Er erlebte das Experiment als faszinierend und war oft positiv von den Inputs von CTRL überrascht. Trotzdem stellt er fest, dass CTRL entscheidende Schwächen hat und verweist insbesondere auf den fehlenden narrativen Plan, welcher eine Geschichte zusammenhält.

Für jeden, der sich mit künstlicher Intelligenz vorurteilsfrei beschäftigt hat, ist die Erfahrung Kehlmanns eine lebhafte Bestätigung der eigenen Erfahrungen. Ich habe mich beruflich intensiv mit Computerlinguistik beschäftigt, d.h. mit der Frage, wie Computer natürliche Sätze intelligent interpretieren können. Dabei wird klar: Verständnis von Texten baut auf einem inneren Bezugssystem auf. Über dieses Bezugssystem verfügt jeder menschliche Schriftsteller – aber das KI-System nicht. Das korpusbasierte KI-System kennt nur die Wahrscheinlichkeiten von Signalen (Wörtern), ohne ihre wirkliche Bedeutung zu erfassen. Das ist das Problem.

Dem KI-System fehlt insbesondere Absicht und Bewusstsein. Die Absicht kann zwar durch die Betreiber von aussen vorgegeben werden – z.B. bestimmte Zellen in einem medizinischen Blutausstrich zu erkennen oder möglichst viel Traffic auf einer Suchmaschine zu erzielen – doch ein wirkliches Bewusstsein eines Programms würde ein Nachdenken über die eigene Absicht beinhalten. Eine corpusbasierte Intelligenz aber denkt überhaupt nicht nach – schon gar nicht über die eigene Absicht – sondern rechnet nur aus, was in seinem Datenpool das Wahrscheinlichste ist.

Das Experiment von Daniel Kehlmann ist deshalb lehrreich, weil es konkret, genau und verständlich Programmierern und Nicht-Programmierern die Grenzen der künstlichen Intelligenz aufzeigt.

Kurzfassung des Fazits

KI ist faszinierend und in vielen Anwendungen ausserordentlich nützlich, aber eines ist künstliche Intelligenz mit Sicherheit nicht: auf kreative Weise wirklich intelligent.

Mehr zu Daniel Kehlmanns und CTRL

Reine und unreine Stimmung

Die zwei auseinanderstrebenden Ideale einer Theorie

Musiktheorie bewegt sich wie jede Theorie zwischen zwei Extremen. Einerseits erlaubt es eine Theorie, ganz verschiedene Beobachtungen zusammenzufassen und auf einfache Art zu erklären – je einfacher umso besser. Andererseits wollen wir die Erklärung aber auch anwenden, und zwar auf möglichst alles, was wir beobachten. Eine Theorie ist also dann gut, wenn sie möglichst einfach ist, andererseits aber auch möglichst alles erklärt.

Diese beiden Extremziele jeder guten Theorie gleichzeitig zu erfüllen ist die Herausforderung.

Typisch ist der Moment, wo bei der Anwendung der Theorie plötzlich eine Beobachtung auftaucht, die mit der Theorie nicht vereinbar ist. Solche Beobachtungen stürzen die Theorie in eine Krise, z.B. als Max Planck unerklärliche Unregelmässigkeiten in der Schwarzkörperstrahlung feststellte und so die Quantentheorie einleitete oder als Kurt Gödel  mit der Beobachtung einer Lücke in der Logik der Mengen (Unvollständigkeitssatz 1931) sowohl die Mengenlehre als auch die klassische Logik in eine schwere Krise stürzte.

Jede Theorie funktioniert solange gut, bis sie an ihre Grenzen kommt. Dann tauchen plötzlich Lücken auf.

Stimmt die reine Stimmung überhaupt?

Nun, die Krise, von der ich hier spreche, ist etwas älter als die von Max Planck und Kurt Gödel ausgelösten. Sie hat auch schon lange eine sehr praktische Lösung gefunden. Es handelte sich um eine Krise in der Musiktheorie, und die gefundene Lösung ist die gleichstufig temperierte Stimmung. Dies ist die Art, wie wir heute Musikinstrumente stimmen, aber es ist keine Selbstverständlichkeit.

Wie kam es dazu? Schon lange war bekannt, dass mathematische Gesetzmässigkeiten hinter den Intervallen stecken, die wir als wohlklingend empfinden. Tonleitern mit diesen durch einfache Brüche definierten Intervallen gelten als rein, auch unser Dur (ionisch) und alle anderen Kirchentonarten sind perfekt rein, sofern die Intervalle entsprechend den einfachen Brüchen gestimmt werden. Dann sind sie «rein».

Das funktioniert aber nur, wenn man in der gleichen Tonalität bleibt, d.h. wenn die Musik nicht den Grundton wechselt, d.h. nicht moduliert. In der Renaissance aber kamen die Komponisten zunehmend in Aufbruchstimmung und begannen zu modulieren, indem sie den Grundton (die Tonalität),  innerhalb des gleichen Musikstücks wechselten. Dabei wurden die Grenzen der reinen (=pythagoräischen) Stimmung evident.

Die Lücke im pythagoreischen Tonsystem

Als ich das erste Mal vom pythagoreischen Komma hörte, war ich sehr überrascht. Unser perfektes Tonsystem sollte eine – wenn auch klitzekleine – Lücke in der mathematisch perfekten Anordnung haben? Das Tonsystem besteht – wie jeder Blick auf eine Klaviertastatur zeigt – aus zwölf Halbtönen. Wenn ich die Halbtöne einen nach dem anderen nach oben gehe, kommt nach sieben Halbtönen die Quint und nach zwölf die Oktave. Wenn ich also zwölf Quinten (=12×7 Halbtöne) hochgehe, bin ich mathematisch gesehen am gleichen Ort, wie wenn ich sieben Oktaven (=7×12) hochgehe, nicht wahr?

Soweit die Mathematik, die mir als Kind sehr eingeleuchtet hat und ich war erstaunt, dass es nicht so sein sollte. In Wirklichkeit kommt man nach zwölf Quinten nämlich zu einem etwas höheren Ton als nach sieben Oktaven. 12×7 ist in diesem Fall nicht 7×12. Dieser Unterschied ist das pythagoreische Komma.

Woher kommt es? Die Ursache liegt – wie so oft – in einem unerwarteten exponentiellen Wachstum. Im Beitrag zum pythagoreischen Komma erkläre ich, wie und weshalb diese Lücke im pythagoreischen Tonsystem entsteht.


Dies ist ein Beitrag zur Drei-Welten-Theorie.

Wie entsteht das pythagoreische Komma?

Das pythagoreische Komma

Das pythagoreische Komma zeigt, dass unser Tonsystem nicht perfekt stimmt, sondern eine Lücke hat, deren Form und Ursache ich in diesem Beitrag beschreibe.   Das Komma ist sowohl für unsere Musikpraxis relevant, auf die es ganz konkrete Auswirkungen hat, als auch erkenntnistheoretisch, da es typisch ist für die Probleme, die wir beim Zusammenspiel unserer drei Welten (nach Penrose) beobachten. Es ist in diesem Sinn nicht nur für Musiker ein relevantes Thema, sondern auch für philosophisch interessierte Menschen, die sich fragen, wie Mathematik (ideale Welt), Physik (physikalische Welt) und unser Erleben (mentale Welt) zusammenhängen.

Als erstes erkläre ich hier, weshalb es zu diesem Komma kommt.


Intervalle addieren

Was geschieht, wenn wir zwei Intervalle, z.B. eine Quint und eine Quart addieren? Wir werden sehen, dass eine solche Addition in den einen Fällen perfekt funktioniert, in anderen aber zu Problemen führt. Hier liegt der Ursprung des Kommas, aber auch der temperierten Stimmung. Weshalb entstehen hier überhaupt Probleme? Darauf möchte ich jetzt eingehen, auf die Ursachen, später aber auch auf die Lösung des Problems.

Addieren heisst für Intervalle Multiplizieren

Können wir Intervalle einfach so addieren? Das Problem dabei ist, dass wir die Intervalle linear empfinden, die Frequenzen aber nicht linear ansteigen, sondern exponentiell.

Abb. 1: Exponentieller Anstieg der Frequenzen

Zwischen dem Ton A (110Hz) und dem Ton a (220 Hz) besteht ein Abstand von 110 Hz. Dieser Abstand entspricht einer Oktave – aber nur dort! Wenn wir nun den Abstand von Ton a zu Ton a' messen, was wieder einer Oktave entspricht, bekommen wir aber nicht 110 Hz sondern 220 Hz. Und von a' zu a" sind es bereits 880 Hz. Die Frequenzen verhalten sich eben nicht linear, sondern exponentiell, wie in Abb. 1 dargestellt.

Hier liegt nun die Ursache des Problems, das europäische Musiker dazu geführt hat, verschiedene temperierte Stimmungen auszutesten, wobei sich letztlich die gleichmässig temperierte Stimmung durchgesetzt hat.

Wenn wir Intervalle addieren, müssen wir also ihre Frequenzverhältnisse multiplizieren, wenn wir sie abzählen, müssen wir sie dividieren. Die Operationen verschieben sich von Addition/Subtraktion zu Multiplikation/Division. Diese Art Verschiebung ist den Mathematikern bestens bekannt. Vor den Taschenrechnern und Computern benutzten Techniker sogenannte Logarithmentabellen und Rechenschieber, die auf genau dieser Verschiebung basieren. Ebenso kommt der Effekt bei der kombinatorischen Explosion zu tragen oder beim Verlauf von Epidemien.


Beispiele für Intervall-Additionen

Was uns bei Intervallbetrachtungen immer interessiert, ist das Zahlenverhältnis der Frequenzen der beiden Töne des Intervalls: also der Bruch zwischen der Frequenz des höheren geteilt durch die Frequenz des tieferen Tons: X = f2/f1. Dieser Bruch bestimmt das Intervall, das wir wahrnehmen.

Oktave und Oktave

Siehe Abb. 1: Wir addieren zwei Oktaven, z.B. A-a und a-a'.

Die erste Oktave (A-a) misst 220/110 = 2
Die zweite Oktave (a-a') misst 440/220 = 2
Die beiden Oktaven zusammen ergeben 2×2 = 4

Die Multiplikation ist hier korrekt, denn a' ist 4 mal so schnell wie A (440Hz / 110Hz). Zwei Oktaven führen also zu einer Vervierfachung der Grundfrequenz.

Quinte und Quarte

Die Quinte entspricht einer Frequenzbeschleunigung auf 3/2
Die Quarte einer Beschleunigung auf 4/3

Quinte und Quarte zusammen ergeben 3/2 * 4/3 = 12/6 = 2

2 entspricht einer Oktave. Somit ergeben eine Quinte und Quarte zusammen rechnerisch genau eine Oktave. Auch hier entspricht die Mathematik unseren Hör-Erwartungen.

Weitere Additionen zu einer Oktave

Kleine Terz plus grosse Sext = 6/5 * 5/3 = 30 /15 = 2
Grosse Terz plus kleine Sext = 5/4 * 8/5 = 40 /20 = 2

Über die Oktave hinaus

Zwei Quinten: 3/2 * 3/2 = 9/4 = 2.25

2.25 ist grösser als 2, wir haben also den Bereich der Oktave verlassen. Wo sind wir gelandet? Bei einer None. Eine None ist eine Oktave plus eine grosse Sekunde. Geht das auf? Wir rechnen:

Oktave plus grosse Sekunde = 2 * 9/8 = 18/8 = 9/4 = 2.25
Ja! Es funktioniert. Wenn wir zwei Intervalle addieren, müssen wir ihre Brüche multiplizieren.


Subtraktion wird Division

Es geht natürlich auch umgekehrt, wir können ein Intervall von einem anderen abziehen. Dann müssen wir dividieren:

Eine Oktave weniger eine Quinte = 2 : 3/2 = 4/3 = eine Quart
Eine Quinte weniger eine Quart = 3/2 : 4/3 = 9/8 = eine grosse Sekunde.


Warum funktionieren diese Rechnungen?

Ich war überrascht, zu sehen, dass trotz der Verschiebung der Rechenoperationen die Rechnungen genau die Resultate liefern, die ein Musiker erwartet. Wie kann das sein? Eine Multiplikation ist doch etwas ganz anderes als eine Addition. Weshalb können wir trotzdem so rechnen?

Der Grund liegt darin, dass unzählige musikalische Menschen über viele Jahrtausende ein Tonsystem entwickelt haben, das genau das erlaubt. Dass die Rechnungen so perfekt aufgehen, ist nämlich keine Selbstverständlichkeit und es ist auch nicht immer so, wie wir gleich sehen werden. In den obigen Beispielen aber gehen sie auf und das rührt nur daher, dass wir die Intervalle klug gewählt haben. Sie sind wie in früheren Beiträgen dargestellt, alles andere als zufällig gewählt, sondern nach den Kriterien für resonante Tonleitern. Und dabei haben wir gesehen, dass Intervalle dann resonant sind, wenn sie Brüche mit ganzzahligen Zählern und Nennern darstellen, und dass es für eine gleichzeitige Resonanz von mehreren Intervallen notwendig ist, dass die beiden Zahlen möglichst klein sind und insbesondere bei der Primzahlzerlegung keine Primzahl grösser als 5 enthalten.

Diese restriktiven Bedingungen erlauben es nämlich, dass wir kürzen können, wenn wir die Intervalle miteinander vergleichen. Hohe Zahlen und insbesondere hohe Primzahlen sind fürs Kürzen ungeeignet. Das Kürzen aber kommt uns, wie wir in den oben stehenden Beispielen gesehen haben, enorm entgegen. Nur wenn wir kürzen erhalten wir aus der Kombination von zwei resonanten Intervallen wieder ein resonantes. Und nur so bleiben wir innerhalb unserer resonanten Tonleiter.

Das ist bei der Tonleiter so, aber auch beim «Addieren» von mehreren Intervallen. Nur leider funktioniert es nicht immer.


Es wäre zu schön …

Der Übergang vom linearen zum exponentiellen Wachstum führt nämlich schneller zu Problemen als wir erwarten. Schon einfachste Rechnungen funktionieren nicht:

Grosse Sekunde plus kleine Sept = 9/8 * 9/5 = 81 / 40 = 2.025
Wir erwarten eigentlich nicht 2.025, sondern 2, d.h. eine reine Oktave,

Grosse Terz minus grosse Sekunde = 5/4 : 9/8 = 40/36 = 10/9 = 1.111
Wir erwarten eigentlich eine grosse Sekunde, also 9/8 = 1.125

Eine Quart und eine Quart = 4/3 * 4/3 = 16/9 = 1.777
Wir erwarten eigentlich eine kleine Sept = 9/5 = 1.800

Sie sehen, unsere Erwartung, dass das Rechnen mit den Intervallen aufgeht, wird enttäuscht. Nur ganz wenige Intervallkombinationen erlauben ein «reines» Rechnen, und das auch nur darum, weil wir unser Tonleitersystem so gut gewählt haben. Alle anderen Intervallekombinationen gehen nicht auf. Meist sind die Abweichungen nicht sehr gross, aber trotzdem sind sie deutlich vorhanden. Das Phänomen, dass die Intervallkombinationen nicht aufgehen, ist unter dem Namen pythagoräisches Komma berühmt geworden.


Das pythagoreische Komma

Pythagoras hat bereits gewusst, dass natürliche, d.h. gut klingende Intervalle auf einfache Brüche mit kleinen Zahlen zurückzuführen sind. Die einfachsten Intervalle mit den kleinsten Zahlen in den Brüchen sind bekanntlich die Oktave (2/1), die Quinte (3/2) und die Quart (4/3).

Wie wir oben gesehen haben geben zwei Quinten zusammen eine None. Wie viele Quinten braucht es nun, bis wir wieder beim Grundton sind? Schauen wir das von C aus an und untersuchen wir, wie viele Quinten es braucht, bis wir wieder bei einem C sind:

C – G:  erste Quinte
G – D:  zweite Quinte

Die ganze Reihe ist folgende:
C – G –  D – A – E – H – F# – C# – Ab – Eb – B – F – C

Wir haben somit zwölf Quinten. Das tiefe und das hohe C sind sieben Oktaven voneinander entfernt. Somit ist das obere C über die Quinten gerechnet = 3/212 = 129.746 und über die Oktaven gerechnet = 27 = 128. Die Abweichung zwischen den beiden Berechnungen beträgt: 129.746 : 128 =  1.0136.

Diese kleine Abweichung ist das pythagoreische Komma.

Einordnung des Kommas in den grösseren Zusammenhang

Das pythagoreische Komma ist unausweichlich und rührt letztlich daher, dass wir hier mathematisch unter zwei verschiedenen Flaggen segeln, nämlich derjenigen, die addiert und derjenigen, die multipliziert. Unser Denken, das sich vor allem materiell-räumlich orientiert, ist das lineare Rechnen gewohnt, mit dem Längen gemessen werden. So sehen wir auch die Intervalle. Diese aber funktionieren über die Frequenzen und ihre gegenseitigen Verhältnisse, und diese sind eben nicht linear, sondern exponentiell.

Das ist übrigens nicht der einzige Ort, an dem uns unsere Gewohnheit, linear zu denken, zur Falle wird. Viele Prozesse verlaufen exponentiell, genannt seien hier die kombinatorische Explosion, sobald ein Kollektiv von mehreren Objekten angeschaut wird oder der Verlauf von Epidemien, Gesellschaftstrends etc. Sobald das Geschehen komplex wird, dürfen uns exponentielle Verhältnisse nicht überraschen.

Dies führt uns zum Grundthema dieser Serie zurück, nämlich zum Verhältnis der drei Welten. Was ist die Rolle der Mathematik für die Physik und unseren Geist? Ich lasse diese Frage hier offen und bleibe vorerst auf dem Gebiet der Musik.  Im nächsten Beitrag werde ich erläutern, welche Vorteile unsere Lösung des Komma-Problems, nämlich die gleichmässig temperierte Stimmung bietet.


Fazit

  1. Intervalle werden verrechnet, indem man die Brüche ihrer Frequenzen multipliziert und dividiert.
  2. Dies widerspricht unserer intuitiven Vorstellung, dass dabei addiert und subtrahiert wird.
  3. Aus diesem Grund führen die meisten «Additionen» und «Subtraktionen» von zwei Intervallen nicht zu den erwarteten reinen Intervallen.
  4. Nur ganz wenige Additionen/Subtraktionen von Intervallen führen wieder zu reinen Intervallen. Dies ist nur dann möglich, wenn die Brüche der beteiligten Intervalle ein Kürzen ermöglichen.
  5. Dabei gelten die gleichen Regeln wie für die Bestimmung resonanter Tonleitertöne: Zähler und Nenner müssen kleine Zahlen sein, insbesondere höhere Primzahlen stören Resonanz und Verrechenbarkeit.
  6. Das pythagoreische Komma ist Ausdruck dieser grundlegenden mathematischen Inkompatibilität von Linearität (Addition) und Exponentialität (Multiplikation).
  7. Das pythagoreische Komma setzt somit der reinen Stimmung eine natürliche Schranke.

Wir werden bald sehen, wie das Problems der pythagoräischen Kommas mit der temperierten Stimmung gelöst wird. Doch vorher schauen wir die Anordnung der Töne innerhalb der Oktave in der reinen Stimmung an.


Dies ist ein Text aus der Serie zur Drei-Welten-Theorie.

Kombinatorische Explosion

Objekte und Relationen

Als erstes schauen wir eine Menge von Objekten an und überlegen uns, wie viele Verbindungen (Relationen) es zwischen ihnen gibt. Dabei legen wir unser Augenmerk nicht auf die Art der Beziehung zwischen den Objekten, sondern beschränken uns darauf, die Relationen zu zählen. Das ist ganz einfach ist, denn im Prinzip besteht zwischen jeweils zwei Objekten immer genau eine Relation. Auch wenn die zwei Objekte nichts miteinander zu tun haben, ist das eine Information, die etwas aussagt, und somit eine gültige, d.h. aussagekräftige Relation. Wir zählen also die Zahl der möglichen Verbindungen zwischen den Objekten zusammen und vergleichen die Zahl der Objekte mit der Zahl der Relationen.

7 Objekte und ihre Relationen
Abb 1: Sieben Objekte und ihre Relationen

In Abb 1 sehen wir sieben Objekte (blau) und ihre Relationen (rot). Jedes Objekt ist mit jedem anderen Objekt verbunden, in unserem Beispiel also jedes der 7 Objekte mit 7-1 = 6 weiteren Objekten. Insgesamt erhalten wir so 7 *6 / 2 = 21 Relationen. Die allgemeine mathematische Formel dafür ist oder NR = (NO2 – NO) / 2. Dabei ist NR die Zahl der Relationen und NO die Zahl der Objekte.
Die Zahl der Relationen nimmt, wie wir aus der Formel ersehen können, im Quadrat zur Zahl der Objekte zu. Nicht-mathematisch ausgedrückt:

Es gibt immer viel mehr Relationen als Objekte, und zwar sehr viel mehr!

Hier eine kleine Tabelle mit den Zahlen für Objekte und Relationen:

NO  NR
———————-
1    0
2    1
3    3
4    6
5    10
6    15
7    21
8    28
9    36
10     45
100   4950
1000    499’500

Tab 1: Objekte und Relationen

Bei kleinen Zahlen fällt die quadratische Steigerung nicht so auf, bei nur leicht grösseren fällt sie aber schon deutlich ins Gewicht. Wir können uns jetzt schon überlegen, was diese Zunahme in der Praxis bedeutet, schauen uns aber vorher noch die Zahl der möglichen Kombinationen an.

Objekte und Kombinationen

Bei Kombinationen geht es darum, wie mehrere Objekte miteinander kombiniert werden können. Während bei den Relationen eine Relation immer genau zwei Objekte verbindet, können Kombinationen beliebig viele Objekte enthalten, also jede Anzahl Objekte von 1 bis alle (= NO).

Tab 2: Objekte und Kombinationen
Tab 2: Objekte und Kombinationen

Tabelle 2 zeigt Mengen mit 1 bis 4 Objekten. Die Anzahl der Objekte ist in der ersten Spalte, diejenige der Kombinationen in der zweiten aufgeführt. Die Objekte sind mit Buchstaben (a, b, c ,d) bezeichnet. In der Spalte ganz rechts sind die jeweils möglichen Kombinationen aufgezählt. Bei nur einem Objekt (a) gibt es gerade einmal eine Kombination, die aus genau diesem Element besteht, bei 2 Objekten gibt es 3 Kombinationen und bei 4 Elementen sind es bereits 15. Die Zahl der Kombinationen pro Objekt nimmt also noch stärker zu als vorher die Zahl der Relationen. Die Formel dafür ist: NC = 2No – 1.

Bei den Relationen wird NO quadriert, während es bei den Kombinationen im Exponenten vorkommt. Dies bewirkt eine noch grössere, nämlich eine exponentielle Steigerung. Die Zahl der möglichen Kombinationen steigt dabei exponentiell zur Zahl der vorhandenen Objekte. Bei 10 Objekten gibt es bereits 1023 Kombinationen, bei 100 Objekten sind es in der Tat 1’267’650’600’228’229’401’496’703’205’375 Kombinationen.

Die Zahl der Kombinationen steigt somit sehr schnell extrem stark an.

Diese exponentielle Zunahme ist die Basis der kombinatorischen Explosion.

Kombinatorische Explosion

Nehmen wir an wir haben verschiedene Objekte mit verschiedenen Eigenschaften, z.B.:

4 Formen: rund, quadratisch, dreieckig, sternförmig.
8 Farben: rot, orange, gelb, grün, blau, braun, weiss, schwarz.
7 Materialen: Holz, PVC, Aluminium, Karton, Papier, Glas, Stein.
3 Grössen: klein, mittel, gross.

Diese vier Klassen mit ihren insgesamt 22 Eigenschaften können wir nun beliebig kombinieren, ein Objekt kann also z.B. dreieckig, grün, mittelgross und aus PVC sein. Wie viele verschiedenartige Objekte können wir mit den 22 Eigenschaften nun insgesamt unterscheiden?

Die Antwort ist, dass aus jeder der vier Klassen (Form, Farbe, Material, Grösse) je eine Eigenschaft unabhängig gewählt werden kann. Das ergibt insgesamt 4x8x7x3 = 672 Möglichkeiten der Kombination. Mit 22 Eigenschaften können also 672 verschiedene Objekte beschrieben werden. Für jede weitere Klasse multipliziert sich die Zahl der Möglichkeiten.

Schon nach wenigen zusätzlichen Klassen explodiert die Zahl der möglichen Kombinationen regelrecht.

Das ist die kombinatorische Explosion. Sie spielt in ganz vielen Situationen eine entscheidende Rolle.


Nachtrag vom 23.3.2020

Beispiele für exponentielles Wachstum:
– Epidemien
– Zins und Zinseszins
– Gewisse Treibhausgase
– Kettenreaktionen, z.B. in nuklearen Explosionen
– «Going viral» im Internet
– «Going viral» von Unternehmen
– Popularitätskurven von Showstars und Politikern

Grenzen des Wachstums:
Da in der Realität kein unbegrenztes Wachstum möglich ist, stösst ein exponentielles Wachstum immer an Grenzen, weil entweder die Ressourcen für weiteres Wachstum erschöpft sind, oder kein Raum für weitere Ausbreitung mehr vorhanden ist.  Oft bricht dann das Wachstum plötzlich und unerwartet ab.

Lineares und exponentielles Wachstum:
Wir tendieren dazu, Wachstum als linear, d.h. als gleichmässig anzusehen. Wachstum ist aber in vielen Gebieten exponentiell, was wir oft ausblenden. Weshalb ist das so? Wenn wir nur einen kleinen Zeitraum eines exponentiellen Wachstums anschauen, erscheint die Kurve linear, erst bei einer längeren Betrachtungsweise zeigt sich die exponentielle Steigung. Die Steigung kann zu Beginn sogar sehr  klein sein und  quasi vernachlässigbar erscheinen, doch das ist eine Täuschung, wenn das Wachstum exponentiell ist.