Alle Artikel von Hans Rudolf Straub

Wie die künstliche Intelligenz zur Intelligenz kommt

Haben Sie sich schon gefragt, woher die Intelligenz in der künstlichen Intelligenz stammt? Die Künstliche Intelligenz, etwa in Suchmaschinen oder Programmen zur Gesichtserkennung ist ja nichts anderes als ein Computerprogramm, das vorgängig mit Daten gefüttert worden ist. Ein raffiniertes und komplexes Programm zwar, aber letztlich nichts als ein Automat, eine Maschine. Und diese Maschine verhält sich intelligent. Wie kann das sein?

Nun, darauf gibt es durchaus eine Antwort. Ich habe basierend auf meiner Berufspraxis im Bereich des NLP (Natural Language Processings) und der automatisierten Zuweisung von medizinischen Codes (ICD, CHOP, OPS, SNOMED) zu Freitexten eine Serie von Blogbeiträgen auf dieser Website publiziert, die jetzt auf Anregung meines Verlegers W. Fischer als kleines Büchlein erscheinen werden.

Die Beiträge stellen verschiedene Formen von KI vor und erklären kurz ihre prinzipiellen Wirkweisen. Für jede vorgestellte KI-Form wird gezeigt, an welcher Stelle und wie die benötigte Intelligenz zum Programm hinzu kommt. Selbstverständlich unterscheiden sich Taschenrechner, Suchmaschinen, regelbasierte NLP-Systeme und Deep Learning  Systeme (Schach, Go) hier deutlich.

Was aber sind die Konsequenzen dieser Programme und ihres Einsatzes? Was können sie und was bewirken sie? Und was ist der Unterschied zur menschlichen, also zur biologischen Intelligenz?

Das Büchlein wird diesen Sommer im ZIM-Verlag erscheinen.

Die gleichstufige Temperierung

Ausgangswunsch: Wechsel des Grundtons während eines Musikstücks

Im Vorbeitrag haben wir gesehen, dass eine reine Stimmung beim Wechsel des Grundtons nicht mehr rein ist, da sich gewisse Intervalle verändern. Je entfernter die Tonart ist, umso mehr Töne stimmen nicht mehr mit den errechneten, d.h. resonanten Tonhöhen überein..

Wenn nun die die Frequenzen der Tonleitertöne ganz leicht verschoben – d.h. temperiert – werden, dann kann auch in benachbarte Tonarten gewechselt, d.h. moduliert werden. Bei der gleichstufig temperierten Stimmung sind sogar Wechsel zu jedem beliebigen Grundton möglich und diese Stimmung hat sich seit dem Barock in Europa  erfolgreich durchgesetzt.

Wie die gleichstufige Temperierung funktioniert

In Abb. 1 sehen sie die resonanten, d.h. reinen Intervalle zwischen einem Grundton und seiner Oktave.

Abb. 1: Resonante Intervalle über dem Grundton C in logarithmischer Darstellung

In der obenstehenden Abbildung habe ich mit Cis und Fis auch die indirekt resonanten Töne aufgenommen und somit die Lücken im Band der zehn meistresonanten Intervalle geschlossen. In Abbildung 1 fällt auf, dass die zwölf Töne zwar nicht regelmässig, doch annähernd gleichmässig über die Oktave verteilt sind. Könnte man das musikalisch ausnützen?

Abb. 2: Reine (blau) und gleichstufige (rot) Verteilung der 12 Tonleitertöne 

Abbildung 2 zeigt den Vergleich einer natürlichen, d.h. reinen Verteilung der Tonleitertöne mit einer völlig gleichmässigen. Wie Sie sehen, sind die Abstände zwar sichtbar, doch auch nicht allzu gross. Die unregelmässigen, reinen Töne werden leicht verschoben und wir erhalten so eine völlig gleichmässige Verteilung der Töne. Diese leicht verschobene, aber dafür regelmässige Stimmung wird gleichstufig temperierte Stimmung genannt.

Weil die Abstände der zwölf Töne exakt gleich sind, ist es egal, auf welchem Grundton wir die Tonleitern aufbauen:

C-Dur:  C – D – E – F – G – A – H – C

Es-Dur: Es – F – G – As – B – C – D – Es

Die relativen Abstände zwischen den einzelnen Tönen sind – wie Sie leicht überprüfen können – bei den temperierten Frequenzen nun genau gleich, egal ob in C-Dur, Es-Dur oder irgend einer anderen Tonart.

Die gleichstufig temperierte Stimmung ist eine radikale Lösung und als solche der Endpunkt einer historischen Entwicklung über mehrere Zwischenlösungen (Werckmeister-Stimmung u.v.a.). Diese historische Entwicklung und die Details der praktischen Ausführung sind im Internet und in der Literatur ausführlich dokumentier und für Interessierte leicht auffindbar. Was uns hier interessiert sind hingegen zwei ganz andere Fragen:

  1. Weshalb funktioniert die Temperierung, obwohl wir dann für die Resonanzen keine genauen Brüche mehr vorfinden?
  2. Was sind die kompositorischen Konsequenzen?

Mehr dazu in den folgenden Beiträgen


Die ist ein Beitrag zur Entstehung der Tonleitern.


Wie die temperierte Stimmung entstand

Tonleitern vor der Temperierung

Natürliche Tonleitern

Die Tonleitern der menschlichen Kulturen haben sich über die Jahrtausende auf natürliche Weise, d.h. ganz ohne bewusste mathematische Überlegungen entwickelt. Dass trotzdem sehr viel Mathematik dahinter steckt, hat mit den Resonanzen der Tonleitertöne zum Grundton zu tun. Diese Resonanzen sind für uns attraktiv und Musik, die auf solchen Resonanzen beruht, hat die Fähigkeit, menschliche Gemeinschaften zusammen zu bringen.

Mathematisch kann die Resonanz auf Brüche mit möglichst kleinen ganzen Zahlen zurückgeführt werden und wir konnten rechnerisch ableiten, welche neun Intervalle die deutlichsten Resonanzen aufweisen müssen. Nicht zufällig bestehen alle global verbreiteten Tonleitern – d.h. die Standardpentatoniken, unser Dur und unser Moll, die Kirchentonarten und viele mehr – ausschliesslich aus einer Auswahl von fünf, bzw. sieben aus diesen neun Tönen.

Der Grundton und die Spannung

Ebenfalls in allen Kulturen beobachtbar und für uns gar nicht anders vorstellbar ist die Tatsache, dass alle Tonleitern eine klar definierte Basis, d.h. einen Grundton haben, auf den sich die anderen Töne immer beziehen. Dies ist der Grundton, zu dem jeder Tonleiterton seine Resonanz aufbaut, je stärker sie ist, umso ruhiger wirkt der Ton neben dem Grundton, aber auch innerhalb der Melodie. Andererseits, je höher die Zahlen in den Brüchen, d.h. je schlechter die Resonanz zum Grundton ist, umso schärfer und gespannter erscheint uns der Melodieton. Der schärfste Ton in der Dur-Tonleiter ist die grosse Sept (z.B. H in C-Dur), die einen Halbton unter Oktave liegt. Dieser Ton trägt die stärkste Spannung von allen Tönen in der Durtonleiter, er verlangt nach seiner Auflösung auf die Oktave und führt so die Melodie von Spannung zu Entspannung. Diese Spannung ist nur möglich, weil der Grundton hör- oder unhörbar mitschwingt und die Resonanz zu ihm gespannt ist.

Dies alles aber hat noch nichts mit der Temperierung zu tun und funktioniert in reinem Dur.

Weshalb wurden die Tonleitern temperiert?

Zwei Masstäbe: linear und exponentiell

Temperierung bedeutet, dass die Frequenz der Tonleitertöne leicht verändert, vermindert oder erhöht – d.h. temperiert – wird. Dabei werden die Resonanzen auf den ersten Blick leicht abgeschwächt, trotzdem hat sich in der europäischen Musikkultur die Temperierung als selbstverständlich durchgesetzt.

Um die Temperierung zu verstehen, ist es hilfreich zu erkennen, dass wir Intervalle mit zwei verschiedenen Masstäben messen: ein Masstab ist linear, der andere verhält sich exponentiell. Eine genaue Erklärung der Gründe und Konsequenzen der zwei Masstäbe finden sie hier. Vereinfacht gesagt geht es darum, dass alle Intervalle relativ sind. Wenn ich also eine Tonleiter von C aus aufbaue, sind die Tonleitertöne auf dieses C ausgerichtet, wenn ich einen anderen Grundton wähle, z.B. das D, dann ist das E von C ein anderes als das E von D.

Beispiel für diese Relativität der Masstäbe

In C-Dur ist der Ton E eine grosse Terz über dem Grundton C, die Frequenz des E beträgt 5/4 des Grundtons C. Ein Ton D ist eine grosse Sekunde über dem C und hat somit 9/8 der Frequenz des C. Wenn wir nun dieses D (=9/8) zum Grundton wählen, dann kommt in D-Dur ebenfalls E vor, aber diesmal als grosse Sekunde. Der entscheidende Punkt ist, dass dieses E nicht genau gleich hoch ist wie das E vorher von C-Dur:

Tonalität / Tonart Frequenz bezüglich Tonleitergrundton Frequenz bezüglich
C-Dur
Funktion des Tons in C-Dur, bzw. D-Dur
C-Dur C = 1 1 Grundton
D = 9/8 9/8 grosse Sekunde
E = 5/4 5/4 grosse Terz
D-Dur D = 1 9/8 Grundton
E = 9/8 9/8 x 9/8 = 81/64 grosse Sekunde

Tabelle 1: Relativität der Frequenzen bezüglich Grundton

In Tabelle 1 sehen Sie, dass das scheinbar gleiche E in den beiden Tonleitern verschiedene Tonhöhen hat:

E in C-Dur = 5/4        = 1.25
E in D-Dur = 81/64 = 1.266

Wenn ich eine Saite auf das E für C-Dur stimme, dann stimmt die Saite nicht ganz mit dem erwarteten E in D-Dur überein. Der Unterschied ist nicht gross, doch messbar und für feine Ohren durchaus hörbar.

Die reine Stimmung funktioniert nur für einen definierten Grundton. 

Sobald der Grundton wechselt, sind alle Tonleitertöne relativ zum neuen Grundton in Resonanz und die Tonhöhen der früheren Tonart stimmen nicht mehr alle ganz. Grund dafür sind wie dargestellt die doppelten Masstäbe für Intervalle, einmal linear (Hörempfindung) und einmal exponentiell (physikalische Frequenzen).

Die drei Welten

Wieder geht es um die drei Welten nach Penrose: Die Hörempfindung findet in der mentalen Welt statt, die Frequenzen sind Teil der physikalischen Welt und die ideale Welt ist diejenige der Mathematik der ganzzahligen Brüche. Alle drei Welten spielen bei der Musik auf höchst interessante Weise zusammen.

Ziel der Temperierung

Bei der Temperierung geht es nun darum, dass der Grundton frei gewechselt werden kann, ohne dass die von früher bekannten resonanten Tonleitern aufgegeben werden müssen. Es handelt sich um einen genial gewählten Kompromiss, der wirklich beide Ziele vereinen kann.

Historische Entwicklung

Die Faszination für resonante Akustik ist typisch für alle menschliche Kulturen. So entstanden die hochresonanten Tonleitern, die Standardpentatoniken und die Durtonleiter, verschiedene Molltonleitern und die in den gregorianischen Chorälen häufig verwendete dorische Tonleiter. Die Musik, die früher mit diesen Tonleitern gespielt wurde, hatte immer eine konstante Tonalität, d.h. einen Grundton, der nicht geändert wird, solange die Melodie erklingt.  Alle Töne der Melodie vergleichen sich mit dem Grundton und die Tatsache, wie stark der Melodie mit dem Grundton in Resonanz steht, zeigt die Spannung an, welche die Melodie beim jeweiligen Ton hat.

Mehrstimmige Instrumente aus früheren Kulturepochen haben zur Unterstützung der Grundtöne oft zusätzliche Saiten (Bordunsaiten) oder Pfeifen (Dudelsack), deren Tonhöhe nicht verändert werden kann, damit genau diese Spannung des Melodietons zum Grundton hervorgehoben wird. Während die Töne der Melodie variieren, erklingt der Grundton (Bordunton) durch das ganze Stück durch und gibt einen soliden Boden.

In Europa jedoch setzten sich in der Renaissance gewisse Neuerungen durch. So begann man den Grundton während des Stücks zu wechseln. Das erlaubt eine grössere Vielfalt in der Musik. Solange die Tonarten miteinander verwandt waren, entstanden nur geringe Frequenzabweichungen, bei wirklich eng verwandten Tonarten betrafen sie auch nur einen Ton. Je weiter die Tonarten aber voneinander entfernt waren, umso schwieriger wurde es. So klang es z.B. sehr unschön, wenn versucht wurde auf einer Orgel, die in C gestimmt war, in Fis-Dur zu spielen. Nun begann in Europa eine Periode der verschiedensten Versuche mit leicht veränderten (=temperierten) Stimmungen, welche die Unvereinbarkeit der Grundtonverschiebung mit der Reinheit der Intervalle in verschiedenen Kompromissen zu überbrücken versuchten. Letztlich durchgesetzt hat sich im Spätbarock die gleichstufige (gleichschwebende) Temperierung, die einen wirklich überzeugenden Kompromiss darstellt und die reiche Entwicklung der Harmonik in Klassik und modernen Jazz erst möglich gemacht hat.

Mehr dazu im nächsten Beitrag


Die ist ein Beitrag zur Entstehung der Tonleitern.


 

Künstliche Intelligenz: Daniel Kehlmann und CTRL

Ist künstliche Intelligenz intelligent? Oder kann sie es werden?

Der bekannte Schriftsteller Daniel Kehlmann («Die Vermessung der Welt») hat letztes Jahr mit einem Sprachalgorithmus (CTRL) in Silicon Valley  zusammen den Versuch unternommen, eine Kurzgeschichte zu schreiben. Fasziniert und gleichzeitig kritisch berichtet er über dieses aufschlussreiche Experiment.

CTRL

Das Programm CTRL ist ein typisches corpusbasiertes KI-System, d.h. ein System mit einer grossen Datensammlung – dem Corpus – und einem statistisch funktionierenden Auswertungsalgorithmus. Konkret haben die Betreiber den Corpus von CTRL mit Hunderttausenden von Büchern, Zeitungen und Online-Foren gefüttert, wodurch das System auf ein Gedächtnis aus Abermillionen von Sätzen zurückgreifen kann. Die Auswertung dieses Datenschatzes erfolgt aufgrund der Wahrscheinlichkeit: Wenn statistisch auf Wort A das Wort B das wahrscheinlichste ist, bringt das System nach Wort A auch das Wort B. Dank des immensen Corpus kann sich das System darauf verlassen, dass A nach B für uns durchaus eine wohlklingende Fortsetzung des Textes ist. Die schiere Wahrscheinlichkeit ist ist das Prinzip jeder korpusbasierten KI.

Natürlich ist anzunehmen, dass die Betreiber nicht nur die unmittelbaren Nachbarwörter berücksichtigen, sondern die Tiefenschärfe um das Ausgangswort weitreichender einstellen, also mehr Kontext berücksichtigen, doch stets gilt auch bei der Fortschreibung des gemeinsamen Textes durch Kehlmann und CTRL, dass der Algorithmus den bisher geschriebenen Text mit seinem grossen Corpus vergleicht und dann die Fortsetzung basierend auf der Wahrscheinlichkeit in seinem Korpus vorschlägt. Dadurch wird uns die Fortsetzung stets irgendwie vertraut und möglich vorkommen. – Wird sie aber auch sinnvoll sein? Wir kommen hier an die Grenzen jeder corpusbasierten Intelligenz: Das Wahrscheinlichste ist nicht immer das Beste.

Die Grenzen von CTRL

Daniel Kehlmann beschreibt die gemeinsame kreative Welt, die er zusammen mit dem Programm CTRL erkundet hat, gleichzeitig fasziniert und kritisch. Kritisch vermerkt er u.a. folgende Mängel:

a) Abstürze des Algorithmus
Beim Experiment ist es nicht gelungen, eine Kurzgeschichte über eine bestimmte Länge weiterzuschreiben; offenbar war dann der Algorithmus rechnerisch nicht in der Lage, die Informationen der bisherigen Geschichte kohärent mit dem Corpus zusammenzubringen. Sobald die Geschichte über einige Sätze hinausging, stürzte das Programm regelmässig unrettbar ab – Ende der Gesichte.

Meines Erachtens ist das kein KO-Kriterium, denn Abstürze eines neuen Programms sind stets zu erwarten (ich weiss, wovon ich spreche … ). Zudem erwecken solche Abstürze stets den Eindruck, als könnten sie mit noch besserer Hardware und robusteren Algorithmen überwunden werden.

Doch dies ist m.E. hier nicht der Fall. Ich glaube vielmehr, dass diese Abstürze einen grundsätzlichen Schwachpunkt der corpusbasierten KI offenbaren, der auch mit verbesserter Hardware und besseren Auswertungsalgorithmen nicht angegangen werden kann. Der Mangel liegt vielmehr prinzipiell in der wahrscheinlichkeitsbasierten Anlage dieser corpusbasierten Programme. Je mehr Kontext (Tiefenschärfe) sie berücksichtigen müssen, umso grösser muss ihr Corpus werden. Doch der Bedarf an Daten und Rechenpower wächst, wenn es um die Vergrösserung des Kontexts geht, nicht linear, sondern exponentiell. Selbst wenn der riesige Corpus und die immense Rechenpower von CTRL weiter vergrössert werden würden, stösst ein solches Programm systembedingt immer und rasch an seine Grenzen.

Um Sinn und Bedeutung einzufangen, braucht es grundsätzlich andere Methoden, solche, die Bedeutung nicht indirekt aus statistischen Daten ausmitteln, sondern sie direkt repräsentieren und behandeln. Erst dann können die Programme direkt mit Bedeutung umgehen.

b) Zweitverwertung
CTRL kennt nichts Neues, dafür Abermillionen alter Sätze. Dies birgt die Gefahr des «Garbage In, Garbage Out». Wenn Fehler oder Schwächen in den bisherigen Texten vorhanden sind, können sie auch in den Sätzen von CTRL auftauchen. Diese Gefahr ist zwar an sich klein, denn durch die grosse Menge an Sätzen wird es wahrscheinlicher, dass gleiche korrekte Sätze auftauchen als gleiche falsche, und somit wird CTRL sicher nur grammatikalisch, oder mindestens umgangssprachlich korrekte Sätze liefern. Doch trifft dies auch auf den Inhalt zu?

Wenn mehrere Menschen den gleichen Fehler machen, wird er dadurch zwar nicht korrekt, aber für eine corpusbasierte KI wird er so salonfähig. Rechtsextreme Messanger wird CTRL zwar kaum als bevorzugte Quelle benutzen, doch es geht nicht nur darum, gefährlichen Nonsens zu vermeiden. Vielmehr wollen wir spannende neue Geschichten. Wir wollen im CTRL-Projekt Kreativität und neue Ideen. Geht das mit einer Zweitverwertung?

c) Fehlende innere Logik
Die gewünschte Kreativität kann zwar durch Zufall simuliert werden. Wenn zwei für uns unzusammenhängende Informationen in einen direkten Zusammenhang gesetzt werden, sind wir erst einmal überrascht. Wir horchen auf und hören die Geschichte weiter. Aber macht das Zusammengebrachte auch Sinn? Folgt es einer inneren Logik? – Wenn es rein zufällig ist, tut es das nicht, dann fehlt die innere Logik.

Zufall ist nicht Kreativität. Erst wenn ein logischer Zusammenhang zwischen den Zufällen gefunden wird, entsteht eine funktionierende Geschichte. Diese innere Logik fehlt einem corpusbasierten Programm prinzipiell.

Fazit 

Daniel Kehlmann hat seine Erfahrungen präzis und gut nachvollziehbar beschrieben. Er erlebte das Experiment als faszinierend und war oft positiv von den Inputs von CTRL überrascht. Trotzdem stellt er fest, dass CTRL entscheidende Schwächen hat und verweist insbesondere auf den fehlenden narrativen Plan, welcher eine Geschichte zusammenhält.

Für jeden, der sich mit künstlicher Intelligenz vorurteilsfrei beschäftigt hat, ist die Erfahrung Kehlmanns eine lebhafte Bestätigung der eigenen Erfahrungen. Ich habe mich beruflich intensiv mit Computerlinguistik beschäftigt, d.h. mit der Frage, wie Computer natürliche Sätze intelligent interpretieren können. Dabei wird klar: Verständnis von Texten baut auf einem inneren Bezugssystem auf. Über dieses Bezugssystem verfügt jeder menschliche Schriftsteller – aber das KI-System nicht. Das korpusbasierte KI-System kennt nur die Wahrscheinlichkeiten von Signalen (Wörtern), ohne ihre wirkliche Bedeutung zu erfassen. Das ist das Problem.

Dem KI-System fehlt insbesondere Absicht und Bewusstsein. Die Absicht kann zwar durch die Betreiber von aussen vorgegeben werden – z.B. bestimmte Zellen in einem medizinischen Blutausstrich zu erkennen oder möglichst viel Traffic auf einer Suchmaschine zu erzielen – doch ein wirkliches Bewusstsein eines Programms würde ein Nachdenken über die eigene Absicht beinhalten. Eine corpusbasierte Intelligenz aber denkt überhaupt nicht nach – schon gar nicht über die eigene Absicht – sondern rechnet nur aus, was in seinem Datenpool das Wahrscheinlichste ist.

Das Experiment von Daniel Kehlmann ist deshalb lehrreich, weil es konkret, genau und verständlich Programmierern und Nicht-Programmierern die Grenzen der künstlichen Intelligenz aufzeigt.

Kurzfassung des Fazits

KI ist faszinierend und in vielen Anwendungen ausserordentlich nützlich, aber eines ist künstliche Intelligenz mit Sicherheit nicht: auf kreative Weise wirklich intelligent.

Mehr zu Daniel Kehlmanns und CTRL

Zwei schlechter resonante Intervalle für die Lücken

Ausgangslage: Zwei Lücken

Im Vorbeitrag haben wir erkannt, dass in der Reihe der bisher gefundenen zehn Tonleitertönen zwei Lücken bestehen. Können wir dort auch resonante Töne finden? Folgendes wissen wir bereits:

  • Wir kennen bereits die zehn «resonantesten» Intervalle in der Oktave.
  • Mit diesen zehn Intervallen können die fünf Standard-Pentatoniken, und unser Dur und Moll gebildet werden. Dort stören die Lücken also nicht, nur in der Anordnung aller zehn potentiellen Tonleitertöne fallen sie auf.
  • Intervalle kommen nicht allein, weder in einem Akkord, noch in einer Melodie. Wenn wir also ein resonantes Intervall haben, können wir darauf ein zweites ansetzen (addieren) und das resultierende Summenintervall berechnen. Oder wir betrachten den Abstand zwischen zwei Intervallen, und rechnen dazu den Abstand zwischen den beiden Intervallen aus, zählen also das eine vom anderen ab (=Subtraktion).
  • Wegen des exponentiellen Verlaufs der Frequenzen und gegen unsere intuitive Erwartung müssen wir für das Aneinanderfügen der Intervallen ihre Frequenzverhältnisse aber nicht addieren, sondern multiplizieren, und für den Abstand dürfen wir nicht abzählen, sondern müssen dividieren.

Weil wir schon alle resonanten Intervalle innerhalb der Oktave gefunden haben, können wir für die beiden Lücken keine hochresonanten Intervalle mehr erwarten. Doch obwohl die Intervalle im Erfolgsfall zwar nicht mehr so resonant sind, was ihre Resonanz zum Grundton betrifft, sie können sie doch direkte und dadurch sehr resonante Bezüge zu anderen Tonleitertönen haben. Das macht sie im musikalischen Verbund je nach Situation ebenfalls resonanzmässig interessant.

Hier meine Versuche, Töne für die Lücken zu füllen. Zur Illustration zeige ich zu Beginn nochmals die Anordnung der zehn bestresonanten Intervalle aus dem Vorbeitrag:

Abb. 1: Anordnung der zehn resonanten Tonleitertöne in einer Oktave (logarithmische Darstellung)

Die kleinen Sekunden

Für die erste Lücke finden wir keine gute Resonanz zum Grundton, rein rechnerisch haben die Brüche dort viel zu hohe Zähler und Nenner. Der gesuchte Ton darf nur ganz wenig höher sein als der Grundton, das Intervall muss also sehr klein sein. Dazu untersuchen wir als Kandidaten die Abstände zwischen zwei Intervallen, die nahe beieinander liegen. Wir finden so:

Oktave – grosse Sept  = 2 : 15/8 = 16/15 = 1.067
Quart – grosse Terz = 4/3 : 5/4 = 16/15 = 1.067
Kleine Sext – Quint = 8/5 : 3/2 = 16/15 = 1.067
Kleine Terz – grosse Sekunde = 6/5 : 9/8 = 48/45 = 16/15 = 1.067
Grosse Terz – kleine Terz = 5/4 : 6/5 = 25/24 = 1.042
Grosse Sept – kleine Sept = 15/8 : 9/5 = 75/72 = 25/24 = 1.042
Grosse Sext – kleine Sext = 5/3 : 8/5 = 25/24 = 1.042
Kleine Sept – grosse Sext = 9/5 : 5/3 = 27/25 = 1.08

Wir finden so mehrere Intervalle, welche die Bedingungen erfüllen und in die erste Lücke passen. Wie Sie sehen, sind die Intervalle sehr klein, d.h. nur wenig grösser als 1. Mit unserer Methode tauchen immer wieder die gleichen Intervalle auf, insgesamt sind es drei, die sich aus je zwei bekannten und resonanten Intervallen herleiten lassen:

  • 16/15 = 1.042
    – grosse Terz – kleine Terz
    – grosse Sext – kleine Sext
    – grosse Sept – kleine Sept
  • 25/24 = 1.067
    – kleine Terz – grosse Sekunde
    – kleine Sext – Quint
    – Quart – grosse Terz
    – Oktave – grosse Sept
  • 27/25 = 1.08
    – kleine Sept – grosse Sext.

Diese drei Intervalle klingen alle recht scharf. Wir nennen sie kleine Sekunden. In reiner Stimmung gibt es mindestens drei davon.

Die Tritoni

Die zweite Lücke findet sich genau in der Mitte der Tonleiter. Wir versuchen nun, mit Kombination von zwei bekannten resonanten Intervallen diese Lücke zu treffen:

Grosse Sept – Quart = 15/8 : 4/3 = 45/32 = 1.406
Kleine Sept – grosse Terz = 9/5 : 5/4 = 36/25 = 1.44
Grosse Sext – kleine Terz = 5/3 : 6/5 = 25/18 = 1.389
Oktave + kleine Terz – grosse Sext = 2 x 6/5 : 5/3 = 12/5 : 5/3 = 36/25 = 1.44

Wieder erhalten wir drei Intervalle, die nahe beieinander sind:

  • 25/18 = 1.389
  • 45/32 = 1.406
  • 36/25 = 1.440

Einfügung der kleinen Sekunden und Tritoni in die Reihe der Tonleitertöne

Unsere bisherigen Berechnungen betreffen die Frequenzverhältnisse. Diese müssen wir, wie im Vorbeitrag erklärt, logarithmisch umwandeln, damit ihre Abstände dem entsprechen, was wir in unserer mentalen Welt wahrnehmen. In logarithmischer Darstellung (auf Basis 2) erhalten wir folgende Verteilung:

Abb. 2: Drei kleine Sekunden («Halbtöne») und drei Tritoni füllen die Lücken von Abb. 1

Wir sehen zwar, dass die Vorschläge die Lücken jeweils gut füllen, doch für jede Lücke haben wir drei Vorschläge! Welcher ist jetzt der beste? Wir könnten für den mit den kleinsten Zahlen in Zähler und Nenner argumentieren oder für den mit der grössten Häufigkeit unter den Varianten oder den mit dem engsten Bezug zu einer bereits bekannten Tonleiter.  Doch wir schieben die Frage mit gutem Grund bis zur Behandlung der temperierten Stimmung auf


Die ist ein Beitrag zur Entstehung der Tonleitern.


 

Anordnung der Töne innerhalb der Oktave

Die zehn resonantesten Töne innerhalb der Oktave

Wir untersuchen in dieser Textserie die Tonleitern unter dem Aspekt der drei Welten. Alle drei Welten sind mitbeteiligt, wie wir das z.B. gesehen haben bei der Beantwortung der Frage, weshalb die Tonleitern aller Musikkulturen immer genau eine Oktave abdecken. Nur mathematisch oder physikalisch lässt sich das nicht erklären. Unter Hinzunahme der dritten Welt, nämlich unserer mentalen Welt, wird die Bedeutung der Oktave einleuchtend.

Auch die Auswahl der in der Tonleiter verwendeten Töne  wird über das Phänomen der Resonanz von allen drei Welten bestimmt, wie wir in den Vorbeiträgen gesehen haben. Schauen wir jetzt an, wie die zehn resonantesten Töne im Verlauf der Tonleiter-Oktave angeordnet sind. Wir werden dabei sehen, dass es in der Anordnung Lücken gibt, und uns dann überlegen, welche Konsequenzen wir daraus ziehen können.

Hier also nochmals die 10 Töne. (In Tabelle 1 sind zwar 11 aufgeführt, aber der Grundton und die Oktave zählen als ein Ton, da die Oktave sowohl der höchste Ton der aktuellen, als auch gleichzeitig der Grundton der nächsthöheren Oktave ist, in der sich die Tonleiter ja wiederholt).

Tab. 1: Der Grundton und die zehn resonantesten Intervalle in einer Oktave 

In Tabelle 1 finden sich in der mittleren Spalte die Brüche, welche das Verhältnis des Tonleitertons zum Grundton angeben, bei der Quinte z.B. beträgt die Frequenz das 3/2-fache der Grundfrequenz. Ganz rechts habe ich diese Brüche als Dezimalzahlen angegeben, damit man sie besser vergleichen kann. Die Zahlen bewegen sich selbstverständlich zwischen 1 (Grundton) und 2 (Oktave).

Anordnung der zehn Töne

Um zu sehen, wie sich die zehn Töne innerhalb der Oktave verteilen, nehmen wir die Frequenzen der Töne und vergleichen sie mit der Frequenz des Grundtons. Dies Frequenzverhältnisse finden sich in Tabelle 1 in der rechten Spalte. Diese Zahlen habe ich in die Abbildung 1 übertragen und Sie sehen, wie sich die Frequenzverhältnisse linear anordnen.

So sieht die Anordnung der Intervalle von Tabelle 1 aus:

Abb. 1: Frequenzverhältnisse der potentiellen Tonleitertöne (Tab. 1) in linearer Darstellung. Die Intervalle sind hier von C aus gedacht, d.h. C = Grundton.

In Abb. 1 fällt sofort auf, wie unregelmässig die Anordnung ist. Die Verteilung weist vier grössere Lücken auf, nämlich zwischen C-D, F-G, A-B und H-C. Subjektiv wirkt die Verteilung auch nicht masstabsgetreu, z.B. ist der Abstand zwischen dem Grundton und der Quart (C-F) viel kleiner als der zwischen der Quint und der Oktave (G-C). Wir empfinden aber beide Intervalle als die gleichen, nämlich als zwei Quarten, denn auch zwischen G und C ist der Abstand eine Quarte, genau wie zwischen C und F. Trotzdem ist es von G zu C in Abbildung 1 viel weiter als von C zu F. Weshalb entspricht der wahrgenommene Abstand nicht dem wirklichen Frequenzverhältnis? – Die Antwort liegt wieder im exponentiellen Verlauf der Frequenzen (physikalische Welt), der nicht unserer linearen Empfindung (mentale Welt) entspricht. Wir müssen deshalb die Frequenzen logarithmisch notieren und kommen so zu einer Darstellung, die unserer subjektiven Wahrnehmung entspricht:

Abb. 2: Frequenzverhältnisse der Abb. 1 in einer logarithmischen Darstellung.

Wir sehen, dass in Abb. 2 die Abstände unserer subjektiven Empfindung masstabsgetreuer entsprechen. So ist im Gegensatz zu Abb. 1 z.B. zwischen C und F der gleiche Abstand wie zwischen G und C, was wir als zutreffend empfinden, nämlich beidesmal als eine Quarte. Auch die anderen Abstände entsprechen unserer Empfindung.

Weiterhin sieht die Anordnung jedoch unregelmässig aus und es bestehen Lücken. Diese haben sich nun aber ebenfalls verschoben. Die Lücke C-D ist grösser geworden, während H-C kleiner geworden ist. Wirklich auffällig sind die beiden Lücken C-D und F-G. Können wir da etwas tun? Es geht wieder um die mentale Welt. Wir empfinden die Lücken wirklich. Können wir wieder unsere Resonanzüberlegungen zu Hilfe ziehen, um die Lücken zu füllen? Im nächsten Beitrag erkläre ich wie das geht.

Wir können nämlich Intervalle auch kombinieren. Das kombinierte Intervall weist dann auch noch eine gewisse Resonanz auf, diese ist jedoch meist schwächer als bei den beiden Ausgangsintervallen. Deshalb sind diese Intervalle in den Tonleitern etwas weniger beliebt. Mehr in der Fortsetzung.


Die ist ein Beitrag zur Entstehung der Tonleitern.


 

 

Reine und unreine Stimmung

Die zwei auseinanderstrebenden Ideale einer Theorie

Musiktheorie bewegt sich wie jede Theorie zwischen zwei Extremen. Einerseits erlaubt es eine Theorie, ganz verschiedene Beobachtungen zusammenzufassen und auf einfache Art zu erklären – je einfacher umso besser. Andererseits wollen wir die Erklärung aber auch anwenden, und zwar auf möglichst alles, was wir beobachten. Eine Theorie ist also dann gut, wenn sie möglichst einfach ist, andererseits aber auch möglichst alles erklärt.

Diese beiden Extremziele jeder guten Theorie gleichzeitig zu erfüllen ist die Herausforderung.

Typisch ist der Moment, wo bei der Anwendung der Theorie plötzlich eine Beobachtung auftaucht, die mit der Theorie nicht vereinbar ist. Solche Beobachtungen stürzen die Theorie in eine Krise, z.B. als Max Planck unerklärliche Unregelmässigkeiten in der Schwarzkörperstrahlung feststellte und so die Quantentheorie einleitete oder als Kurt Gödel  mit der Beobachtung einer Lücke in der Logik der Mengen (Unvollständigkeitssatz 1931) sowohl die Mengenlehre als auch die klassische Logik in eine schwere Krise stürzte.

Jede Theorie funktioniert solange gut, bis sie an ihre Grenzen kommt. Dann tauchen plötzlich Lücken auf.

Stimmt die reine Stimmung überhaupt?

Nun, die Krise, von der ich hier spreche, ist etwas älter als die von Max Planck und Kurt Gödel ausgelösten. Sie hat auch schon lange eine sehr praktische Lösung gefunden. Es handelte sich um eine Krise in der Musiktheorie, und die gefundene Lösung ist die gleichstufig temperierte Stimmung. Dies ist die Art, wie wir heute Musikinstrumente stimmen, aber es ist keine Selbstverständlichkeit.

Wie kam es dazu? Schon lange war bekannt, dass mathematische Gesetzmässigkeiten hinter den Intervallen stecken, die wir als wohlklingend empfinden. Tonleitern mit diesen durch einfache Brüche definierten Intervallen gelten als rein, auch unser Dur (ionisch) und alle anderen Kirchentonarten sind perfekt rein, sofern die Intervalle entsprechend den einfachen Brüchen gestimmt werden. Dann sind sie «rein».

Das funktioniert aber nur, wenn man in der gleichen Tonalität bleibt, d.h. wenn die Musik nicht den Grundton wechselt, d.h. nicht moduliert. In der Renaissance aber kamen die Komponisten zunehmend in Aufbruchstimmung und begannen zu modulieren, indem sie den Grundton (die Tonalität),  innerhalb des gleichen Musikstücks wechselten. Dabei wurden die Grenzen der reinen (=pythagoräischen) Stimmung evident.

Die Lücke im pythagoreischen Tonsystem

Als ich das erste Mal vom pythagoreischen Komma hörte, war ich sehr überrascht. Unser perfektes Tonsystem sollte eine – wenn auch klitzekleine – Lücke in der mathematisch perfekten Anordnung haben? Das Tonsystem besteht – wie jeder Blick auf eine Klaviertastatur zeigt – aus zwölf Halbtönen. Wenn ich die Halbtöne einen nach dem anderen nach oben gehe, kommt nach sieben Halbtönen die Quint und nach zwölf die Oktave. Wenn ich also zwölf Quinten (=12×7 Halbtöne) hochgehe, bin ich mathematisch gesehen am gleichen Ort, wie wenn ich sieben Oktaven (=7×12) hochgehe, nicht wahr?

Soweit die Mathematik, die mir als Kind sehr eingeleuchtet hat und ich war erstaunt, dass es nicht so sein sollte. In Wirklichkeit kommt man nach zwölf Quinten nämlich zu einem etwas höheren Ton als nach sieben Oktaven. 12×7 ist in diesem Fall nicht 7×12. Dieser Unterschied ist das pythagoreische Komma.

Woher kommt es? Die Ursache liegt – wie so oft – in einem unerwarteten exponentiellen Wachstum. Im Beitrag zum pythagoreischen Komma erkläre ich, wie und weshalb diese Lücke im pythagoreischen Tonsystem entsteht

 


Die ist ein Beitrag zur Entstehung der Tonleitern.


Wie entsteht das pythagoreische Komma?

Das pythagoreische Komma

Das pythagoreische Komma zeigt, dass unser Tonsystem nicht perfekt stimmt, sondern eine Lücke hat, deren Form und Ursache ich in diesem Beitrag beschreibe.   Das Komma ist sowohl für unsere Musikpraxis relevant, auf die es ganz konkrete Auswirkungen hat, als auch erkenntnistheoretisch, da es typisch ist für die Probleme, die wir beim Zusammenspiel unserer drei Welten (nach Penrose) beobachten. Es ist in diesem Sinn nicht nur für Musiker ein relevantes Thema, sondern auch für philosophisch interessierte Menschen, die sich fragen, wie Mathematik (ideale Welt), Physik (physikalische Welt) und unser Erleben (mentale Welt) zusammenhängen.

Als erstes erkläre ich hier, weshalb es zu diesem Komma kommt.


Intervalle addieren

Was geschieht, wenn wir zwei Intervalle, z.B. eine Quint und eine Quart addieren? Wir werden sehen, dass eine solche Addition in den einen Fällen perfekt funktioniert, in anderen aber zu Problemen führt. Hier liegt der Ursprung des Kommas, aber auch der temperierten Stimmung. Weshalb entstehen hier überhaupt Probleme? Darauf möchte ich jetzt eingehen, auf die Ursachen, später aber auch auf die Lösung des Problems.

Addieren heisst für Intervalle Multiplizieren

Können wir Intervalle einfach so addieren? Das Problem dabei ist, dass wir die Intervalle linear empfinden, die Frequenzen aber nicht linear ansteigen, sondern exponentiell.

Abb. 1: Exponentieller Anstieg der Frequenzen

Zwischen dem Ton A (110Hz) und dem Ton a (220 Hz) besteht ein Abstand von 110 Hz. Dieser Abstand entspricht einer Oktave – aber nur dort! Wenn wir nun den Abstand von Ton a zu Ton a' messen, was wieder einer Oktave entspricht, bekommen wir aber nicht 110 Hz sondern 220 Hz. Und von a' zu a" sind es bereits 880 Hz. Die Frequenzen verhalten sich eben nicht linear, sondern exponentiell, wie in Abb. 1 dargestellt.

Hier liegt nun die Ursache des Problems, das europäische Musiker dazu geführt hat, verschiedene temperierte Stimmungen auszutesten, wobei sich letztlich die gleichmässig temperierte Stimmung durchgesetzt hat.

Wenn wir Intervalle addieren, müssen wir also ihre Frequenzverhältnisse multiplizieren, wenn wir sie abzählen, müssen wir sie dividieren. Die Operationen verschieben sich von Addition/Subtraktion zu Multiplikation/Division. Diese Art Verschiebung ist den Mathematikern bestens bekannt. Vor den Taschenrechnern und Computern benutzten Techniker sogenannte Logarithmentabellen und Rechenschieber, die auf genau dieser Verschiebung basieren. Ebenso kommt der Effekt bei der kombinatorischen Explosion zu tragen oder beim Verlauf von Epidemien.


Beispiele für Intervall-Additionen

Was uns bei Intervallbetrachtungen immer interessiert, ist das Zahlenverhältnis der Frequenzen der beiden Töne des Intervalls: also der Bruch zwischen der Frequenz des höheren geteilt durch die Frequenz des tieferen Tons: X = f2/f1. Dieser Bruch bestimmt das Intervall, das wir wahrnehmen.

Oktave und Oktave

Siehe Abb. 1: Wir addieren zwei Oktaven, z.B. A-a und a-a'.

Die erste Oktave (A-a) misst 220/110 = 2
Die zweite Oktave (a-a') misst 440/220 = 2
Die beiden Oktaven zusammen ergeben 2×2 = 4

Die Multiplikation ist hier korrekt, denn a' ist 4 mal so schnell wie A (440Hz / 110Hz). Zwei Oktaven führen also zu einer Vervierfachung der Grundfrequenz.

Quinte und Quarte

Die Quinte entspricht einer Frequenzbeschleunigung auf 3/2
Die Quarte einer Beschleunigung auf 4/3

Quinte und Quarte zusammen ergeben 3/2 * 4/3 = 12/6 = 2

2 entspricht einer Oktave. Somit ergeben eine Quinte und Quarte zusammen rechnerisch genau eine Oktave. Auch hier entspricht die Mathematik unseren Hör-Erwartungen.

Weitere Additionen zu einer Oktave

Kleine Terz plus grosse Sext = 6/5 * 5/3 = 30 /15 = 2
Grosse Terz plus kleine Sext = 5/4 * 8/5 = 40 /20 = 2

Über die Oktave hinaus

Zwei Quinten: 3/2 * 3/2 = 9/4 = 2.25

2.25 ist grösser als 2, wir haben also den Bereich der Oktave verlassen. Wo sind wir gelandet? Bei einer None. Eine None ist eine Oktave plus eine grosse Sekunde. Geht das auf? Wir rechnen:

Oktave plus grosse Sekunde = 2 * 9/8 = 18/8 = 9/4 = 2.25
Ja! Es funktioniert. Wenn wir zwei Intervalle addieren, müssen wir ihre Brüche multiplizieren.


Subtraktion wird Division

Es geht natürlich auch umgekehrt, wir können ein Intervall von einem anderen abziehen. Dann müssen wir dividieren:

Eine Oktave weniger eine Quinte = 2 : 3/2 = 4/3 = eine Quart
Eine Quinte weniger eine Quart = 3/2 : 4/3 = 9/8 = eine grosse Sekunde.


Warum funktionieren diese Rechnungen?

Ich war überrascht, zu sehen, dass trotz der Verschiebung der Rechenoperationen die Rechnungen genau die Resultate liefern, die ein Musiker erwartet. Wie kann das sein? Eine Multiplikation ist doch etwas ganz anderes als eine Addition. Weshalb können wir trotzdem so rechnen?

Der Grund liegt darin, dass unzählige musikalische Menschen über viele Jahrtausende ein Tonsystem entwickelt haben, das genau das erlaubt. Dass die Rechnungen so perfekt aufgehen, ist nämlich keine Selbstverständlichkeit und es ist auch nicht immer so, wie wir gleich sehen werden. In den obigen Beispielen aber gehen sie auf und das rührt nur daher, dass wir die Intervalle klug gewählt haben. Sie sind wie in früheren Beiträgen dargestellt, alles andere als zufällig gewählt, sondern nach den Kriterien für resonante Tonleitern. Und dabei haben wir gesehen, dass Intervalle dann resonant sind, wenn sie Brüche mit ganzzahligen Zählern und Nennern darstellen, und dass es für eine gleichzeitige Resonanz von mehreren Intervallen notwendig ist, dass die beiden Zahlen möglichst klein sind und insbesondere bei der Primzahlzerlegung keine Primzahl grösser als 5 enthalten.

Diese restriktiven Bedingungen erlauben es nämlich, dass wir kürzen können, wenn wir die Intervalle miteinander vergleichen. Hohe Zahlen und insbesondere hohe Primzahlen sind fürs Kürzen ungeeignet. Das Kürzen aber kommt uns, wie wir in den oben stehenden Beispielen gesehen haben, enorm entgegen. Nur wenn wir kürzen erhalten wir aus der Kombination von zwei resonanten Intervallen wieder ein resonantes. Und nur so bleiben wir innerhalb unserer resonanten Tonleiter.

Das ist bei der Tonleiter so, aber auch beim «Addieren» von mehreren Intervallen. Nur leider funktioniert es nicht immer.


Es wäre zu schön …

Der Übergang vom linearen zum exponentiellen Wachstum führt nämlich schneller zu Problemen als wir erwarten. Schon einfachste Rechnungen funktionieren nicht:

Grosse Sekunde plus kleine Sept = 9/8 * 9/5 = 81 / 40 = 2.025
Wir erwarten eigentlich nicht 2.025, sondern 2, d.h. eine reine Oktave,

Grosse Terz minus grosse Sekunde = 5/4 : 9/8 = 40/36 = 10/9 = 1.111
Wir erwarten eigentlich eine grosse Sekunde, also 9/8 = 1.125

Eine Quart und eine Quart = 4/3 * 4/3 = 16/9 = 1.777
Wir erwarten eigentlich eine kleine Sept = 9/5 = 1.800

Sie sehen, unsere Erwartung, dass das Rechnen mit den Intervallen aufgeht, wird enttäuscht. Nur ganz wenige Intervallkombinationen erlauben ein «reines» Rechnen, und das auch nur darum, weil wir unser Tonleitersystem so gut gewählt haben. Alle anderen Intervallekombinationen gehen nicht auf. Meist sind die Abweichungen nicht sehr gross, aber trotzdem sind sie deutlich vorhanden. Das Phänomen, dass die Intervallkombinationen nicht aufgehen, ist unter dem Namen pythagoräisches Komma berühmt geworden.


Das pythagoreische Komma

Pythagoras hat bereits gewusst, dass natürliche, d.h. gut klingende Intervalle auf einfache Brüche mit kleinen Zahlen zurückzuführen sind. Die einfachsten Intervalle mit den kleinsten Zahlen in den Brüchen sind bekanntlich die Oktave (2/1), die Quinte (3/2) und die Quart (4/3).

Wie wir oben gesehen haben geben zwei Quinten zusammen eine None. Wie viele Quinten braucht es nun, bis wir wieder beim Grundton sind? Schauen wir das von C aus an und untersuchen wir, wie viele Quinten es braucht, bis wir wieder bei einem C sind:

C – G:  erste Quinte
G – D:  zweite Quinte

Die ganze Reihe ist folgende:
C – G –  D – A – E – H – F# – C# – Ab – Eb – B – F – C

Wir haben somit zwölf Quinten. Das tiefe und das hohe C sind sieben Oktaven voneinander entfernt. Somit ist das obere C über die Quinten gerechnet = 3/212 = 129.746 und über die Oktaven gerechnet = 27 = 128. Die Abweichung zwischen den beiden Berechnungen beträgt: 129.746 : 128 =  1.0136.

Diese kleine Abweichung ist das pythagoreische Komma.

Einordnung des Kommas in den grösseren Zusammenhang

Das pythagoreische Komma ist unausweichlich und rührt letztlich daher, dass wir hier mathematisch unter zwei verschiedenen Flaggen segeln, nämlich derjenigen, die addiert und derjenigen, die multipliziert. Unser Denken, das sich vor allem materiell-räumlich orientiert, ist das lineare Rechnen gewohnt, mit dem Längen gemessen werden. So sehen wir auch die Intervalle. Diese aber funktionieren über die Frequenzen und ihre gegenseitigen Verhältnisse, und diese sind eben nicht linear, sondern exponentiell.

Das ist übrigens nicht der einzige Ort, an dem uns unsere Gewohnheit, linear zu denken, zur Falle wird. Viele Prozesse verlaufen exponentiell, genannt seien hier die kombinatorische Explosion, sobald ein Kollektiv von mehreren Objekten angeschaut wird oder der Verlauf von Epidemien, Gesellschaftstrends etc. Sobald das Geschehen komplex wird, dürfen uns exponentielle Verhältnisse nicht überraschen.

Dies führt uns zum Grundthema dieser Serie zurück, nämlich zum Verhältnis der drei Welten. Was ist die Rolle der Mathematik für die Physik und unseren Geist? Ich lasse diese Frage hier offen und bleibe vorerst auf dem Gebiet der Musik.  Im nächsten Beitrag werde ich erläutern, welche Vorteile unsere Lösung des Komma-Problems, nämlich die gleichmässig temperierte Stimmung bietet.


Fazit

  1. Intervalle werden verrechnet, indem man die Brüche ihrer Frequenzen multipliziert und dividiert.
  2. Dies widerspricht unserer intuitiven Vorstellung, dass dabei addiert und subtrahiert wird.
  3. Aus diesem Grund führen die meisten «Additionen» und «Subtraktionen» von zwei Intervallen nicht zu den erwarteten reinen Intervallen.
  4. Nur ganz wenige Additionen/Subtraktionen von Intervallen führen wieder zu reinen Intervallen. Dies ist nur dann möglich, wenn die Brüche der beteiligten Intervalle ein Kürzen ermöglichen.
  5. Dabei gelten die gleichen Regeln wie für die Bestimmung resonanter Tonleitertöne: Zähler und Nenner müssen kleine Zahlen sein, insbesondere höhere Primzahlen stören Resonanz und Verrechenbarkeit.
  6. Das pythagoreische Komma ist Ausdruck dieser grundlegenden mathematischen Inkompatibilität von Linearität (Addition) und Exponentialität (Multiplikation).
  7. Das pythagoreische Komma setzt somit der reinen Stimmung eine natürliche Schranke.

Wir werden bald sehen, wie das Problems der pythagoräischen Kommas mit der temperierten Stimmung gelöst wird. Doch vorher schauen wir die Anordnung der Töne innerhalb der Oktave in der reinen Stimmung an.

 


Die ist ein Beitrag zur Entstehung der Tonleitern.


Resonante Tonleitern

Resonanzen spielen bei unseren Tonleitern eine entscheidende Rolle. Die Bedingungen für die Resonanzentstehung zwischen zwei Tönen sind in der Physik gut bekannt und zeigen einfache mathematische Verhältnisse. Die Frequenzen der beiden Töne stehen nämlich, wenn sich Resonanz entwickelt, in einem Verhältnis, das als Bruch zwischen zwei ganzen Zahlen gesehen werden kann. Das besondere dabei ist, dass die Resonanz umso stärker ist, je kleiner die beiden Zahlen sind, ideal sind 1, 2, 3, 4 und 5.

So entsteht eine Resonanz am leichtesten beim gleichen Ton (1/1), bei der Oktave (2/1), der Quint (3/2) und der Quart (4/3). Auch die grosse (5/4) und die kleine Terz (6/5) zeigen Brüche mit ausgesprochen kleinen Zählern und Nennern. Insgesamt erfüllen total 10 Töne die mathematisch formulierbaren Bedingungen für starke Resonanzen.

Kann man nun aus diesen zehn am stärksten resonanten Tönen – oder einer Auswahl aus ihnen – sinnvolle Tonleitern aufbauen? Und kommen solche Tonleitern in der Natur auch vor – d.h. werden sie in den menschlichen Kulturen auch verwendet?

Hier wird es nun interessant, denn die beiden Tonleitern, welche aus mathematischen Gründen die stärksten Resonanzen zwischen ihren einzelnen Tönen aufweisen, sind verblüffenderweise genau die, welche in allen Kulturkreisen vorkommen. Es handelt sich um die Dur- und die Moll-Pentatonik. Diese beiden Pentatoniken verwenden von den erwähnten zehn resonantesten Tonleitertönen genau diejenigen fünf, welche auch unter sich ausschliesslich starke Resonanzen aufweisen. Diese beiden Pentatoniken klingen deshalb nie «falsch», d.h. alle ihre Töne passen immer reibungslos, eben resonant zusammen.

Bei Tonleitern mit sieben Tönen (=Heptatoniken) ist es unsere bekannte Dur-Tonleiter (=ionisch), welche die stärkste Resonanz aller Tonleitertöne mit dem Grundton aufweist. Die Dur-Heptatonik ergänzt die eng mit ihr verwandte Dur-Pentatonik um zwei neue Töne, nämlich um die Quart und die grosse Sept. Diese beiden zusätzlichen Töne sind ebenfalls bereits im Set der 10 resonanten Tonleitertöne enthalten. Sie bringen für die Dur-Heptatonik im Vergleich zur reibungslosen Dur-Pentatonik mehrere Vorteile: Die beiden zusätzlichen Töne erlauben es insbesondere, durch ein flexibles Einstellen der Resonanzen Spannung und Entspannung erlebbar zu machen. Dies ist bei der Dur-Pentatonik schlechter möglich, weil bei ihr nur resonante, d.h. spannungslose Töne vorkommen.

Die Dur-Heptatonik erweitert die Dur-Pentatonik noch in anderer Hinsicht: Sie bietet neu die Möglichkeit, den hochresonanten und dadurch sehr wohlklingenden Dur-Dreiklang (Grundton – grosse Terz – Quint), der sich in der Pentatonik bereits auf dem Grundton aufbauen lässt, noch auf zwei weiteren Tönen aufzubauen, nämlich auf der Quinte (Dominante) und auf der Quarte (Subdominante). Zwischen den drei Akkorden, die jeweils in sich ruhend sind, kann nun hin und her gewechselt werden. Mit den zwei zusätzlichen Tönen können deshalb weit interessantere Harmoniefolgen entstehen als mit den einfachen Standard-Pentatoniken.

Eine Übersicht über die weiteren Beiträge zur Drei-Welten-Theorie, den Tonleitern und Resonanzen finden sie hier.

Die Dur-Tonleiter bringt Spannung in die Resonanzen

Die Dur-Tonleiter

Die Dur-Tonleiter (ionisch) ist in Europa und auch global mit Abstand die weitest verbreitete Tonleiter. Es handelt sich um eine Heptatonik, also um eine Tonleiter mit sieben Tönen. Sie zeichnet sich durch ganz besondere Resonanzverhältnisse aus, die ihre weltweite Wertschätzung gut erklären können.

Unten habe ich die Töne der C-Dur Tonleiter aufgezeichnet, von unten nach oben aufsteigend und jeweils rechts von jedem Ton sein Intervall zum Grundton. Selbstverständlich ist dieses Intervall das, was die Tonleiter ausmacht. Man könnte die Tonleiter auch auf jedem anderen Ton beginnen und nur von den Intervallen (Sekunde, Terz usw.)  sprechen, da es zur Beschreibung der Tonleiter nur auf die Abstände zwischen den Tönen ankommt. Ich verwende hier jedoch die Töne der C-Dur-Tonleiter, einfach weil das anschaulicher ist und Sie das auch leichter am Klavier oder einem anderen Instrument nachvollziehen können.

Das Intervall bezeichnet das Verhältnis der Frequenzen des jeweiligen Tonleitertons zur Frequenz des Grundton. Dieses Intervall liegt bei jeder Tonleiter immer zwischen 1 (Grundton) und 2 (Oktave). Wir geben es in Form eines Bruchs an.

C      2
H      15/8
A      5/3
G      3/2
F      4/3
E      5/4
D      9/8
C      1

Tab. 1: Die C-Dur-Tonleiter

Die Brüche erlauben uns zu erkennen, was das Typische der Dur-Tonleiter ist. Sehr gut lässt sich zeigen, dass das, was wir subjektiv hören (mentale Welt) ganz parallel läuft zu dem läuft, was in der konkreten Materie (physikalische Welt) geschieht und zu dem, was wir mathematisch mit einfachen Brüchen darstellen können (platonische Welt). Erneut stellt heraus, dass die drei Welten (nach Penrose) auf dem Gebiet der Musik perfekt zusammenspielen.

Alle Töne sind resonant zum Grundton

In einem Vorbeitrag habe ich Resonanzkriterien für Tonleitertöne aufgestellt Mit diesen Kriterien erhalten wir 10 Töne, welche jeweils zum Grundton eine starke Resonanz haben. Die Dur-Heptatonik besteht – wie auch die Standard-Pentatoniken – aus einer Auswahl aus diesen zehn am stärksten resonanten Tönen. Somit können wir davon ausgehen, dass die Dur-Tonleiter generell gesehen schon in sich eine starke Resonanz aufweist. Doch nicht jeder Ton ist gleich resonant zum Grundton. Und besonders unter sich sind die Töne sehr unterschiedlich resonant. Hier wird nun die Geschichte interessant. Als erstes schauen wir den Unterschied von der Dur-Heptatonik zur Dur-Pentatonik an.

Die Dur-Heptatonik als Erweiterung der Dur-Pentatonik 

Die Standard-Pentatoniken sind die am stärksten resonanten Tonleitern überhaupt und die resonanteste von ihnen ist die Dur-Pentatonik. Die Dur-Heptatonik kann man als Erweiterung der Dur-Pentatonik sehen. Beide Tonleitern sind Subsets der zehn resonantesten Töne:

Tabelle 2:Vergleich der Dur-Pentatonik mit der Dur-Heptatonik

Die Töne, die die Heptatonik im Vergleich zur Pentatonik neu aufnimmt, erklären den Unterschied. Während die Pentatonik durchgehend resonant ist und alle Töne beliebig gemischt werden können ohne dass Spannungen auftreten, ist das bei der Heptatonik nicht mehr so. Die beiden Töne, die neu dazukommen, das F und das H, bringen die notwendige Spannung hinein, damit die Sache interessant wird.

Als erstes fällt auf, dass mit dem H der Ton dazukommt, der unter den zehn resonantesten Tönen derjenige mit den höchsten Zahlen in Zähler und Nenner ist. Somit ist er von allen zehn resonanten der Ton mit der schlechtesten Resonanz zum Grundton, also der spannungsgeladenste. Dies betrifft das Verhältnis zum Grundton.

Doch auch das Verhältnis der Tonleiter-Töne untereinander spielt in der Tonleiter eine wichtige Rolle. Wir rechnen es aus, indem wir das Frequenzverhältnis des oberen Tons durch dasjenige des unteren teilen (Grund dafür siehe in der Appendix). Die beiden neu in die Heptatonik aufgenommenen Töne, nämlich das F und das H erzeugen nun rechnerisch und hörbar eine Spannung, wie sie in der Pentatonik bisher nicht vorkommt. Wenn wir z.B. das F zusammen mit dem E erklingen lassen, dann ergibt das ein Frequenzverhältnis von 4/3 : 5/4 = 16/15, ein Bruch, der auf eine schwer zu erreichende Resonanz hinweist. Ähnlich ergeht es dem H neben dem oberen C, hier ist das Verhältnis 2 : 15/8 = 16/8 : 15/8  = 16/15. Zwischen dem H und dem C besteht somit das gleiche spannungsgeladene Intervall wie zwischen dem E und dem F. Das Intervall zwischen dem F und dem H ist nochmals heikler, hier ist der Bruch 15/8 : 4/3 = 45/32.

Spannung und Entspannung

Schlechte Resonanz bedeutet Spannung, da die beiden Töne sich nicht so leicht verbinden. Das empfinden wir subjektiv (mentale Welt), wie Sie leicht testen können, indem sie auf einem Klavier gleichzeitig ein E und ein F anschlagen und das Resultat vergleichen mit dem gleichzeitigen Erklingen z.B. von E und G. Das E und das F reiben sich mehr. Die Mathematik der Frequenzverhältnisse wirkt sich physikalisch als kleinere oder grössere Bereitschaft aus, eine Resonanz einzugehen und das hören wir.

Musikalisch ist die Spannung aber nicht uninteressant. Die Dur-Pentatonik ohne F und H erscheint uns zwar ruhig und harmonisch, aber auch ein bisschen langweilig. Die Dur-Heptatonik hingegen enthält kleine Pfefferkörner, welche eine spannende Schärfe hineinbringen, ähnlich wie Peperoncini in den Speisen. Die Schärfe spüren Sie im Mund aber noch lange nach, während in der Musik die Schärfe ganz präzis ein- und ausgeschaltet werden kann, einfach in dem Sie den spannungsreichen Ton durch eine ruhigen, d.h. problemlos resonanten austauschen. Dieses Spiel von Spannung und Entspannung wird in der Musik ausgiebig benützt.

Die Dur-Heptatonik als Subset der zehn resonantesten Töne

Wie in Tabelle 2 dargestellt, ist die Durtonleiter eine Auswahl von sieben Tönen aus der Liste der zehn resonantesten Töne. Diese Auswahl hat es in sich. Ich werde gleich auf die mathematischen Gegebenheiten eingehen, die sich aus ihr ergeben. Vermutlich werden Sie nicht überrascht sein, dass diese mathematischen Gegebenheiten erneut mit unserem Hörerleben parallel gehen. Schauen wir zuerst, welche Töne im Dur fehlen, es sind dies Es, As und B. Wie immer schauen wir die Brüche dieser drei Intervalle an: 6/5, 8/5 und 9/5. Sofort fällt uns auf, dass alle diese Brüche den Nenner 5 haben. Die Töne der Dur-Heptatonik hingegen kennen keinen Nenner 5.

Nenner wegkürzen

Diese Tatsache des fehlenden Nenners 5 erleichtert die Resonanzen innerhalb der Tonleiter. Wenn zwei Töne den gleichen Nenner haben, kürzt sich dieser weg, wenn wir beide Töne gleichzeitig erklingen lassen. Das Intervall der beiden Töne bekommt so schneller eine Resonanz. Wenn hingegen verschiedene Nenner vorhanden sind, wird die Resonanz erschwert. Aber auch unterschiedliche Nenner lassen sich kürzen, wenn sich die beiden Zahlen durcheinander teilen lassen.

Dazu führen wir eine Primzahlzerlegung durch und erkennen z.B, dass in der Dur-Tonleiter die grosse Sept und die grosse Terz untereinander perfekt resonant sind: Wir vergleichen (teilen) die grosse Sept durch die grosse Terz und erhalten: 15/8 : 5/4 = 3/2, also ein perfekt resonantes Intervall, nämlich die Quinte.

Dies ist möglich weil der Nenner 8 und der Nenner 4 bei der Primzahlzerlegung beide zweimal die Primzahl 2 enthalten (8=2x2x2 und 4=2×2). Somit kürzt sich die 2 zweimal weg. Ähnliches geschieht wo immer möglich auch bei den beiden Zählern.

Aus diesem Grund ist es «klug» von der Dur-Tonleiter, dass sie gerade auf alle Töne mit dem Nenner 5 verzichtet. So stört die 5 nie, und Kürzungen sind besser möglich. Und gekürzte Brüche in den Frequenzverhältnissen bedeuten physikalisch und mental eine bessere Resonanz.

Resonanz der Gesamtheit aller Tonleitertöne

Wir können das Kürzungsverhalten der Gesamtheit aller Töne in einer Tonleiter grob abzuschätzen, indem wir das kgV (kleinste gemeinsame Vielfache) aller Nenner ausrechnen, so wie wir das bereits bei den Pentatoniken getan haben. Die Töne der Dur-Heptatonik weisen nun ein fast unschlagbar tiefes kgV von 24 aus, es ist sogar genau das gleiche wie bei der Dur-Pentatonik mit zwei Tönen weniger.

Dieses kleine kgV rührt natürlich ebenfalls daher, dass wir keine Töne mit Nenner 5 aufgenommen haben, sonst müssten wir das kgV mit 5 vervielfachen und kämen auf 120.

Das kgV ist nützlich,  sagt aber nicht alles

Das kgV zeigt aber nicht das ganze Resonanzverhalten der Tonleiter. Es ist nur ein Mass für die Resonanz aller Tonleitertöne zum Grundton, sagt aber nichts aus zu den Resonanzen der Tonleitertöne untereinander. So kommen wir im Beispiel oben für F und H auf ein Frequenzverhältnis von 45/32, d.h. auch wenn die Töne zum Grundton gut resonant sind, können sie unter sich spannungsgeladen sein.

Das ist aber kein Schwachpunkt, sondern macht die Tonleiter im Gegenteil interessant. Die Dur-Heptatonik ist in dieser Hinsicht eindeutig interessanter als die Dur-Pentatonik, obwohl beide das gleiche kgV haben.

Trotzdem ist das kgV aber ein valabler grober Gradmesser für die grundsätzlichen Resonanz-Möglichkeiten in der Tonleiter, denn bei hohem kgV, d.h. wenn sich die Nenner nicht kürzen lassen, sind die Dissonanzen auf jeden Fall schärfer.

Dreiklänge in der Durtonleiter

Wir wenden nun unsere Resonanz-Überlegungen auf drei gleichzeitig erklingende Töne an.  Analysieren wir z.B. den Dreiklang von C, E und G. Die Frequenzen sind (siehe Tabelle 1): 1 – 5/4 – 3/2. Um das Verhältnis aller drei Töne zueinander zu berechnen, müssen wir alle drei auf gleichen Nenner setzen. Genau dafür brauchen wir wieder das kgV, und dieses ist hier 4. Wir bekommen so aus 1 – 5/4 – 4/2  zu einem Verhältnis von 4/4 – 5/4 – 6/4. Den gemeinsamen Nenner 4 können wir gleich wegkürzen und das Verhältnis der Frequenzen von C-E-G ist somit 4 – 5 – 6.

Dies ist das resonanteste Verhältnis, das in einem Ensemble von drei verschiedenen Tönen überhaupt möglich ist. Beim Dreiklang C-E-G handelt es sich um den einfachen und allen wohlbekannten Dur-Dreiklang. Auf dem Klavier ist er durch die Temperierung etwas gestört, aber auch so können Sie leicht selber austesten, wie eingängig dieser Dreiklang ist. Kein Wunder spielt er in der Pop- und Volksmusik eine derart überragende Rolle.

Drei Dur-Dreiklänge in der Dur-Heptatonik

Die Dir-Heptatonik aber enthält den Dur-Dreiklang aber nicht nur einmal, sondern gleich dreimal. Schauen Sie die Töne F – A – C an, in Brüchen 4/3 – 5/3 – 2, oder alle Töne auf den gemeinsamen Nenner 3 gesetzt: 4/3 – 5/3 – 6/3, also wiederum 4 – 5 – 6. Hier sieht man erneut den Nutzen, den gemeinsame Nenner (hier 3) für die Resonanzen darstellen. Die Dur-Heptatonik hat also gut daran getan, den Ton F hineinzunehmen, der einen zweite Dur-Dreiklang ermöglicht.

Aber auch das H ist gut gewählt, denn zum dritten Mal gibt dadurch den Dur-Dreiklang in der Dur-Heptatonik. Wir starten diesmal mit dem G und nehmen das H hinzu. Als drittes nehmen wir das D, dieses eine Oktave höher als gewohnt, also gleich über dem höheren C. Dazu müssen wir (siehe Rechenregeln) das 9/8 des D mit 2 multiplizieren und bekommen 9/4. Dieser Bruch ist grösser als 2, liegt also bereits über der Oktave. Schauen wir jetzt die Töne G – H – D an, die Frequenzen sind: 3/2 – 15/8 – 9/4. Mit dem kgV=8 bekommen wir: 12/8 – 15/8 – 18/8. Wir können nun Zähler und Nenner kürzen und erhalten wieder 4 – 5 – 6, also das gleiche Verhältnis wie oben, d.h. den gleichen perfekt resonanten Dur-Dreiklang wie beginnend mit dem C oder dem F.

Die Dur-Heptatonik enthält somit den Dur-Dreiklang gleich dreimal, denn dreimal lassen sich drei Töne aus der Heptatonik miteinander auf diese höchst resonante Weise verbinden. Bemerkenswert ist aber auch, dass sich die drei Dreiklänge untereinander nicht so gut mischen können. Das ist gut hörbar, die Mathematik entspricht auch hier wieder perfekt dem subjektiven mentalen Erleben (Sorry, ich muss das einfach immer wieder bringen mit den drei Welten, ich bin selber überrascht, wie gut die drei bei den Tonleitern zusammen kommen).

Natürlich wurde die Dur-Tonleiter nicht «erfunden«, schon gar nicht von einem Mathematiker. Die Tonleiter wurde vielmehr gefunden, und zwar von Menschen, die selber aktiv Musik machten und dabei auf die speziell interessanten Resonanzverhältnisse aufmerksam wurden, die sich bei dieser Zusammenstellung von Tönen ergeben.

Es ergeben sich nämlich drei isolierbare Auswahlen von Tönen aus der Dur-Tonleiter, die in sich jeweils gut resonant sind, aber zu den anderen beiden Auswahlen weniger gut harmonieren. Das ergibt drei unterschiedliche Farben oder Harmonien, die in der Tonleiter getrennt abrufbar sind und deren Abfolge in einem Musikstück geplant werden kann und so eine musikalische Geschichte erzählt. Die drei Farben definieren sich durch den jeweiligen Grundton des Dreiklangs, nämlich durch den Tonleiter-Grundton (C), seine Quart (F) und seine Quint (G). Die drei Töne heissen auch Tonika (Grundton), Subdominant (Quart) und Dominante (Quint). Die Möglichkeit, mit solchen Farben zu spielen, geht weit über die Möglichkeiten der Dur-Pentatonik hinaus und wurde in Europa im Verlauf der Jahrhunderte immer mehr perfektioniert.

Moll-Dreiklänge

Auch diese haben ein spezielles Resonanzverhältnis, nämlich 10 – 12 – 15. Die Zahlen sind etwas höher als im Dur-Dreiklang, was den Moll-Dreiklang etwas weniger resonant macht. Doch für drei verschiedene Töne ist das Verhältnis immer noch extrem einfach und somit resonant und Moll-Dreiklänge sind ganz bestimmt keine Dissonanzen.

Beim Moll-Dreiklang kommt mit der Mollterz zum ersten Mal ein Frequenzverhältnis mit Nenner 5 vor, Dur hingegen kennt das nicht und bevorzugt Nenner basierend auf der Primzahl 2. Dadurch ergibt sich eine deutlich andere Farbe. Mit dem Nenner 5 sind wir schon bei der höchsten «erlaubten» Primzahl angelangt, viel höher als mit der 2 und seinen gut teilbaren Vielfachen des Durs. Moll klingt deshalb weicher, spezieller und nicht so strahlend wie Dur.

Die Moll-Dreiklänge finden sich nicht nur in der Moll, sondern auch in der Dur-Heptatonik, einfach basierend auf weniger prominenten Tönen der Tonleiter, konkret auf dem D, dem E und dem A, doch grundsätzlich lassen sich auch in der Dur-Tonleiter Mollfarben erzeugen, wenn auch nur auf Nebentönen.

Fazit

Insgesamt bieten die sieben Töne der Dur-Tonleiter eine fast unerschöpfliche Quelle an Kombinationen. Die Dur-Tonleiter vereinigt ein maximales Mass an Resonanz mit der Möglichkeit, Spannung und verschiedene Farben zu erzeugen. Dies alles lässt sich mit einfachem Bruchrechnen mathematisch einfach nachvollziehen – in vollem Einklang mit dem, was wir subjektiv hören.


Als nächstes werfen wir einen Blick auf den Unterschied zwischen reiner und unreiner Stimmung. Interessanterweise ist es ja gerade die unreine Stimmung, welche die aktuelle Musikkultur prägt, und nicht etwa die reine. Die unreine Stimmung hat gewichtige Vorteile gegenüber der reinen und sie wurde in Europa bewusst gesucht.

Dieses ist besonders interessant, weil es zeigt, wie die reine mathematische Welt in der physikalischen an Grenzen kommt. Diese Tatsache hat zur gleichmässig temperierten Stimmung geführt, einer «unreinen» Stimmung, die aber heute für uns die gewohnte ist – und das aus guten Gründen. Lesen sie deshalb im nächsten Beitrag, wie es dazu gekommen ist.


Die ist ein Beitrag zur Entstehung der Tonleitern.


 

What you search is what you see

«What you search is what you see» ist der Name eines Videospiels, entwickelt vom Japaner Akihiko Taniguchi, das die Macht der Suchmaschinen deutlich macht.

Details zum Spiel finden Sie in der Republik unter https://www.republik.ch/2021/01/30/ein-computer-im-computer-im-computer

Siehe auch meine Serie zur Künstlichen Intelligenz, z.B.:
Die Intelligenz in der Suchmaschine
Wie real ist das Wahrscheinliche?

Ungeplanter Abstecher

Es kommt nicht immer wie geplant.

Eigentlich wollte ich frei nach Roger Penrose über das Rätsel der drei scheinbar unvereinbaren Welten schreiben, ein Rätsel, das mich als Informatiker und Philosoph fasziniert. Ganz kurz plante ich dabei einen Abstecher in die Musiktheorie, um ein konkretes Beispiel für das Zusammenspiel der drei Welten zu bringen – doch so kurz wurde der Abstecher nicht! Das Thema Tonleitern hat mich richtig hinein gezogen.

Ich spürte, dass man anhand der Resonanzen zwischen den Tonleiterintervalle das Zusammenspiel von Mathematik, Physik und subjektivem Empfinden auf einfache und plausible Weise erklären könnte. Was mich aber überrascht hat, ist das Potential dieser Erklärungsmöglichkeiten: 


A: Alle in Europa bekannten Tonleitern lassen sich ausnahmslos und zwingend auf wenige klar formulierbare mathematische Bedingungen zurückführen.

B: Diese mathematischen Bedingungen sind genau diejenigen, die auch ausserhalb der Akustik überall in der Physik die Entstehung von Resonanzen zwischen zwei getrennten Schwingungsträgern ermöglichen.

C: Die Bedingungen sind «fehlerfrei», d.h. sie führen zu keinen Intervallen, die nicht auch eine Rolle in unseren Tonleitern spielen.

D: Die Bedingungen sind «sprechend», indem sie auch die Rolle der einzelnen Tonleitertöne innerhalb der Tonleitern erklären.

E: Zusätzlich macht die mathematische Resonanzanalyse die individuellen Charakteristika der unterschiedlichen Tonleitern verständlich.

G: Auch Akkorde lassen sich erklären, d.h. was der praktizierende (Jazz)-Musiker hört und wie er die Akkorde in einem Stück einsetzt, stimmt mit der hier vorgestellten Theorie überein und wird über die Resonanzen der einzelnen Töne innerhalb des Akkords mathematisch erklärbar.


Aus diesen Gründen, und weil es viel zu beschreiben gibt, bin ich beim Thema «Resonanzen in den Tonleitern» stecken geblieben. Das Problem ist, dass ich damit zwei Gruppen von Lesern vor den Kopf stosse:

  • Nichtmusiker, die zum Thema Intervalle und Tonleitern keinen Zugang haben
  • Musiker, die keinen Spass an Mathematik haben.

Mit anderen Worten: Der Leser wird gefordert. Tut mir leid. Deshalb meine Botschaft an die beiden Gruppen:

  • Liebe Musiker, die Mathematik der Resonanzen ist einfaches Bruchrechnen mit kleinen Zahlen, keine Hexerei.
  • Liebe Nichtmusiker, ich werde das Thema Tonleitern bald wieder verlassen und mich auf die informatischen und philosophischen Aspekte des Drei-Welten-Themas konzentrieren.
  • Liebe Alle: Das Thema «Resonanzen in der Musik» lohnt sich und bietet einen überraschenden Erkenntnisgewinn.

Standard-Pentatoniken

Wie wir im Vorbeitrag gesehen haben, bilden die Töne C – D – E – G – A – C die Standard-Dur-Pentatonik.

Insgesamt lassen sich mit den einfachen Kriterien für resonante Tonleitern noch vier weitere Pentatoniken bilden. Diese fünf Pentatoniken sind die fünf Tonleitern, welche nach unseren mathematischen Kriterien unter allen Tonleitern am leichtesten Resonanzen unter allen ihren Tönen erlauben.

Wir werden später sehen, dass wir mit unserem Pool der neun am stärksten resonanten Töne alle traditionell in Europa gebräuchlichen Tonleitern bilden können. Bei den Heptatoniken, z.B unserem diatonischen Dur, sind jedoch gewisse Töne miteinander schlecht resonant, was musikalisch eigentlich interessanter ist, da dadurch eine natürliche Struktur innerhalb der Tonleitertöne entsteht.

Die Pentatoniken hingegen haben keine «falschen» Töne, wie immer man sie mischt. Es gibt bildlich gesprochen keinen Widerstand, welche Töne man auch zusammen erklingen lässt.

Die fünf Pentatoniken sind:
(auf Basis C)

C –  D  –  E  –  G  –  A  –  C

C –  D  –  F –  G  –  A  –   C

C – Eb – F –  G   – Bb  – C

C – Eb – F –  Ab – Bb  – C

C – D  –  F –  G   – Bb  – C

Die gleichen Töne in Brüchen:
(Grundton = 1)

1 – 9/8 – 5/4 – 3/2 – 5/3 – 2

1 – 9/8 – 4/3 – 3/2 – 5/3 – 2

1 – 6/5 – 4/3 – 3/2 – 9/5 – 2

1 – 6/5 – 4/3 – 8/5 – 9/5 – 2

1 – 9/8 – 4/3 – 3/2 – 9/5 – 2

Für die Kalkulation nehme ich an, dass alle Töne gleichzeitig und innerhalb einer Oktave erklingen, mit dem jeweiligen Grundton als tiefsten Ton. Ich berechne also die Intervalle von jedem Ton zum Grundton. Dann schaue ich die Nenner aller Intervalle an und suche das kleinste gemeinsame Vielfache (kgV) dieser Nenner. Dieses zeigt an, wie leicht zwischen allen Tönen Resonanzen entstehen können:

Tabelle 1: Schwingungsverhältnisse von 5 Standard-Pentatoniken

Wie ist Tabelle 1 zu lesen? 

Ich habe in den verschiedenen Pentatoniken gleiche Intervalle in die gleiche Spalte gegeben. Das führt zu den Löchern in der Tabelle. So hat die Dur-Pentatonik keine Quart und keine Sept. Des Weiteren habe ich Tönen mit dem gleichen Nenner im Bruch die gleiche Farbe gegeben.

Was zeigen die Farben? – Gleiche Nenner bedeuten bekanntlich, dass die beiden Töne besonders resonant sind, weil bei der Berechnung ihres Frequenzverhältnisses die beiden Nenner sich beim Zusammenklingen  sich «wegkürzen». Das führt zu besonders einfachen, d.h. besonders resonanten Verhältnissen zwischen den Tönen gleichen Nenners. Für Sekunden, grosse Terzen und Quinten habe ich drei verschiedene Grüntöne gegeben. Die Nenner sind nicht gleich, basieren aber immer auf der Primzahl 2, sodass mindestens ein Kürzen mit zwei immer möglich ist. Die verschiedenen Grün mischen sich deshalb immer sehr gut.

Mathematisch gesehen: Mit 8 hat die grosse Sekunde den grössten Nenner aller Intervalle im Pool. Doch das ist kein Problem. 8 ist keine Primzahl, sondern 23, genauso wie der Nenner der grosse Terz 4= 22 ist. Wenn wir nun die Quint zusammen mit der grossen Sekunde erklingen lassen, ist das Verhältnis der beiden Töne 3/2 : 9/8 = 3×8 / 2×9 = 4/3, also eine Quart. Die Quart ist das drittresonanteste Intervall, das innerhalb einer Oktave möglich ist, eine grosse Sekunde und eine Quint sind deshalb perfekt resonant. Das Kürzen erweist sich als wirksam.

Weiter zeigen die Farben in Tabelle 1 auch die verschiedenen Formen von Terz und Sext an. So ist die 5/4-Terz die Durterz und die 6/5 Terz die Mollterz.

Bei den Tonleitern geht es um das Intervall des Melodietones zum Grundton, aber auch um das Verhältnis der Melodietöne untereinander. Das kgV ist ein Indikator dafür, wie naheliegend hier Resonanzen sind. Je tiefer das kgV, umso resonanter ist die Gesamttonleiter. Allerdings kann man auch heikle Töne auslassen, bzw. als speziellen Akzent in einer Melodie einsetzen. Bei den Standard-Pentatoniken mit ihren tiefen kgVs ist das zwar kaum möglich.

Wie unterscheiden sich die fünf Pentatoniken?

Dur und Moll

In der sogenannten Funktionsharmonik, einer speziellen, relativ späten, aber bahnbrechenden europäischen Erfindung, spielt die Terz eine wichtige Rolle. Ob Dur oder Moll steht als Frage immer im Raum. Wir gehen an dieser Stelle (noch) nicht auf die Funktionsharmonik ein, können aber unsere fünf Pentatoniken auch unter diesem Terz-Aspekt ansehen. Dabei sehen wir, dass wir eine Dur-Pentatonik (mit Dur-Terz) und zwei Moll-Pentatoniken (mit Moll-Terz) haben.

Die beiden Moll-Pentatoniken unterscheiden sich darin, dass eine keine Quint hat. Obwohl bei beiden das kgV gleich und tief ist, ist das Fehlen der Quint musikalisch (und resonanzmässig) ein grosses Handicap, weshalb die Mollpentatonik ohne Quint kaum gebräuchlich ist. Unsere übliche Moll-Pentatonik ist diejenige mit der Quint.

Wenn Sie Tabelle 1 ansehen, sehen Sie sofort, den Farbunterschied: Die Moll-Pentatonik hat rötlich gefärbte Töne (Nenner 5), die Dur-Pentatonik hingegen nicht. Die jeweilige Terz zieht weitere Intervalle mit dem gleichen Nenner quasi an. Das ist resonanzmässig begründet. Gleiche Nenner sind Garanten für eine starke Resonanz.

Sus

Das Wort «Sus» kommt von «suspended forth», deutsch «hängende Quarte». Woher kommt der Ausdruck? – In der klassischen europäischen Musik, d.h. in der Funktionsharmonik, ist die Terz entscheidend. Ein Akkord, der keine Terz, dafür die Quart enthält, ist «hängend», das heisst, er muss erst noch aufgelöst werden, die Quart wird als Halbton-Vorhalt gesehen und muss sich zur grossen Terz auflösen. In anderen Stilen, im Jazz, aber auch in der moderneren Pop-Musik, ist ein Sus-Akkord ein Akkord wie jeder andere, eine Farbe wie Moll oder Dur. Auch Sus-Tonleitern gibt es, in der Weltmusik wie auch im Jazz. Die Quart (4/3) ist nach Oktave und Quint das am stärksten resonante Intervall.

Wieder gibt es zwei Formen von Sus-Pentatoniken. Das hohe kgV von 120 der einen Pentatonik rührt daher, dass sie sowohl eine Sekunde (Nenner = 9) wie eine kleine Sept (Nenner = 5) enthält. Hier ist kein Kürzen mehr möglich (wie Sie bei der Berechnung des kgVs selber feststellen können). Die Sus-Pentatonik mit der Sext hingegen hat ein anderes Problem: Quart und Sext bilden mit dem oberen Grundton einen Durakkord (4/3 – 5/3 – 6/3 →4-5-6). Dieser Durakkord auf der Quart ist extrem resonant und wird dadurch so dominant, dass die Tonleiter leicht als Dur-Pentatonik missverstanden werden.

Welche Pentatoniken sind gebräuchlich?

Wegen den oben erwähnten Schwächen der einen Moll und der beiden Sus-Pentatoniken sind eigentlich nur die Dur-Pentatonik und die Moll-Pentatonik mit der Quinte gebräuchlich. Diese beiden Pentatoniken aber sind ubiquitär verbreitet und können ganz leicht gesungen werden. Sie können aber auch auf eine wohlklingende Weise mit anderen Tonleitern/Akkorden verbunden werden, was musikalisch besonders interessant ist. Allein klingen sie etwas banal, in Kombinationen aber zeigen sie ihre ganze Stärke. Für Musiker sind sie perfekte Bausteine.

Zur Fortsetzung schauen wir die Durtonleiter an. Wie resonant ist sie?


Die ist ein Beitrag zur Entstehung der Tonleitern.


 

Erste Tonleitern

Können wir mit den bisher postulierten Kriterien bereits Tonleitern konstruieren, die so attraktiv sind, dass sie real vorkommen? Die Kriterien sehen ja auf den ersten Blick eher künstlich und theoretisch aus – können Sie trotzdem dazu dienen, natürlich gewachsene Tonleitern zu erklären?

In der Tat können sie das. Die mathematischen Kriterien für Resonanz haben offensichtlich in den Ohren der Menschen gewirkt und sie über die Jahrtausende immer wieder Musik erfinden lassen, die als Basisgerüst genau die Tonleitern haben, die wir gleich mit unseren Kriterien mathematisch ableiten können.

Pool von resonanten Tönen

Nur mit unseren Resonanzkriterien haben wir einen ersten Pool konstruiert, der diejenigen Töne enthält, bei denen wir die stärkste Resonanz mit dem Grundton erwarten. Ich zähle diese neun potentiellen Tonleitertöne hier nochmals auf:

Grundton                       1/1   = 1
Grosse Sekund           9/8  = 1.125
Kleine Terz                    6/5   = 1.2
Grosse Terz                  5/4   = 1.25
Quart                               4/3   = 1.333
Quint                               3/2   = 1.5
Kleine Sext                   8/5   = 1. 6
Grosse Sext                  5/3    = 1.666
Kleine Sept                   9/5    = 1.8
Grosse Sept                  15/8 = 1.875
Oktave                            2/1    = 2

Natürlich ist dies nur ein Pool von vielen Tönen und keine sinnvolle Tonleiter. Das Problem ist, dass alle diese Töne zwar einfach und schnell mit dem Grundton in Resonanz eintreten können – doch sind sie auch unter sich resonant?

Zwei Tonleitertöne und Grundton

Es geht also nicht nur um die Resonanz eines Tons mit dem Grundton, sondern zusätzlich um die Resonanz mit weiteren Tönen. Dazu gibt es eine mathematische Grundlage: Wir schauen uns das kgV (kleinstes gemeinsames Vielfaches) der beteiligten Nenner an. Wie das geht, und warum das so ist, ist auf der Seite der Rechengrundlagen für die Resonanzen erklärt.

Das kgV (kleinstes gemeinsames Vielfaches) der Nenner

Die Resonanzkriterien sprechen für eine gute Resonanz, wenn das kgV der beteiligten Nenner möglichst klein ist. Der Grundton hat den Nenner 1, deshalb passt er in jedes kgV, er wird also in jede Kombination gut hinein passen. Wie passen nun die Tonleitertöne zusammen?

Beispiel 1

Quart und Quint: Die Nenner sind 3 und 2, das kgV ist 6, also tief. Auch die Zähler sind tief. Als weiteres Indiz für die Resonanz können wir den Abstand zwischen den beiden Tönen berechnen. Der ist 3/2 : 4/3 = 9/8, also eine grosse Sekunde. 8 ist zwar ein relativ grosser Nenner, was die Resonanz mit anderen Tonleitertönen evtl. stört, doch zur sehr wichtigen Oktave passt sowohl die 8 der Sekunde, wie auch die 2 der Quint sehr gut. Zudem haben beide Töne, Quart und Quint unschlagbar kleine Zähler und Nenner, was sich auf die Mischverhältnisse für weitere Tonleitertöne günstig auswirkt.

Mit anderen Worte: Quart und Quint sind ein perfektes Paar für Resonanz. Mathematisch jedenfalls. Klingt das aber auch gut?

Wie klingt die Kombination subjektiv in unserer Wahrnehmung?

Es geht selbstverständlich nicht nur um Mathematik. Die mentale Welt, unsere subjektive Wahrnehmung entscheidet, ob wir eine bestimme Musik mögen und wie wir sie aufnehmen. Wenn Sie den Grundton mit Quart, Quint und Oktave klingen lassen, können Sie hören, was wir berechnet haben, die Resonanz der vier Töne ist ungetrübt. Die Kombination wirkt sogar eher etwas banal und wir vermissen vielleicht den Pfeffer, den in die Musik, die wir gewohnt sind, die Dissonanzen bringen. Ebenfalls fehlt uns die Süsse der Terzen (Nenner 5 und 6).

Beispiel 2

Wir kombinieren rechnerisch die grosse Sekunde mit der kleinen Terz, also 9/8 mit 6/5: Das kgV ist 40, das Intervall zwischen den beiden Tönen ist 6/5 : 9/8 = 48/45 = 16/15. Mit dem grossen kgV und dem engen Abstand ist dieses Paar in Tonleitern etwas heikler – jedenfalls solange wir das Augenmerk auf eine gute Resonanz legen und alle Schärfen in der Musik vermeiden wollen.

Die gefundenen ersten zwei Tonleitern

Wenn Sie nun Lust haben, können sie selber das kgV und den Abstand zwischen allen oben genannten Tonleitertöne ausrechnen und so einen Pool von Tönen zusammenzustellen, bei dem beides optimiert ist und zwischen allen Tönen möglichst viel Resonanz entstehen kann. Natürlich wollen Sie für die Tonleiter auch mehr Töne als nur gerade drei oder vier auswählen. Wie wär es mit fünf?

Die beiden Tonleitern mit den stärksten Resonanzen, die sich so finden lassen, sind bemerkenswert – es sind nämlich beides sehr bekannte Tonleitern:

1 – 9/8 – 5/4 – 3/2 – 5/3 – 2

1 – 6/5 – 4/3 – 3/2 – 9/5 – 2

Oder mit dem Grundton C:

C – D – E – G – A – C

C – Es – F – G – Bb – C

Pentatoniken

Es handelt sich um zwei Pentatoniken, also um zwei Tonleitern mit fünf Tönen (Das C kommt doppelt, zählt aber nur einmal). Nicht ganz überraschend ist, dass die beiden Tonleitern gute alte Bekannte sind – es handelt sich um nichts anderes als die Dur- und die Mollpentatonik.

Und auch nicht ganz überraschend: Diese beiden Tonleitern kommen global in praktisch allen Kulturen vor, im Regenwald wie in allen Hochkulturen, entweder in Reinform oder dann als das Basisgerüst von anspruchsvolleren Tonleitern.

Theoretische mathematische Überlegungen haben uns dazu geführt, diese beiden Tonleitern zu postulieren, die nicht nur weltweit bekannt, sondern für alle Menschen, kleine Kinder inklusive, schnell verständlich und sehr eingängig sind.

Das ist m.E. kein Zufall. Es sieht so aus, als ob die bisherigen Überlegungen gut mit der beobachteten Realität kompatibel seien.


In der Fortsetzung finden Sie eine Resonanz-Analyse der fünf Standardpentatoniken.


Die ist ein Beitrag zur Entstehung der Tonleitern.


 

Rechnen mit Frequenzen und Intervallen

Auf dieser Seite erkläre ich einige Regeln, die gelten, wenn wir mit Intervallen und ihren Frequenzen rechnen.

Intervalle sind Brüche

Ein Intervall geht von einem tieferen zu einem höheren Ton. Der Bruch des Intervalls rechnet sich, indem die Frequenz des höheren durch die Frequenz des tieferen Tons geteilt wird, z.B.

E  =  330 Hz
A  =  440 Hz

440/330 = 4/3. Das ist eine Quart. Das Intervall der Quart ist immer 4/3, der höhere Ton ist in der Quart genau 4/3 mal so schnell wie der tiefere.

Dabei kommt es nur auf die relativen Werte an, nicht auf die absoluten. Ob ich die Quart beim E beginne (E-A) oder beim C (C-F) ist egal, das relative Frequenzverhältnis ist immer 4/3. Mit anderen Worten, Intervalle sind immer relativ.

Der exponentielle Verlauf der Frequenzen

Wenn wir Intervalle miteinander vergleichen, gibt es eine entscheidende Besonderheit: Der Frequenzverlauf ist exponentiell.

Abb 1: Der Frequenzverlauf ist exponentiell

In Abb. 1 sehen Sie die Frequenzen von verschiedenen A Tönen, vom grossen A bis zum zweigestrichenen a". Auf der Klaviertastatur sieht es so aus, als wären die Abstände zwischen allen vier A’s die gleichen, doch wenn wir die Frequenzen anschauen, ist werden die Abstände immer grösser. Mit anderen Worten: Die Frequenzen steigen schneller an als die Intervalle. Mathematisch gesehen verlaufen die Intervalle linear, während die Frequenzen exponentiell verlaufen. Das hat nun einige Konsequenzen für das Rechnen mit den Intervallen.

Intervalle addieren

Wenn wir zwei Intervalle addieren, dann ist das bezüglich der Frequenzen eine Multiplikation. So hat der Ton (gross) A die Frequenz 110 Hz. Wenn wir eine Oktave höher gehen, so hat das (kleine) a eine Oktave höher die doppelte Frequenz, nämlich 220 Hz. Der Abstand zwischen 110 Hz und 220 Hz ist 110 Hz. Doch diese 110 Hz sind nur dann eine Oktave, wenn wir vom grossen A ausgehen. Wenn wir vom kleinen a jetzt wieder eine Oktave hochgehen, dürfen wir nicht die 110 Hz der tieferen Oktave dazuzählen (was 330 Hz gäbe), sondern wir müssen 220 Hz dazugeben und gelangen so von 220 Hz auf 440 Hz.

Unsere spontane Vorstellung, dass eine Oktave einem Wert in Hz entspricht, ist nicht zutreffend. Die Oktave bedeutet, dass die tiefere Frequenz mit 2 multipliziert wird (mit 2 weil die Oktave immer verdoppelt). Aus der Addition der Intervalle wird also eine Multiplikation. Dieser Wechsel der Rechenoperation ist auf den ersten Blick verwirrlich, doch wenn man es weiss, ist die Sache nicht so schwierig. Wir prägen uns deshalb ein:

Addition (von Intervallen) wird zur Multiplikation (von Frequenzen)

Intervalle subtrahieren 

Nicht überraschen ist es bei der Subtraktion ganz analog. Aus der Subtraktion wird eine Division.

Beispiel

Wir suchen den Abstand zwischen einer grossen Terz und der darüberliegenden Quinte. Unser Musikwissen sagt uns, dass der Abstand zwischen den beiden Intervallen eine kleine Terz ist. Können wir das auch ausrechnen?

Bei diesem Vergleich ziehen wir von der Quint die grosse Terz ab. Aber statt abzuziehen, dividieren wir:

Quinte            = 3/2
Grosse Terz = 5/4

Quinte – grosse Terz →3/2 : 5/4 = 3×4 / 2×5 = 12/10 = 6/5

6/5 ist bekanntlich die kleine Terz. Diese Methode funktioniert immer, für alle Intervalle:

Wir können zur Kontrolle die beiden Terzen wieder addieren und erhalten – selbstverständlich durch eine Multiplikation:

5/4 x 6/5 = 30 / 20 = 3/2

Die grosse und die kleine Terz ergeben auf diese Weise wieder die Quinte (3/2).

Der Vorteil: Wir können kürzen!

Die Verschiebung von Addition und Subtraktion zu Multiplikation und Division hat in Brüchen den Vorteil, dass man wie in den oben stehenden Beispielen oft kürzen kann.

Das hat direkten Einfluss auf die Resonanzen: Immer dann, wenn man kürzen kann, werden die Zahlen in den Brüchen kleiner – und kleine Zähler und Nenner in den Brüchen sind ein Vorteil für eine Resonanz. Dies erklärt auch, weshalb wir in den Intervallen lieber keine höheren Primzahlen als 5 haben. Nicht-Primzahlen wie 6, 8, 9, 10 ff. hingegen lassen sich kürzen, weshalb wir durchaus eine grosse Sekunde (9/8) in den Tonleitern finden, hingegen kein Intervall mit dem Bruch 7/4 oder 8/7.

Tonleitertöne aufeinander beziehen

Wenn wir zwei Töne innerhalb einer Tonleiter vergleichen, um zu entscheiden, ob zwischen ihnen eine Resonanz besteht, beziehen wir sie stets auf den gemeinsamen Grundton. Das hat ganz wesentlich mit dem Charakter von Tonleitern (und Akkorden) zu tun. Auf diesem Grundton (der Tonalität) baut die ganze Tonleiter, bzw. der Akkord auf.

Da die Intervalle stets relativ sind, kommt es nicht auf die absolute Höhe des Tons, d.h. nicht auf die absoluten Frequenzen darauf an. Wir setzen deshalb den

Grundton = 1

Alle anderen Töne geben wir als Intervalle zum Grundton an.

Abstand zwischen zwei Tonleitertönen

Wie verhalten sich z.B. die Quart und die Quint? Die Quart ist 4/3 über dem Grundton, die Quint 3/2. Wenn wir diese beiden Töne vergleichen wollen, können wir den Abstand zwischen ihnen berechnen. Der Abstand ist eine Subtraktion und eine Subtraktion ist bei Frequenzen eine Division. Wir rechne den höheren durch den tieferen Ton und erhalten: 3/2 : 4/3 = 9/8.

9/8 ist eine grosse Sekunde, der Abstand zwischen der Quart und der Quinte ist eine grosse Sekunde.

Resonanz zwischen dem Grundton und zwei Tonleitertönen

Wenn wir zwei Tonleitertöne anschauen, dann haben diese stets den Grundton «im Hinterkopf», bzw. im Fundament. Der Grundton bestimmt die Tonalität, und die Tonalität setzt die relative Tonleiter auf eine absolute Basis.

Wie aber mischen sich die drei Töne – Grundton, Quart und Quinte?

Damit Resonanz entsteht, müssen alle drei Töne auf einer gemeinsame Basis stehen, oder mathematisch ausgedrückt, es braucht so etwas wie eine gemeinsame Zählzeit für alle drei Frequenzen – also für den Grundton (1), die Quart (4/3) und die Quint (3/2).

Dazu suchen wir den kleinsten Nenner, der für alle drei Zahlen aufgeht. Im Beispiel ist es der Nenner 6:

Grundton 1 = 6/6
Quarte  4/3 = 8/6
Quinte  3/2 = 9/6

Dieser gemeinsame Nenner ist immer das kgV, das kleinste gemeinsame Vielfache aller beteiligten individuellen Nenner.

Ein weiteres Beispiel:

Grundton          1 = 15/15
kleine Terz   6/5 = 18/15
grosse Sext  5/3 = 25/15

Das kgV von 1, 5 und 3 ist 15.

Was bedeutet nun dieser gemeinsame Nenner von mehreren Tönen?

Ich stelle die Hypothese auf, dass eine Resonanz sich umso leichter einstellt, je kleiner dieser gemeinsame Nenner ist. Für unsere Resonanzüberlegung gilt auf Basis dieser Hypothese folgendes:

Töne, die einen tiefen gemeinsamen Nenner haben, mischen sich leicht.

Je höher der gemeinsame Nenner ist, umso kleiner ist die interne Resonanz der Töne. 

Über die Konsequenzen dieser Schlüsse berichte ich in den Texten über konkrete Tonleitern und Akkorde.


Hier finden Sie die Übersicht über die Texte zur Drei-Welten-Theorie.