Vox ist mein Versuch, den kleinsten Chor der Welt in Form einer Computer-Demo zu programmieren. Die englische Wikipedia beschreibt Demos als „eigenständige, manchmal extrem kleine Computerprogramme, die audio-visuelle Präsentationen erzeugen.“
Dieses Langzeitprojekt reicht zurück bis in den Herbst 2013. Mein Ziel ist es, ein sogenanntes intro zu produzieren, eine ausführbare Datei mit einer Größe von 64kb oder weniger, die sich zu einem vollständigen Chor entfaltet, wenn sie auf einem PC ausgeführt wird.
detail
nach ungefähr 3 Tagen entstand dieser erste Versuch, einen Chor zu imitieren
Für den ersten Entwurf modellierte ich nur die Vokale A, I und U und interpolierte zwischen ihnen. Dieser 3-Tages-Entwurf war sehr vielversprechend und man mag sich fragen, warum das Chorstück nach so vielen Jahren noch immer nicht fertig ist. Die Antwort ist einfach:
Lange Zeit gelang es mir nicht, den Chor ganze Worte singen zu lassen, aber vor allem war ich nie zufrieden mit dem künstlerischen Ausdruck der Stimmen. Sie waren nicht menschlich genug. Ich versuchte mich an stochastischen und anderen Arten zu komponieren, musste aber am Ende einsehen, dass ich mein Ziel nicht erreichen würde, indem ich Zahlen und Graphen auf meinem Bildschirm mit einer Maus einstellte. Ich hatte also potentiell einen Vokalsynthesizer, der in der Lage war, menschliches Singen zu imitieren, aber keine Möglichkeit herauszufinden, auf welche Weise alle Parameter und Timings genau eingestellt werden müssten, damit es auch richtig klingen würde.
diese Version von 2014 beinhaltet einige stochastische Elemente
Eine Lösung für dieses Dilemma war, den Ausdruck echter menschlicher Stimmen aus Klangaufnahmen zu extrahieren. Und ein Durchbruch für mich war hierbei der Einsatz von Algorithmen des Maschinenlernens. Ich bin im Moment in der Lage, die Parameter des Stimmsynthesizers automatisch zu trainieren und anzupassen, so dass er vorher aufgezeichnete Phrasen verschiedener Sänger und Sängerinnen imitieren kann. Der aktuelle Synthesizer basiert auf meiner eigenen Stimme aber ich kann zum Beispiel weibliche Stimmen simulieren, indem ich die angenommene Größe des Mundraums anpasse.
Der nächste Schritt wird sein, diese Phrasen zu vervielfältigen und zu variieren, so dass der Chor am Ende seine gesamte vokale Vielfalt entfaltet. Für Kompositionszwecke habe ich die Intonation (was gesungen wird) von Tonhöhe, genereller Lautstärke und weiteren Parametern (wie man singt) getrennt. Auf diese Weise können die Stimmen dieselben Worte oder Phrasen verwenden, sie aber in anderen Tonhöhen, Lautstärken usw. singen. Die endgültige Komposition, alles zusammenzusetzen und möglichst klein abzuspeichern wird mindestens bis Ende 2020 dauern.