Stützt sich der KI-Musikgenerierungsalgorithmus von FLow Machine im Wesentlichen auf die aktuelle Musiktheorie?

Ein Beispiel für den Musikgenerator mit künstlicher Intelligenz von Flow Machines finden Sie auf Soundcloud .

Wurde diskutiert oder veröffentlicht, inwieweit ihre Algorithmen mit „eingebauten“ musiktheoretischen Standardkonzepten entwickelt wurden, anstatt die KI „die Regeln“ populärer (oder anderer Arten von Musik) ganz alleine anhand von Beispielen lernen zu lassen? ?

Es gibt hier eine Diskussion, die ich gelesen habe, aber nicht wirklich verstehe. Markov-Modelle sind ein allgemeines mathematisches Werkzeug und beziehen sich nicht speziell auf Musik oder menschliche Erfahrung, und das ist in Ordnung. Aber hier versuche ich nur zu fragen, ob die Musiktheorie a priori enthalten war oder nicht.

Verwandte: Algorithmen für die Musikkomposition , aber ich habe hier keine Flow Machines erwähnt.

Ich habe die Seite nur überflogen, aber die Erwähnung von „Machine Learning“ suggeriert mir, dass man dem Algorithmus einfach ein großes Trainingsset an Songs im gewünschten Stil hinterher wirft und ihn dann loslässt. Es gibt jedoch Links zu einigen Artikeln auf der Seite, die wahrscheinlich die Frage beantworten, ich hatte nur keine Zeit, sie zu lesen. Ein kurzer Blick auf die Zusammenfassung und Einführung des ersten verlinkten Artikels scheint meine Vermutung zu stützen: Die einzigen Konzepte, die "eingebaut" sind, sind "zweistimmige Melodie", "Harmonie" und "Meter", aber die Regeln sind es alles gelernt mit Deep Learning.
@JörgWMittag Danke für deine Einschätzung. Ich habe gerade entdeckt, dass ich "Diskussion" nicht richtig verlinkt habe - ich habe es jetzt behoben - es verlinkt auf diese Übersicht , die tiefer geht als die falsch verlinkte Seite. Da ich mich auf die Übersichtsseite konzentriert habe, sind mir die von Ihnen erwähnten Open-Access-Papiere entgangen . Die werde ich mir dieses Wochenende anschauen. Ich bin froh, dass Sie es bemerkt und darauf hingewiesen haben, danke!

Antworten (1)

Ich meine, es verwendet viel Logik, wie es eine Markov-Kette normalerweise tut, nämlich Muster in Eingaben zu verwenden, um eine Ausgabe zu erzeugen. Es werden Melodien, Harmonien, Rhythmen usw. erzeugt, die nicht unbedingt musiktheoretische Konzepte sind. Wenn Sie eine Markov-Kette mit irgendeinem Buch füttern, scheint es logische Sätze zu bilden, aber das wird nicht immer so sein, und die Kette versteht die Sprache nicht wirklich, sie sucht nur nach Mustern, und das Ergebnis kann Sinn machen oder auch nicht. Die gleiche Idee gilt für Musik, wie sie es wird. Es gibt eine Aussage darüber, wie es gemacht wird:

Das Flow Machines-Projekt nimmt Stil aus der Perspektive der Informatik ein: Wie kann eine Maschine Stil verstehen und ihn in ein Computerobjekt verwandeln? Ein Objekt, das Benutzer bearbeiten können, um neue Objekte mit ihren eigenen Einschränkungen zu erstellen. Technisch entwickeln wir neue Technologien basierend auf Markov-Modellen. Markov-Prozesse sind wohlbekannte Werkzeuge, die verwendet werden, um statistische Eigenschaften zeitlicher Sequenzen zu modellieren.

Im Allgemeinen ist die Markov-Kette allein beim Musikmachen ziemlich schwach, und tatsächlich benötigen Sie mindestens eine Markov-Kette zweiter Ordnung, um aus harmonischer Sicht Sinn zu machen, da die Harmonie der tonalen Musik irgendwohin geht. Die Tonart ist auch ziemlich wichtig, da die in der Melodie und Harmonie verwendeten Noten nicht gleich gewichtet werden, zum Beispiel, wie ein C-Dur-Akkord in C-Dur oder F-Dur verwendet wird, ist unterschiedlich. Tatsächlich zeigt das Beispielvideo diese Schwäche ziemlich gut, da die verwendeten Akkorde und die Melodie irgendwie Sinn machen, aber es ist nicht sehr natürlich und hat den mäandrierenden Effekt einer Markov-Kette niedriger Ordnung, da die Melodie keinen guten Punkt findet der Ruhe.

Sie erwähnen Gruppierungsstile, die dazu beitragen, diese Probleme zu minimieren, wie in Ihrem zweiten Link erwähnt:

Wir untersuchen derzeit Stil und Kreativität aus mehreren Perspektiven: Technisch gesehen haben wir erhebliche Fortschritte bei der Entwicklung effizienter Markov-Constraints-Algorithmen gemacht, die viele Arten von Einschränkungen auf beliebige Markov-Modelle anwenden können. Konzeptionell beginnen wir damit, Autorenwerkzeuge für Musikkomposition und Textschreiben zu entwickeln, die es Menschen ermöglichen, Inhalte zu generieren, indem sie den Stil eines bestehenden Autors, möglicherweise sich selbst, manipulieren.

Auch dies ist keine Theorie, sondern nur die Verwendung von Eingaben, um eine Ausgabe zu erzeugen. Die Kette wird weder die tatsächlichen musiktheoretischen Konzepte verstehen, noch wird sie immer Dinge tun, die musikalisch Sinn machen. Es gibt sogar eine große rote Fahne weiter unten auf dieser Seite:

Wenn Ihnen die vorgeschlagene Sequenz nicht gefällt, schlägt das System eine andere vor, und so weiter, bis Sie mit dem Ergebnis zufrieden sind.

Was nur eine Art zu sagen ist: "Nehmen Sie eine weitere Chance und Ihnen gefällt vielleicht, was Sie hören". Die Verwendung einer Markov-Kette ist zwar besser als das zufällige Auswählen von Noten, Dauer usw., aber es ist noch ein langer Weg, sich dessen bewusst zu sein, was sie macht oder die Theorie dahinter.


Ich werde nicht über die genaue Mechanik spekulieren und ohne unter die Haube zu schauen, werde ich es nicht sicher wissen, aber basierend auf allem und dem, was sie beschreiben, steckt wenig bis gar keine Musiktheorie dahinter. Das einzige, was irgendwie theoretisch ist, ist das Gruppieren der Stücke nach "Stil" vor dem Erstellen der Ketten, aber das ist nicht wirklich Musiktheorie, da es nur das Gruppieren von Stücken ist, von denen derjenige, der die Gruppen erstellt hat, dachte, sie seien ähnlich.