21 Songs. Diese Zahl taucht auf, wenn Sängerin Balbina ihren Namen in das Suchfeld eingibt. Das Ergebnis gibt an, wie viele ihrer Werke vermutlich benutzt wurden, um KI-Musikgeneratoren wie Suno, Udio oder Google Lyria zu trainieren. Das US-Magazin „The Atlantic“ hat das frei zugängliche Suchtool [externer Link] Mitte Juni als Teil ihres laufenden Rechercheprojekts „AI Watchdog“ [externer Link] veröffentlicht.
Damit lüftet die Zeitschrift das streng gehütete Geheimnis, auf welchen Songs KI-Musik basiert. „Für mich fühlt sich das nicht überraschend an“, kommentiert Balbina dazu. Ich war eher gespannt darauf, welche Songs und wie viele es sind.“ Die Sängerin hatte bereits befürchtet, dass KI-Firmen sich mutmaßlich an ihrer Musik bedienen.
Über 20 Millionen Songs
Vier Datensätze mit insgesamt über 20 Millionen Musiktiteln hat „The Atlantic“ im Zuge der Recherche gefunden. Darunter sind Songs internationaler Stars wie Taylor Swift, Billie Eilish oder Bad Bunny, aber auch deutscher Artists wie Tocotronic, oder The Notwist. Vom Megastar bis zur kleinen Indieband, ist genreübergreifend alles dabei. Gleichzeitig sind diese Datensätze wohl nur ein Ausschnitt der enormen Datenmengen, die KI-Entwickler nutzen. „The Atlantic“-Journalist Alex Reisner hat sie unter anderem in Forschungspapieren der Firmen gefunden.
So reagieren Artists
Balbina ist nicht die Einzige, die kritisiert, dass ihre Musik ohne ihr Einverständnis fürs KI-Training genutzt wird. Viele Urheber reagieren empört. „Trainiert keine KI mit eurem Genie“, forderte etwa US-Sängerin SZA am 20. Juni in einer Instagram-Story. „Wenn du Künstler bist und das unterstützt, bist du abstoßend – und es gibt nichts, was du sagen könntest, um dich zu verteidigen.“
Mit ihrer Kritik zielt sie auch auf den Musiker und Produzenten Diplo, der für den Einsatz von KI in der Musik argumentiert: „Wenn du kreativ bist, musst du mit der Zeit gehen – oder aufgeben und Uber-Fahrer werden“, sagte er im April 2026 in einem viralen Post auf X [externer Link]. Marken blieben wichtig – menschliche Stimmen nicht: „KI liefert mir die beste Stimme, ich brauche niemanden mehr, der den Song singt.“ Diplo hat selbst ins KI-Startup Aaru investiert. Auch Produzenten wie Will.i.am und Timbaland haben Geld in KI-Unternehmen gesteckt.
Beweist ein Eintrag, dass KI mit dem Song trainiert wurde?
Ein Eintrag in den nun von „The Atlantic“ veröffentlichten Datensätzen bedeutet nicht zwangsläufig, dass KI-Musikgeneratoren wie Suno oder Udio mit dem Song trainiert wurden. Es handelt sich nicht um einen Beweis, sondern um ein Indiz. Im Fall von Google Lyria konnte „The Atlantic“ allerdings nachweisen [externer Link] , dass das Unternehmen mindestens einen der vier Datensätze zum KI-Training benutzt hat. Dieser besteht aus rund 100.000 Songs, bereitgestellt vom Free Music Archive. Auch das Unternehmen Stability AI soll Teile aus diesem Datensatz genutzt haben.
Vor allem zeigt die Recherche, welche Mengen an Daten und welche Bandbreite an Musik den Entwicklern von KI-Anwendungen potenziell zur Verfügung stehen. KI-Unternehmen würden oft behaupten, sie nutzten nur frei zugängliche Musik, schreibt Alex Reisner im Artikel zu seinem Fund. Die Datensätze würden jedoch zeigen, dass das nicht stimme. Mithilfe automatisierter Programme könnten die Entwickler urheberrechtlich geschützte Songs beispielsweise von YouTube und Spotify downloaden und dabei Werbung und Logins umgehen – die Künstlerinnen und Künstler gingen leer aus. Das tatsächlich frei zugängliche Free Music Archive wiederum war ursprünglich nicht für eine kommerzielle Nutzung vorgesehen.
Was sagen die KI-Unternehmen?
Die KI-Unternehmen selbst argumentieren, sie verletzten keine Urheberrechte, da es sich um „Fair Use“ handle, eine Ausnahme im US-Recht, welche die Nutzung von geschütztem Material erlaubt, sofern dies der öffentlichen Bildung und Anregung geistiger Produktion dient.
Die Funde von „The Atlantic“ liefern neuen Stoff für laufende Urheberrechtsstreitigkeiten. Große Musiklabels hatten bereits 2024 gegen Suno und Udio geklagt, teilweise einigten sie sich außergerichtlich.

