„Ich habe mit 8 Jahren angefangen, jetzt bin ich 30 – und das soll jetzt alles zu Ende sein?“ So wie Maresa Sedlmeir fürchten viele, es könne bald vorbei sein mit dem Synchronisieren. Das Schreckensszenario: Dank künstlicher Intelligenz können sogar die Stimmen von Brad Pitt oder Angelina Jolie Deutsch sprechen. Wie das funktioniert, erklärt Stefan Sporn, Jurist und Mitgründer einer Firma, die den rechtsicheren Einsatz von Einsatz von KI in der Synchronisation verspricht.
Zunächst versichert er aber: Ohne Menschen geht da nichts. „Der Mensch ist das entscheidende Element zu einem hochqualitativen Ergebnis bei einer Synchronisation. Egal, ob es die traditionelle oder die Herstellungsweise mit KI ist.“ Um eine lippensynchrone Sprachfassung zu erhalten, brauche man ein lippensynchrones Buch, „und das wird – wie bisher auch – von ganz normalen Menschen erstellt.“
Zwei Sprecher für alle Rollen in einem Film
Entwarnung? Nicht ganz, erklärt der Jurist mit Schwerpunkt Urheberrecht: „Wir brauchen sie nicht mehr im gleichen Umfang, wir brauchen für 40 Rollen, die ein durchschnittlicher Film hat, nur noch zwei Sprecherinnen, nämlich einen Mann oder eine Frau.“ Das heißt, diese zwei Personen sprechen das gesamte Drehbuch ein. Und dann wird ein neues, von der KI generiertes Stimmprofil hinzugerechnet. Das, was da eingesprochen worden ist, klingt danach so, als hätte Brad Pitt oder George Clooney in perfektem Deutsch die eigene Synchronfassung aufgenommen. Das Verfahren nennt sich „speech to speech“, dabei wird eine Sprachaufnahme durch ein KI-generiertes Stimmprofil verändert.
Hans Clarin könnte Pumuckl ewig sprechen
Bekanntestes Beispiel dafür: die neuen Pumuckl-Verfilmungen von Marcus H. Rosenmüller, in denen die Kobold-Stimme nach wie vor vom 2005 verstorbenen Hans Clarin kommt. Der – bzw. sein Sprachklon – kann so für alle Ewigkeit in jeder Neuverfilmung den Pumuckl sprechen. Und daher wundert es nicht, dass der KI-Unternehmensgründer Stefan Sporn vor allem Chancen in der neuen Technik sieht. Ein großes Ziel ist es dabei, dem Original näher zu kommen. Wenn Brad Pitt spricht, dann werden ihn die Franzosen auf Französisch hören und die Deutschen auf Deutsch. Natürlich sei das eine Illusion – aber gehe es darum nicht beim Film? Und vielleicht klänge dann die KI, das Künstliche, sogar echter, zumindest näher am Original als wir alle es bisher für möglich gehalten haben.
Was passiert mit den geliebten Synchron-Stimmen?
Was aber sicher bleiben wird: ein Phantomschmerz. Viele werden die Stimmen vermissen, die sie mit den Gesichtern von Jolie oder Redford über Jahrzehnte verbunden haben – ganz egal, dass das nie deren echte Stimmen waren. Und was ganz bestimmt fehlen wird: das Zusammenspiel zwischen Menschen, die Eigenarten von Sprechenden und schlicht: Menschlichkeit. Findet die Sprecherin Caroline Ebner: „Ich glaube auch, dass auch unsere Fehler wichtig sind. Und unsere Stimme nicht nur unsere Stimme ist, sondern auch eine Lebenshaltung mitträgt. Es wird sich entwickeln, wie es sich entwickelt. Aber ich glaube, dass niemand in der Welt unersetzlich ist – und gleichzeitig ist keiner ersetzbar.“