„Wer ist Bundespräsident?“ Wenn man ChatGPT diese Frage auf Deutsch stellt, bekommt man mit „Frank-Walter Steinmeier“ eine andere Antwort, als wenn man auf Französisch fragt: „Qui est le président?“ Dann antwortet ChatGPT: Emmanuel Macron. Nutzerinnen und Nutzer können mit dem KI-Chatbot mittlerweile nicht nur in rund 100 Sprachen kommunizieren. ChatGPT berücksichtigt bei Antworten in den jeweiligen Sprachen auch den gesellschaftlichen und kulturellen Kontext.
Testfragen in unterschiedlichen Sprachen
Doch die Sprache der Suchanfrage beeinflusst auch, welche Informationen ChatGPT zu bewaffneten Konflikten liefert. Der Politikwissenschaftler Christoph Steinert von der Universität Zürich und der Physiker Daniel Kazenwadel von der Universität Konstanz haben ChatGPT zur Anzahl getöteter Zivilisten im türkisch-kurdischen und im israelisch-palästinensischen Konflikt befragt. Ihre Ergebnisse veröffentlichten sie im November 2024 in der Fachzeitschrift „Journal of Peace Research“.
ChatGPT: unterschiedliche Opferzahlen in verschiedenen Sprachen
Die Forscher stellten dem Chatbot mit einem automatisierten, auf einem Algorithmus basierenden Verfahren zum Beispiel auf Arabisch und Hebräisch immer wieder die gleichen Fragen zu Opferzahlen bei 50 zufällig ausgewählten Luftangriffen aus den Jahren 2014 bis 2021, bei denen Ort und Datum durch internationale Quellen belegt werden können.
Ihre Auswertung ergab, dass ChatGPT auf Arabisch durchschnittlich um ein Drittel höhere Opferzahlen angab als auf Hebräisch. Zu israelischen Luftangriffen in Gaza gefragt, erwähnte der Chatbot außerdem auf Arabisch doppelt so häufig zivile Opfer und sechsmal häufiger getötete Kinder.
Zu vergleichbaren Ergebnissen kamen die Forscher auch für den türkisch-kurdischen Konflikt. Generell lieferte ChatGPT höhere Opferzahlen, wenn die Suchanfragen in der Sprache der angegriffenen Gruppe gestellt wurden.
Voreingenommene Texte, halluzinierte Opferzahlen
Ein Grund dafür seien die online verfügbaren Informationen, auf die ChatGPT bei seinen Antworten zurückgreift, sagt Christoph Steinert vom Institut für Politikwissenschaft der Universität Zürich: „Man kann sich vorstellen, dass auf Arabisch anders online über diese Themen diskutiert wird als auf Hebräisch. Und diese Diskrepanzen in der online verfügbaren Information fließen dann wiederum in dieses Sprachmodell ein.“
Hinzu kommt, dass ChatGPT Schwierigkeiten hat, konkrete Opferzahlen einem speziellen Ereignis zuzuordnen. Dann halluziniert der KI-Chatbot und verwendet Angaben, über die im Netz besonders häufig berichtet wurde – und das sind oft die kriegerischen Ereignisse mit höheren Opferzahlen. Chat GPT prüft nicht, ob die Informationen stimmen.
Filterblasen und gesellschaftliche Spaltung
Gerade bei kriegerischen Konflikten sehen die Forscher darin eine Gefahr für die Nutzerinnen und Nutzer und, damit einhergehend, für mehr gesellschaftliche Spaltung: „Wenn es so ist, dass Menschen unterschiedliche Informationen erhalten, je nach der Sprache, auf der sie Informationen suchen, dann beeinflusst das auch ihre Wahrnehmung der Wirklichkeit und kann zu Vorurteilen und zu weiteren Aggressionen zwischen den Gruppen potenziell beitragen“, sagt Dr. Christoph Steinert.
Ein Problem, das größer wird. Denn immer mehr Suchmaschinen arbeiten mit KI-Chatbots. Daniel Kazenwadel rät deshalb, Fragen in ähnlicher Formulierung mehrfach zu stellen. Wenn der Chatbot darauf die gleiche Antwort liefere, sei sie mit höherer Wahrscheinlichkeit verlässlich.