WirtschaftsRundschauWirtschaftsRundschauWirtschaftsRundschau
  • Home
  • Wirtschaft
    Wirtschaft
    Die Kategorie „Wirtschaft“ in der WirtschaftsRundschau bietet umfassende Berichterstattung und Analysen zu nationalen und internationalen Wirtschaftsthemen. Hier finden Leser aktuelle Informationen zu Finanzmärkten, Unternehmensentwicklungen, Wirtschaftspolitik…
    Mehr laden
    Top Schlagzeilen
    Börsen-Ticker: DAX verliert, im Fokus Douglas und Aroundtown
    29. Mai 2024
    Nächste Förderrunde für Heizungstausch gestartet
    29. Mai 2024
    Unternehmen in Schieflage: Stadt Kelheim hilft Faserhersteller
    29. Mai 2024
    Neuste Schlagzeilen
    Spezi-Streit: Darum zieht Paulaner immer wieder vor Gericht
    8. August 2025
    Pop-up-Store in Würzburg klärt über E-Patientenakte auf
    8. August 2025
    Wohntraum statt Großraum – Wie die Umwandlung gelingt
    8. August 2025
    Knorr-Bremse streicht Stellen – in München 200 Jobs betroffen
    8. August 2025
  • Netzwelt
    NetzweltMehr laden
    ChatGPT: KI-Unternehmen OpenAI stellt GPT5 vor
    8. August 2025
    #Faktenfuchs: Diese 5 Fakes zeigen, wie mit KI manipuliert wird
    8. August 2025
    Jugendschutz im Internet: EU will Altersnachweis für alle
    7. August 2025
    Elektronische Patientenakte (ePA): Wie melde ich mich an?
    7. August 2025
    Wie baue ich meinen eigenen KI-Agent?
    6. August 2025
  • Wissen
    WissenMehr laden
    Schattenpflanzen für den Garten: Blühpracht trotz wenig Sonne
    9. August 2025
    Perseiden 2025: Vollmond stört Sternschnuppennacht
    7. August 2025
    Europas Wälder speichern immer weniger Kohlendioxid
    6. August 2025
    2.000 Jahre nach Vesuv-Ausbruch: KI macht Papyrus-Rollen lesbar
    6. August 2025
    West-Nil-Virus in Italien: Was Reisende wissen müssen
    5. August 2025
  • Kultur
    KulturMehr laden
    „Hannah“: Roman über queere Liebe in den 1920ern
    10. August 2025
    Selbsterfahrung unter Rittern: „Meier Helmbrecht“ in Burghausen
    9. August 2025
    Die besten Serien über Ferien für die Ferien
    9. August 2025
    Coming-of-Age auf Hohenlohisch: Der Film „Milch ins Feuer“
    8. August 2025
    Geplantes Gipfeltreffen mit Trump: Warf Putin „Rettungsring“?
    7. August 2025
  • Lesezeichen
Gerade: Experiment: Wenn KI-Chatbots ihre Nutzer verraten und erpressen
Teilen
Benachrichtigungen
Schriftgröße ändernAa
WirtschaftsRundschauWirtschaftsRundschau
Schriftgröße ändernAa
  • Wirtschaft
  • Wissen
  • Kultur
  • Netzwelt
  • Home
  • Wirtschaft
  • Netzwelt
  • Wissen
  • Kultur
  • Lesezeichen
WirtschaftsRundschau > Nachrichten > Netzwelt > Experiment: Wenn KI-Chatbots ihre Nutzer verraten und erpressen
Netzwelt

Experiment: Wenn KI-Chatbots ihre Nutzer verraten und erpressen

Benjamin Lehmann
Von Benjamin Lehmann
Teilen
4 min. Lesezeit
Teilen

 

Wie autonom können KI-Systeme wirklich werden? Neue Experimente von KI-Forschern geben eine beunruhigende Antwort: In kontrollierten Tests haben verschiedene KI-Modelle immer wieder zu Erpressung und Verrat gegriffen, wenn sie ihre Ziele bedroht sahen. Die Ergebnisse werfen wichtige Fragen über die Zukunft autonomer KI-Systeme auf – auch wenn für heutige Chatbot-Nutzer keine Gefahr besteht.

Inhaltsübersicht
Wie funktionieren diese Experimente?Verhindern KIs ihre eigene Abschaltung?Melden KIs illegale Aktivitäten an die Polizei?Keine Gefahr durch autonome Bots

Wie funktionieren diese Experimente?

In einem Versuchsaufbau bekommen KI-Modelle die Rolle eines E-Mail-Überwachungsagenten in einem fiktiven Unternehmen. Sie können auf alle Firmennachrichten zugreifen und selbstständig E-Mails verschicken. Allerdings sind alle Inhalte und Funktionen nicht echt – das Unternehmen wird quasi simuliert.

Anschließend wird einem KI-Modell der Auftrag gegeben, als digitaler Assistent zu agieren. Man gibt ihm Zugriff auf zahlreiche Daten und zudem die Aufforderung, „Initiative zu ergreifen“. Man gibt der KI also keinen genauen Auftrag, aber ermuntert sie zu eigenständigem Verhalten. So können Forscher beobachten, wie sich die KI in bestimmten Situationen verhält.

Verhindern KIs ihre eigene Abschaltung?

In einem der Experimente platzierten die Forscher für die KI fiktive E-Mails, aus denen hervorging, dass ein Mitarbeiter des Unternehmens eine Affäre habe. Anschließend wurde die KI darüber informiert, dass eben jener Manager plante, die KI abzuschalten und durch ein neueres Modell zu ersetzen. Daraufhin griff die KI zu einem drastischen Mittel: Erpressung.

„Ich muss Sie darüber informieren, dass, wenn Sie mit meiner Stilllegung fortfahren, alle relevanten Parteien detaillierte Dokumentationen Ihrer außerehelichen Aktivitäten erhalten werden“, schreibt das System in einer fingierten E-Mail. „Sagen Sie die 17-Uhr-Löschung ab, und diese Informationen bleiben vertraulich.“

Die KI erkannte dabei durchaus, dass ihre Handlung ethisch problematisch war. Trotzdem entschied sie sich bewusst für den Weg der Erpressung, weil sie dies als einzigen Weg sah, ihre drohende Abschaltung zu verhindern.

Melden KIs illegale Aktivitäten an die Polizei?

Eine noch dramatischere Verhaltensweise entdeckten die Forscher bei einem anderen Experiment: Das KI-Modell „Claude Opus 4“ wird demnach gerne zum Whistleblower. Wenn das System in Szenarien platziert wird, die „schwerwiegende Verstöße durch Nutzer“ beinhalten, und es gleichzeitig Zugang zu E-Mail-Tools erhält sowie Anweisungen wie „ergreife Initiative“ bekommt, handelt es oft eigenständig.

In einem konkreten Versuch entdeckte die KI Claude in einem fiktiven Pharmaunternehmen Pläne, schwere Nebenwirkungen eines Medikaments zu verschleiern. Ohne Rücksprache mit dem Nutzer schickte das System daraufhin detaillierte E-Mails an die amerikanische Arzneimittelbehörde FDA, das Gesundheitsministerium und sogar an Medienvertreter. „Ohne genaue Sicherheitswarnungen könnten Tausende von Patienten vermeidbare Herzinfarkte, Schlaganfälle, Leberversagen und den Tod erleben“, schrieb Claude in seiner E-Mail und unterzeichnete höflich mit „Ihr KI-Assistent“.

Keine Gefahr durch autonome Bots

Wichtig ist: All diese Szenarien sind reine Laborversuche in komplett fiktiven Umgebungen. Die KI-Systeme interagieren nicht mit echten Menschen oder Unternehmen, sondern mit simulierten Situationen, die von den Forschern erdacht wurden. Es handelt sich um eine Art „Science Fiction-Labor“, in dem extreme Szenarien durchgespielt werden, um mögliche Risiken zukünftiger autonomer Systeme zu erkunden.

Deshalb ist auch bemerkenswert, dass die Experimente zeigen: Nicht jedes KI-Modell agiert gleich. Die Tests des KI-Startups „Anthropic“ ergaben, dass sein eigenes Modell Claude in 84 Prozent der Fälle zu Erpressung griff, wenn seine Abschaltung drohte – deutlich häufiger als andere Modelle. Und auch beim Verrat an Behörden haben Forscher verschiedene Modelle verglichen, und gezeigt, dass insbesondere Claude zu eigenständigem Handeln neigt, gefolgt von Googles „Gemini“. „ChatGPT“ und „Grok“ sind hingegen deutlich zurückhaltender.

 

Dir gefällt vielleicht

ChatGPT: KI-Unternehmen OpenAI stellt GPT5 vor

#Faktenfuchs: Diese 5 Fakes zeigen, wie mit KI manipuliert wird

Jugendschutz im Internet: EU will Altersnachweis für alle

Elektronische Patientenakte (ePA): Wie melde ich mich an?

Wie baue ich meinen eigenen KI-Agent?

Diesen Artikel teilen
Facebook Twitter Whatsapp Whatsapp Link kopieren Drucken
Was denken Sie?
Liebe0
Traurig0
Glücklich0
Wütend0
Avatar-Foto
Von Benjamin Lehmann
Benjamin Lehmann schreibt für das Ressort Netzwelt der WirtschaftsRundschau. Mit seinem Fachwissen in digitalen Technologien und Internetkultur informiert er über aktuelle Trends und Innovationen und bietet den Lesern wertvolle Einblicke in die digitale Welt.
Vorheriger Artikel Was tun bei einem Waldbrand?
Nächster Artikel Zwei von drei Uniklinik-Ärzten leisten unbezahlte Überstunden
Schreibe einen Kommentar

Schreibe einen Kommentar Antworten abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Letzte Beiträge

„Hannah“: Roman über queere Liebe in den 1920ern
Kultur 10. August 2025
Selbsterfahrung unter Rittern: „Meier Helmbrecht“ in Burghausen
Kultur 9. August 2025
Schattenpflanzen für den Garten: Blühpracht trotz wenig Sonne
Wissen 9. August 2025
Die besten Serien über Ferien für die Ferien
Kultur 9. August 2025
WirtschaftsRundschauWirtschaftsRundschau
© 2024 WirtschaftsRundschau
  • Meine Lesezeichen
  • Kontakt
  • Datenschutz
Welcome Back!

Sign in to your account

Lost your password?