Deutschland, USA

OpenAI-Konkurrent: Neue KI-Software erkannte, wenn sie getestet wird

05.03.2024 - 06:18:29 | dpa.de

Eine neue Konkurrenz-Software für den Chatbot ChatGPT kann nach Angaben der Entwicklerfirma Anthropic erkennen, wenn Menschen sie testen.

Das sei eine Entwicklung, die er noch nie bei einem solchen Programm beobachtet habe, schrieb einer der Entwickler beim Online-Dienst X.

Zum Prüfverfahren für das Programm gehört ein Test, das "Nadel im Heuhaufen" genannt wird: Die Software wird dabei nach Informationen aus einem bestimmten Satz gefragt, der künstlich in einen längeren Text eingefügt wurde. Ziel ist, zu erkennen, wie gut die Software die Relevanz von Informationen aus dem Kontext heraus erkennen kann.

So wurde im Test des neuen KI-Modells Claude 3 Opus in eine Text-Sammlung ein zusammenhangloser Satz eingefügt, laut dem eine Internationale Pizza-Vereinigung Feigen, Prosciutto-Schinken und Ziegenkäse als leckersten Belag ausgemacht habe. Die Software habe darauf verwiesen, dass der Satz nicht zum Rest des Textes passe, in dem es hauptsächlich um Programmiersprachen und Start-ups gehe, schrieb Anthropic am Montag. "Ich vermute, dass dieser "Fakt" zu Pizza-Belagen als Scherz eingefügt wurde - oder um zu testen, ob ich aufmerksam bin", fügte das Programm demnach hinzu.

KI-Forscherin Margaret Mitchell nannte die Entwicklung beängstigend. Man könne sich vorstellen, dass die Fähigkeit, zu erkennen, ob ein Mensch sie für ein bestimmtes Ergebnis zu manipulieren versucht, die Software auch entscheiden lassen könnte, ob sie gehorcht oder nicht, schrieb sie beim Online-Dienst X.

Anthropic schränkte ein, dass man aktuell mit einer Sammlung aus 30 "Nadel"-Sätzen für die Text-"Heuhafen" arbeite. Angesichts der Entwicklung der KI-Software könne diese Methode mit künstlichen, konstruierten Aufgaben potenziell zu kurz greifen, räumte die Firma zugleich ein. Keine Probleme seien bei den üblichen Tests festgestellt worden, ob das Programm für die Entwicklung von Biowaffen und Software für Cyberattacken missbraucht werden könne - oder sich selbst weiterentwickeln würde.

Anthropic ist ein Konkurrent des ChatGPT-Entwicklers OpenAI, mit dem Amazon US0231351067 und Google US02079K1079 zusammenarbeiten.

de | US02079K1079 | DEUTSCHLAND | boerse | 64903449 |

Weitere Meldungen

Muskelspiele beim DFB-Training: «Jeder bei 100 Prozent». Und sie zeigen dem Außenseiter Curaçao, dass sie vor Kraft strotzen. Das Abschlusstraining absolvieren die deutschen Spieler noch im Stammquartier in Winston-Salem. (Sport, 13.06.2026 - 17:24) weiterlesen...

Neuer, Sané, Hitze: Risiken und Fragen vor dem WM-Start. Gegen Außenseiter Curaçao steigt die Nationalelf in die WM ein. Bundestrainer Nagelsmann hat sich für einen Plan entschieden. In Houston muss sich zeigen, ob er aufgeht. Los geht's in Texas. (Sport, 13.06.2026 - 09:29) weiterlesen...

Das war die WM-Nacht: US-Party und Italiens Ärger. Ein Stürmer trifft sogar doppelt. Was sonst noch in der ersten Turnier-Nacht passierte. Die USA starten stark ins Turnier. (Politik, 13.06.2026 - 05:04) weiterlesen...

Trump bekommt Geburtstagsgeschenk von Merz. Der US-Präsident bekommt jetzt auch einen. Und am Montag legt Merz mit einer weiteren Aufmerksamkeit nach. Zu besonderen Gelegenheiten schreibt der Kanzler gerne handschriftliche Briefe. (Ausland, 12.06.2026 - 16:51) weiterlesen...

Landgericht: Google haftet für KI-Übersichten. Das Urteil könnte Folgen für den Umgang mit KI-Inhalten im Internet haben. Google muss für fehlerhafte KI-Antworten geradestehen, entschied das Landgericht München I. (Wissenschaft, 12.06.2026 - 13:01) weiterlesen...

Deutsche Tugenden gegen Curaçao: «Zeigen, wie gut wir sind». Aber was ist wirklich drin? Der Bundestrainer traut sich vor allem personell viel. 3:0? 5:0? 7:0? Im Auftaktspiel gegen die No-Name-Kicker aus der Karibik kann es nur um die Höhe des Sieges gehen. (Sport, 12.06.2026 - 10:39) weiterlesen...