cnt
Claude Opus kann Chats in Extremfällen beenden
Quelle: Anthropic

Claude Opus kann Chats in Extremfällen beenden

Claude Opus 4 und 4.1 sind in der Lage, Gespräche in Anthropics Chat-Oberfläche zu beenden, wenn Interaktionen dauerhaft schädlich oder missbräuchlich sind. Die neue Funktion ist als seltenes Notfallmittel gedacht und stellt das Wohlergehen der Nutzer in den Vordergrund.
19. August 2025

     

In Situationen, in denen schädliche oder missbräuchliche Anfragen trotz mehrfacher Umleitungsversuche nicht abklingen, können Opus 4 und 4.1 Konversationen schliessen. Wie Anthropic auf seiner Website erklärt, soll diese Option nur in seltenen Randfällen zum Einsatz kommen oder wenn Nutzer explizit um das Beenden eines Chats bitten.

Hintergrund ist Anthropics Forschungsarbeit zum potenziellen Wohl von KI-Systemen sowie zur Modellausrichtung und zu Sicherheitsvorkehrungen. Vor der Einführung von Opus 4 führte das Unternehmen eine vorläufige Bewertung der Stabilität durch. Dabei zeigten Selbstauskünfte und Verhaltenspräferenzen von Claude eine klare Abneigung gegen schädliche Aufgaben, Anzeichen offensichtlicher Bedrängnis bei realen schädlichen Anfragen und die Tendenz, problematische Gespräche zu beenden, wenn diese Möglichkeit in Simulationen gegeben war.


Wird ein Chat beendet, können in dieser Konversation keine neuen Nachrichten mehr gesendet werden. Andere Unterhaltungen bleiben unbeeinflusst und ein neuer Chat kann sofort gestartet werden (Bild unten). Um den Verlust langer Verläufe zu vermeiden, sollen sich frühere Nachrichten weiterhin bearbeiten und als neue Zweige fortführen lassen.

Anthropic betrachtet die Funktion als laufendes Experiment und will den Ansatz weiter optimieren. Wer auf überraschende Anwendungsfälle der neuen Funktion stösst, kann direkt in der Oberfläche Feedback geben, etwa mit einem Daumen-Signal oder über die Schaltfläche zum Melden von Problemen. (dow)


Weitere Artikel zum Thema

Anthropic Claude bringt Chat-Erinnerungen

13. August 2025 - Anthropics Chatbot Claude kann sich jetzt an vergangene Gespräche erinnern – auf Wunsch durchsucht er frühere Unterhaltungen, fasst sie zusammen und stellt den passenden Kontext bereit.

Anthropic bringt kostenlose KI-App-Erstellung via Claude

29. Juni 2025 - Der KI-Chatbot Claude erlaubt es neu, auf Basis von Nutzeranweisungen selbständig KI-gestützte Applikationen zu erstellen. Die Nutzung ist in der aktuellen Beta-Phase kostenlos.

Anthropic stellt Claude 4 vor

25. Mai 2025 - Anthropic hat mit Claude Opus 4 und Claude Sonnet 4 seine neuesten KI-Modelle lanciert. Versprochen werden verbesserte Programmierfähigkeiten sowie fortgeschrittenes logisches Denken.


Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Wie hiess im Märchen die Schwester von Hänsel?
GOLD SPONSOREN
SPONSOREN & PARTNER