Claude Opus kann Chats in Extremfällen beenden

Quelle: Anthropic

Claude Opus kann Chats in Extremfällen beenden

Claude Opus 4 und 4.1 sind in der Lage, Gespräche in Anthropics Chat-Oberfläche zu beenden, wenn Interaktionen dauerhaft schädlich oder missbräuchlich sind. Die neue Funktion ist als seltenes Notfallmittel gedacht und stellt das Wohlergehen der Nutzer in den Vordergrund.

19. August 2025

In Situationen, in denen schädliche oder missbräuchliche Anfragen trotz mehrfacher Umleitungsversuche nicht abklingen, können Opus 4 und 4.1 Konversationen schliessen. Wie Anthropic auf seiner Website erklärt, soll diese Option nur in seltenen Randfällen zum Einsatz kommen oder wenn Nutzer explizit um das Beenden eines Chats bitten.

Hintergrund ist Anthropics Forschungsarbeit zum potenziellen Wohl von KI-Systemen sowie zur Modellausrichtung und zu Sicherheitsvorkehrungen. Vor der Einführung von Opus 4 führte das Unternehmen eine vorläufige Bewertung der Stabilität durch. Dabei zeigten Selbstauskünfte und Verhaltenspräferenzen von Claude eine klare Abneigung gegen schädliche Aufgaben, Anzeichen offensichtlicher Bedrängnis bei realen schädlichen Anfragen und die Tendenz, problematische Gespräche zu beenden, wenn diese Möglichkeit in Simulationen gegeben war.

Wird ein Chat beendet, können in dieser Konversation keine neuen Nachrichten mehr gesendet werden. Andere Unterhaltungen bleiben unbeeinflusst und ein neuer Chat kann sofort gestartet werden (Bild unten). Um den Verlust langer Verläufe zu vermeiden, sollen sich frühere Nachrichten weiterhin bearbeiten und als neue Zweige fortführen lassen.

Anthropic betrachtet die Funktion als laufendes Experiment und will den Ansatz weiter optimieren. Wer auf überraschende Anwendungsfälle der neuen Funktion stösst, kann direkt in der Oberfläche Feedback geben, etwa mit einem Daumen-Signal oder über die Schaltfläche zum Melden von Problemen. (dow)

(Quelle: Anthropic)

(Quelle: Anthropic)

Weitere Artikel zum Thema

Anthropic Claude bringt Chat-Erinnerungen

13. August 2025 - Anthropics Chatbot Claude kann sich jetzt an vergangene Gespräche erinnern – auf Wunsch durchsucht er frühere Unterhaltungen, fasst sie zusammen und stellt den passenden Kontext bereit.

Anthropic bringt kostenlose KI-App-Erstellung via Claude

29. Juni 2025 - Der KI-Chatbot Claude erlaubt es neu, auf Basis von Nutzeranweisungen selbständig KI-gestützte Applikationen zu erstellen. Die Nutzung ist in der aktuellen Beta-Phase kostenlos.

Anthropic stellt Claude 4 vor

25. Mai 2025 - Anthropic hat mit Claude Opus 4 und Claude Sonnet 4 seine neuesten KI-Modelle lanciert. Versprochen werden verbesserte Programmierfähigkeiten sowie fortgeschrittenes logisches Denken.

Artikel kommentieren

Schnelles, sicheres digitales Kunden-Onboarding

Schnelles, sicheres digitales Kunden-Onboarding

Elektronische Identifikation und Unterschrift in einem durchgängigen, rechtskonformen Prozess erlauben eine signifikante Steigerung der Konversionsraten.

Gemischte Flotten? Mac hilft mit

Gemischte Flotten? Mac hilft mit

Apple Produkte integrieren sich nahtlos in Campus-IT-Infrastrukturen und überzeugen auch wirtschaftlich: Studien* zeigen, dass Mac-Implementierungen effizienter und kostengünstiger sind. Welche weiteren Vorteile Hochschulen erwarten – und warum gemischte Flotten heute einfacher zu managen sind.

Security Leadership: Vom CIO zum Business Enabler

Security Leadership: Vom CIO zum Business Enabler

Cyber-Resilienz entscheidet heute über Vertrauen, Bewertungen und den Unternehmenswert. Schweizer CIOs müssen deshalb aus der Technikrolle heraustreten und Security Leadership leben – mit klaren Prozessen, echten Tests und gelebter Resilienz.

Cybercrime Trends 2026: Wunderwaffe KI

Cybercrime Trends 2026: Wunderwaffe KI

Wer digitale Raubzüge unternehmen möchte, muss längst kein Hacker mehr sein. Künstliche Intelligenz hat die Eintrittshürden in der Cyberkriminalität stark gesenkt. KI-Werkzeuge erleichtern es, Malware zu erzeugen, Phishing-Kampagnen aufzusetzen oder täuschend echte Deepfakes zu erstellen.

Wie Behörden sich auf die Post-Quantum-Ära vorbereiten können

Wie Behörden sich auf die Post-Quantum-Ära vorbereiten können

Quantencomputer kommen schneller als erwartet. Für die öffentliche Verwaltung in der Schweiz ist jetzt die Chance, Bürgerdaten zukunftssicher zu machen.

Digitale Souveränität: Schweizer Daten gehören in die Schweiz

Digitale Souveränität: Schweizer Daten gehören in die Schweiz

Die digitale Transformation verändert die Art, wie Unternehmen Daten verarbeiten. Dabei steigt die Abhängigkeit von globalen Cloud-Anbietern – und damit das Risiko. Denn wer seine Daten ausserhalb der Schweiz speichert, gibt einen Teil seiner digitalen Souveränität ab.

GOLD SPONSOREN

SPONSOREN & PARTNER