Mit der Vollversion von GPT-5.5-Cyber zieht
OpenAI im Cybergym-Benchmark an Anthropics Mythos 5 vorbei und erweitert zugleich die Cybersecurity-Plattform Daybreak. OpenAI hatte Daybreak im Mai als KI-Plattform für Sicherheitsexperten vorgestellt ("Swiss IT Magazine"
berichtete).
Die neue Version von GPT-5.5-Cyber erreicht laut
Mitteilung im Cybergym-Benchmark 85,6 Prozent. Mythos 5 kommt in der von OpenAI veröffentlichten Vergleichsgrafik auf 83,8 Prozent und die alte Version von GPT-5.5-Cyber liegt bei 81,8 Prozent. Cybergym misst, ob ein KI-Agent bekannte Schwachstellen in Softwareumgebungen reproduzieren kann. OpenAI spricht vom höchsten Cybergym-Wert, den das Unternehmen bisher mit einem einzelnen Modell gemessen hat.
Die Vollversion von GPT-5.5-Cyber wird im Rahmen einer limitierten Freigabe für vertrauenswürdige Sicherheitsexperten veröffentlicht. Das Modell ist für fortgeschrittene, autorisierte Cybersecurity-Arbeiten gedacht und soll unter anderem grosse Codebasen analysieren, Schwachstellen prüfen, Patches entwickeln und die Ergebnisse für eine manuelle Überprüfung dokumentieren können. Für die meisten Sicherheitsverantwortlichen nennt das Unternehmen weiterhin GPT-5.5 mit Trusted Access for Cyber und Codex Security als Ausgangspunkt.
Auch Codex Security wird ausgebaut. Das Plugin soll defensive Sicherheitsaufgaben direkt in Entwicklungsabläufe bringen, etwa Tiefenscans, die Prüfung aktueller Codeänderungen, Bedrohungsmodelle, Validierungsnachweise und Vorschläge zur Behebung. Weiter heisst es, dass seit dem Start der Codex Security Cloud als Forschungsvorschau im März mehr als 30 Millionen Commits in über 30'000 Codebasen gescannt wurden.
Mit dem Daybreak Cyber Partnerprogramm will
OpenAI die Funktionen zudem über Sicherheitsanbieter und Dienstleister breiter verfügbar machen. Teilnehmende Partner sollen GPT-5.5 mit Trusted Access for Cyber in eigene Produkte und Services integrieren können, während der direkte Zugriff auf das Modell bei den Partnern bleibt.
(dow)