OpenAI hat zwei neue, sogenannte Open-Weigth-Sprachmodelle veröffentlicht, welche die Bezeichnungen GPT-OSS-120b und GPT-OSS-20b tragen. Die Modelle sind unter der Apache-2.0-Lizenz frei verfügbar und wurden für eine breite Anwendbarkeit auf lokaler Infrastruktur konzipiert – laufen also beispielsweise lokal auf einem Laptop. Ziel ist es laut
OpenAI, leistungsfähige Reasoning-Modelle mit niedrigen Systemanforderungen bereitzustellen.
GPT-OSS-120b verfügt laut OpenAI über 117 Milliarden Parameter und benötigt für den Betrieb eine einzelne GPU mit 80 GB Speicher. Das kleinere Modell GPT-OSS-20b kommt mit 21 Milliarden Parametern aus und lässt sich bereits auf Geräten mit 16 GB Arbeitsspeicher ausführen. Beide Modelle zeigen laut dem AI-Giganten in Benchmarks gute Ergebnisse bei Reasoning-Aufgaben, Tool-Nutzung sowie im Gesundheits- und MINT-Bereich. Laut OpenAI übertreffen sie bei bestimmten Aufgaben vergleichbare offene Modelle und nähern sich der Leistung proprietärer Systeme wie O3- oder O4-Mini an. Die Modelle wurden auf eine kontextabhängige Steuerung des Denkaufwands trainiert, um Effizienz bei Routineaufgaben sowie komplexem Reasoning zu ermöglichen.
Weitere Informationen zu den beiden Modellen und deren Leistung liefert OpenAI
an dieser Stelle.
(mw)