Die
ETH Zürich hat angekündigt, dass im Spätsommer ein selbstentwickeltes Sprachmodell auf Open-Source-Basis veröffentlicht wird. Entwickelt wird es gemeinsam von der Hochschule und dem Schweizer Supercomputer-Zentrum CSCS. Das Schweizer Sprachmodell soll eine vertrauenswürdige und sichere Alternative für Unternehmen sein. Der Fokus liegt auf den Bereichen Transparenz, mehrsprachige Performance und Zugänglichkeit, wie es weiter heisst. Unterstrichen wird dies mit der Tatsache, dass das Modell über 1000 Sprachen beherrschen soll. Es wurde auch mehrsprachig und mit Code- und Mathematikdaten trainiert.
Das Modell wird in zwei Grössen – mit 8 Milliarden und mit 70 Milliarden Parametern – veröffentlicht. Die grössere Version wird gemäss ETH zu den leistungsstärksten, vollständig offenen Modellen weltweit gehören. Trainiert wurde das neue Sprachmodell unter anderem mit dem Supercomputer Alps. Imanol Schlag, Forscher am ETH AI Center: "Völlig offene Modelle ermöglichen Anwendungen, die ein hohes Mass an Vertrauenswürdigkeit gewährleisten, und sie sind notwendig, um die Forschung zu den Risiken und Chancen der KI voranzutreiben." Der Ansatz des offenen und transparnten Modells, das auch reproduzierbare Trainingsdaten beinhaltet, soll zudem Innovation und Vertrauen in die KI fördern.
(dok)