cnt
Microsoft bringt eigene KI-Modelle: MAI-Voice-1 und MAI-1-preview
Quelle: Depositphotos

Microsoft bringt eigene KI-Modelle: MAI-Voice-1 und MAI-1-preview

Microsoft AI stellt zwei hauseigene Modelle vor: MAI-Voice-1 erzeugt ausdrucksstarke Sprache und ist bereits in Copilot Daily und Podcasts im Einsatz, während MAI-1-preview als intern trainiertes Basis-Modell öffentlich auf LMArena getestet wird und bald erste Textfälle in Copilot unterstützen soll.
29. August 2025

     

Mit MAI-Voice-1 liefert Microsoft ein besonders schnelles Sprachmodell für natürliche, ausdrucksstarke Stimmen. Parallel erprobt das Team mit MAI-1-preview sein erstes durchgängig intern entwickeltes Grundmodell, das zunächst über LMArena bewertet und schrittweise in Copilot eingebunden wird. Beides ist Teil der seit 2024 verfolgten Strategie, neben den OpenAI-Modellen eigene Basismodelle aufzubauen (IT Magazine berichtete). Laut Microsoft kann MAI-Voice-1 auf einer einzelnen GPU rund eine Minute Audio in weniger als einer Sekunde erzeugen und eignet sich für Szenarien mit einem oder mehreren Sprechern. Neben der Integration in Copilot Daily und Podcasts lässt sich das Modell in Copilot Labs ausprobieren – inklusive Demos für Erzähldialoge und ausdrucksstarke Sprachvarianten.

MAI-1-preview ist ein Mixture-of-Experts-Modell, das auf etwa 15'000 Nvidia H100-GPUs vor- und nachtrainiert wurde. Es ziele auf gutes Befolgen von Anweisungen und hilfreiche Antworten im Alltag und soll in den kommenden Wochen für ausgewählte Textanwendungsfälle in Copilot ausgerollt werden. Zusätzlich stehe die Vorschau auf LMArena zur Community-Bewertung bereit, und vertrauenswürdige Tester können über eine API Zugang anfragen. Microsoft betont, dass MAI-1-preview die Partnermodelle – etwa von OpenAI sowie aus der Open-Source-Community – nicht ersetzt, man wolle je nach Aufgabe die jeweils besten Modelle orchestrieren.


Strategisch ordnet Microsoft AI die beiden Modelle in die Mission "KI für alle" ein. Das Team verweist zudem auf eine bereits betriebsbereite Next-Gen-Infrastruktur (GB200-Cluster) für die weitere Modellentwicklung und kündigt zusätzliche Verbesserungen in den kommenden Monaten an. (dow)


Weitere Artikel zum Thema

Microsoft sorgt für besseren Klang bei Anrufen in Windows 11

28. August 2025 - Microsoft schaltet in Windows 11 die Stereo-Sprachübertragung über Bluetooth frei. Anrufe und Sprachchats klingen über kompatible Headsets dank Superbreitband nun auch mit aktiviertem Mikrofon klar und in Stereo, so das Versprechen.

Microsoft will Cloud-Speicherung in Word verbessern

27. August 2025 - Demnächst soll man Dokumente in Word für Windows nicht nur auf Onedrive speichern können, sondern auch auf anderen Speicherdiensten. Und man kann festlegen, dass neue Dokumente automatisch in der Cloud erstellt werden.


Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Wieviele Zwerge traf Schneewittchen im Wald?
GOLD SPONSOREN
SPONSOREN & PARTNER