Software wird heutzutage oft mit Unterstützung durch künstliche Intelligenz entwickelt. Dies gilt naturgemäss auch für die Entwicklung von Android-Apps. Doch es gibt eine Vielzahl möglicher Alternativen – immer wieder neue KI-Modelle und neue Versionen schiessen wie Pilze aus dem Boden. Jetzt erhalten Android-Entwickler bei der Entscheidung für das bestgeeignete Modell Hilfe von
Google: Unter dem Titel
Android Bench publiziert der Hersteller ein Leaderboard der besten LLMs für die Entwicklung von Android-Apps.
Dafür hat Google die meist verwendeten LLMs eine Reihe von spezifischen Benchmark-Tests unterzogen: "Wir haben den Bereichen Priorität eingeräumt, die unseren hohen Standard für die Entwicklung skalierbarer Android-Anwendungen widerspiegeln, darunter Jetpack Compose für die Benutzeroberfläche, Coroutinen und Flows für asynchrone Programmierung, Room für Persistenz und Hilt für die Abhängigkeitsinjektion." Ausserdem habe man Bereiche berücksichtigt, für die Entwickler häufig Hilfe suchen, wie etwa Navigationsmigrationen, Gradle-/Build-Konfigurationen oder den Umgang mit grundlegenden Änderungen bei SDK-Updates. Insgesamt umfasst der Benchmark 100 Tasks, die aus fast 39'000 Pull Requests auf Github stammen.
An der Spitze Top-9-Liste findet sich das Google-eigene Modell Gemini 3.1 Pro Preview mit einem Score von 72,4 Punkten. Auf Platz 2 folgt Claude Opus 4.6 von Anthropic mit 66,6 Punkten. Und den dritten Rang nimmt OpenAIs GPT-5.2-Codex mit 62,5 Punkten ein. Dahinter folgen weitere Modelle der drei Anbieter mit Gemini 2.5 Flash als Schlusslicht. Die Punktzahl entspricht dem Prozentsatz, mit dem die 100 Testfälle in jeweils zehn Durchläufen erfolgreich absolviert wurden.
(ubi)