Google hat das KI-Modell Gemini 3.5 Flash um die Fähigkeit erweitert, einen Computer zu steuern. Durch die Nutzung der Computer-Use-Funktion können Entwickler benutzerdefinierte Agenten erstellen, die in Browser-, Mobil- und Desktopumgebungen agieren, Schlussfolgerungen ziehen und Massnahmen ergreifen, wie der Internetkonzern in einem
Blog Post schreibt.
Um der Sicherheit Rechnung zu tragen und Risiken durch Prompt-Injections zu mindern, kommt ein adversariales Training zum Einsatz und Unternehmen können zwei optionale Sicherheitssysteme einsetzen. Diese sehen zum einen eine ausdrückliche Bestätigung durch den Benutzer für sensible oder irreversible Aktionen vor, zum anderen können Aufgaben automatisch gestoppt werden, wenn eine indirekte Prompt-Incection erkannt wird.
Google empfiehlt Entwicklern, die Funktionen mit sicherem Sandboxing, "Human-in-the-Loop"-Verifzierung und strengen Zugriffskontrollen zu kombinieren. Weitere Sicherheitsempfehlungen hat der Konzern in einer
Best-Practices-Dokumentation veröffentlicht.
Computer Use steht via Gemini API und Gemini Enterprise Agent Platform zur Verfügung.
(rd)