Apple zeigt Software, die Bilder auf Kommando bearbeitet
Quelle: Depositphotos

Apple zeigt Software, die Bilder auf Kommando bearbeitet

Apple hat ein Sprachmodell präsentiert, welches Bilder auf Textkommandos von Benutzern hin bearbeiten kann. Derzeit ist das allerdings nur ein Forschungsprojekt und es ist unklar, ob daraus mehr wird.
8. Februar 2024

     

Apple hat in Zusammenarbeit mit der University of California ein MGIE-Modell (MLLM-Guided Image Editing) vorgestellt, wie "The Verge" berichtet. Die Software ist in der Lage, bereits existierende Bilder zu bearbeiten, indem der Benutzer den Änderungswunsch als Textanweisung eingibt. MGIE interpretiert dann den Text und editiert das Bild dahingehend, sodass die Vorstellungen des Benutzers möglichst gut getroffen werden. Ein Beispielkommando wäre beispielsweise "helle den Himmel auf" oder "entferne die Person hinter unserem Selfie".


Die Software steht via Github zum Download bereit, eine Webdemo ist überdies auf Hugging Face verfügbar. Apple hat nicht gesagt, welche Pläne es für das Modell über die Forschung hinaus hat. Mit der Idee wäre Apple jedenfalls nicht alleine. Zwar versucht sich die Mehrheit der Akteure in diesem Bereich in der generativen KI, aber Adobe bietet mit Firefly in Photoshop beispielsweise ebenfalls ein Tool an, womit sich Bilder per Textkommandos editieren lassen. (dok)


Weitere Artikel zum Thema

Adobe bringt Photoshop Elements und Premiere Elements 2024

23. Oktober 2023 - Mit der Bildbearbeitungssoftware Photoshop Elements 2024 und dem Videoprogramm Premiere Elements 2024 stattet Adobe seine Einsteigerlinie mit KI-gestützten Funktionen und einer frischen Oberfläche aus.

Adobe kündigt revolutionäres Bildbearbeitungstool an

6. Oktober 2023 - Adobe arbeitet an einem revolutionären Bildbearbeitungstool und zeigt in einem Video KI-gestützte Bildbearbeitungsfunktionen. Weitere Details will man erst nächste Woche an der Hauskonferenz Adobe Max verraten.

OpenAI hält Bildbearbeitung bewusst zurück

20. Juli 2023 - OpenAI hat die Bildbearbeitung durch KI aus datenschutzrechtlichen Gründen noch nicht freigegeben, obwohl es technisch machbar wäre. Google geht mit Bard einen Schritt weiter, blockt aber ab, sobald Personenbilder im Spiel sind.


Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Wieviele Fliegen erledigte das tapfere Schneiderlein auf einen Streich?
GOLD SPONSOREN
SPONSOREN & PARTNER