Ollama erweitert sein Tool, das vor allem dafür bekannt ist, KI-Sprachmodelle lokal auf dem eigenen Rechner laufen zu lassen, um eine erste Bildfunktion. Nach
Angaben von Ollama startet die Bildgenerierung zunächst auf dem Mac und wird wie gewohnt über das Terminal gesteuert.
Zum Erzeugen eines Bildes nutzt man laut Ollama einen Befehl wie ollama run x/z-image-turbo und ergänzt danach den gewünschten Prompt. In kompatiblen Terminals wie Ghostty oder iTerm2 sollen die Ergebnisse direkt im Terminal angezeigt werden, zusätzlich werde die Bilddatei im aktuellen Ordner gespeichert.
Für den Start nennt Ollama mehrere Modelle. Z-Image Turbo stammt laut Ollama aus Alibabas Tongyi Lab, hat 6 Milliarden Parameter und wird unter der Apache-2.0-Lizenz angeboten, der Fokus liege auf fotorealistischen Ergebnissen und korrekt dargestelltem englischem und chinesischem Text in Bildern. Ausserdem gibt es FLUX.2 Klein von Black Forest Labs, einmal als 4-Milliarden-Version unter Apache 2.0 und einmal als 9-Milliarden-Version unter einer nicht-kommerziellen Lizenz, das Modell soll laut Ollama besonders bei Text in Bildern und UI-Entwürfen stark sein.
Wer mehr Kontrolle braucht, kann laut Ollama Breite, Höhe und die Anzahl der Rechenschritte anpassen. Kleinere Bilder würden schneller berechnet und benötigen weniger Speicher, zugleich gebe das Tool meist sinnvolle Standardwerte vor.
(dow)