Die UC Riverside berichtet auf ihrer
Website, dass Professor Amit Roy Chowdhury und Doktorand Rohit Kundu gemeinsam mit Google-Wissenschaftlern das Universal Network for Identifying Tampered and Synthetic Videos (Unite) entwickelt haben, um manipulierte Videos zu erkennen. Anders als frühere Detektoren untersucht Unite komplette Szenen und erkennt synthetische oder manipulierte Clips, selbst wenn kein Gesicht im Bild erscheint.
Technisch fusst Unite auf dem transformerbasierten Deep Learning Framework SigLIP und nutzt einen neuartigen "Attention-diversity Loss,", der das Modell anweist, mehrere visuelle Bereiche gleichzeitig zu überwachen. So sollen subtile räumliche und zeitliche Inkonsistenzen identifiziert werden, die bei reinen Gesichtserkennungssystemen unentdeckt bleiben würden.
Die Ergebnisse präsentierten Roy Chowdhury und Rohit Kundu mit ihren Co-Autoren auf der CVPR 2025 in Nashville. Unite könne laut den Forschern bald von Social-Media-Plattformen, Faktenprüfern und Redaktionen eingesetzt werden, um Desinformation in Videos zuverlässig aufzudecken. "Die Menschen haben ein Recht darauf zu wissen, ob das, was sie sehen, echt ist", so Kundu.
(dow)