OpenAI entwickelt momentan die Software Sora, die Videos basierend auf Textanweisungen erstellt. Die Software ist derzeit für Red-Teaming zur Identifizierung von Fehlern im KI-System für Modellrückmeldung verfügbar.
Das von Microsoft unterstützte Unternehmen OpenAI arbeitet an einer Software, die auf der Grundlage von Textaufforderungen minutenlange Videos erzeugen kann. Die Software mit dem Namen Sora ist derzeit für das Red-Teaming verfügbar. Das hilft dabei, Fehler im KI-System zu identifizieren, sowie für die Verwendung durch visuelle Künstler, Designer und Filmemacher, um Feedback zu dem Modell zu erhalten, so das Unternehmen in einer Erklärung.
Von Text zu Video
“Sora ist in der Lage, komplexe Szenen mit mehreren Charakteren, spezifischen Bewegungsarten und genauen Details des Motivs und des Hintergrunds zu generieren”, heißt es. Außerdem können mehrere Aufnahmen innerhalb eines einzigen Videos erstellt werden. Sora kann nicht nur Videos auf der Grundlage von Textanweisungen erstellen, sondern auch Standbilder animieren, so das Unternehmen.
Meta kreierte letztes Jahr Bilderzeugungsmodell Emu
Die Videogenerierungssoftware folgt auf den Chatbot ChatGPT von OpenAI, der Ende 2022 veröffentlicht wurde und mit seiner Fähigkeit, E-Mails zu verfassen sowie Codes und Gedichte zu schreiben, für Aufsehen sorgte. Der Social-Media-Gigant Meta Platforms hat im vergangenen Jahr sein Bilderzeugungsmodell Emu um zwei KI-basierte Funktionen erweitert, mit denen sich Videos aus Textanweisungen bearbeiten und erzeugen lassen.
Schwierigkeiten einer bestimmten Kamerabewegung zu folgen
Sora befindet sich noch in der Entwicklung, wobei das Unternehmen hinzufügt, dass das Modell die räumlichen Details einer Aufforderung verwechseln kann und Schwierigkeiten hat, einer bestimmten Kamerabewegung zu folgen.OpenAI sagte, dass es auch Tools entwickelt, die erkennen können, ob ein Video von Sora generiert wurde.
(pi)