Laut CNBC hat OpenAI gerade Sora vorgestellt – ein KI-Modell der nächsten Generation, das ähnlich wie das bisherige bildgenerierende KI-Tool DALL-E funktioniert. Benutzer müssen lediglich die gewünschte Szene eingeben, und Sora generiert einen hochauflösenden Videoclip . Sora kann auch von Standbildern inspirierte Videoclips erstellen, bestehende Videos erweitern oder fehlende Frames ergänzen.
Samojede und Golden Retriever tollen nachts in einem KI-generierten Video durch eine Stadt mit Neonlichtern
Videoerstellung könnte der nächste große Schritt für kreative KI sein, nachdem Chatbots und Bildgeneratoren vor kurzem Einzug in die Verbraucher- und Geschäftswelt gehalten haben. Während die Content-Erstellung KI-Enthusiasten begeistert, wecken diese neuen Technologien im Vorfeld wichtiger globaler Wahlen ernsthafte Bedenken hinsichtlich Fehlinformationen. Laut Daten des Machine-Learning-Unternehmens Clarity ist die Zahl der KI-generierten Deepfakes im Jahresvergleich um 900 % gestiegen.
Mit Sora will OpenAI mit videogenerierenden KI-Tools von Unternehmen wie Google und Meta konkurrieren. Ähnliche KI-Tools bieten auch andere Startups an, beispielsweise Stability AI mit dem Produkt Stable Video Diffusion. Amazon hat außerdem „Create with Alexa“ veröffentlicht, ein Modell, das sich auf die Erstellung von kurzen animierten Inhalten für Kinder auf Befehlsbasis spezialisiert hat.
Sora kann derzeit nur Videos mit einer Länge von höchstens einer Minute erstellen. OpenAI hat sich Multimodalität zum Ziel gesetzt, eine Methode, die Text-, Bild- und Videogenerierung kombiniert, um ein breiteres Spektrum an KI-Modellen bereitzustellen.
Bisher ist Sora nur einer kleinen Gruppe von Sicherheitstestern, sogenannten „Red Teams“, zugänglich. Diese haben die Aufgabe, das Modell auf Schwachstellen in Bereichen wie Fehlinformationen zu prüfen. Das Unternehmen hat über die zehn Beispielclips auf seiner Website hinaus keine öffentlichen Demos veröffentlicht. Die dazugehörige technische Dokumentation soll demnächst veröffentlicht werden.
OpenAI gibt außerdem an, einen „Erkennungsklassifizierer“ zu entwickeln, der von Sora generierte Videoclips identifizieren kann. Außerdem plant das Unternehmen, bestimmte Metadaten in die Ausgabe aufzunehmen, um die Identifizierung der KI-generierten Inhalte zu erleichtern. Genau diese Art von Metadaten möchte Meta nutzen, um KI-generierte Bilder zu identifizieren.
Sora ist ein KI-Modell, das die Transformer-Architektur verwendet, die Google-Forscher 2017 in einem Artikel vorgestellt haben. In seiner Ankündigung sagte OpenAI, Sora diene als Grundlage für Modelle, die die reale Welt verstehen und simulieren.
[Anzeige_2]
Quellenlink
Kommentar (0)