(SeaPRwire) – „Sora“ kann komplexe Szenen generieren, wird jedoch vor seiner Veröffentlichung eingeschränkt werden
OpenAI, das Unternehmen hinter ChatGPT, hat ein neues Tool angekündigt, das Textvorgaben in computergenerierte Videos umwandelt. Das Programm wird erst dann für die Öffentlichkeit freigegeben, wenn OpenAI eine Reihe von Zensurfunktionen integriert hat.
„Sora“ genannt, ist das Programm „in der Lage, komplexe Szenen mit mehreren Charakteren, bestimmten Bewegungsarten und präzisen Details des Motivs und des Hintergrunds zu erzeugen“, sagte OpenAI am Donnerstag in einer Erklärung auf seiner Website.
Sora könne außerdem Videos auf der Grundlage von vom Benutzer eingereichten Bildern erstellen oder vorhandenes Videomaterial mit neuem Material erweitern, so das Unternehmen.
In einer Reihe von Beiträgen auf X teilte OpenAI mehrere von Sora erstellte Videos, darunter eines, das aus der Aufforderung generiert wurde: „Die wunderschöne, verschneite Stadt Tokio ist voller Leben. Die Kamera bewegt sich durch die geschäftigen Straßen der Stadt und folgt mehreren Personen, die das schöne verschneite Wetter genießen und an nahe gelegenen Ständen einkaufen. Wunderschöne Sakura-Blütenblätter fliegen zusammen mit Schneeflocken durch den Wind.“
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions.
Prompt: “Beautiful, snowy…
— OpenAI (@OpenAI)
OpenAI-Gründer Sam Altman postete dann von seinen Followern auf X vorgeschlagene Videos, darunter „Zwei Golden Retriever, die auf einem Berg podcasteten“ und eine lebensechte „Kochsession für hausgemachte Gnocchi, moderiert von einer Großmutter als Social-Media-Influencerin.“
OpenAI nannte keinen Zeitpunkt für die Veröffentlichung von Sora. Das Unternehmen sagte, dass es zunächst an sein sogenanntes „Red Team“ übergeben werde, um sicherzustellen, dass es nicht zur Erstellung von Szenen von „extremer Gewalt, sexueller Inhalte, hasserfüllter Bilder, Abbildungen von Prominenten oder [geistigem Eigentum] anderer“ genutzt werden kann.
Das Unternehmen stellte außerdem fest, dass die Technologie immer noch anfällig für Störungen und Fehler sei. „Sie könnte Schwierigkeiten haben, die Physik einer komplexen Szene genau zu simulieren, und sie könnte bestimmte Kausalzusammenhänge nicht verstehen. So könnte zum Beispiel eine Person in einen Keks beißen, aber danach hat der Keks möglicherweise keine Bissspur“, sagte OpenAI auf seiner Website.
Die KI-Technologie hat sich in den letzten zwei Jahren rasant verbessert, wobei das GPT-Sprachmodell von OpenAI Ende 2022 noch ein Chatbot-Programm antrieb und nur vier Monate später im 93. Perzentil bei einer SAT-Leseprüfung und im 89. Perzentil bei einem SAT-Mathetest lag.
Altman hat bereits zugegeben, dass er „ein bisschen Angst“ vor dem Potenzial seiner Technologie habe. Obwohl es seinen Kunden verboten sei, OpenAI zu nutzen, um „Waffen zu entwickeln oder einzusetzen, andere zu verletzen oder Eigentum zu zerstören oder unbefugte Aktivitäten durchzuführen, die die Sicherheit eines Dienstes oder Systems verletzen“, gab das Unternehmen dennoch im Januar bekannt, mit dem US-Militär an mehreren Projekten zur künstlichen Intelligenz zu arbeiten.
OpenAI arbeitete mit dem Pentagon zusammen, nachdem es sein früheres Verbot der Nutzung seiner Technologien für „militärische und kriegerische“ Zwecke aufgehoben hatte, sagte Anna Makanju, eine leitende Angestellte des Unternehmens, auf der Jahrestagung des Weltwirtschaftsforums in Davos.
Der Artikel wird von einem Drittanbieter bereitgestellt. SeaPRwire (https://www.seaprwire.com/) gibt diesbezüglich keine Zusicherungen oder Darstellungen ab.
Branchen: Top-Story, Tagesnachrichten
SeaPRwire liefert Echtzeit-Pressemitteilungsverteilung für Unternehmen und Institutionen und erreicht mehr als 6.500 Medienshops, 86.000 Redakteure und Journalisten sowie 3,5 Millionen professionelle Desktops in 90 Ländern. SeaPRwire unterstützt die Verteilung von Pressemitteilungen in Englisch, Koreanisch, Japanisch, Arabisch, Vereinfachtem Chinesisch, Traditionellem Chinesisch, Vietnamesisch, Thailändisch, Indonesisch, Malaiisch, Deutsch, Russisch, Französisch, Spanisch, Portugiesisch und anderen Sprachen.