OpenAI, создавшая знаменитый чат-бот ChatGPT, запустила нейросеть Sora, преобразующую текст в видео. Разработка в демо-режиме представлена на сайте компании.
В ответ на текстовый запрос Sora может выдавать видео длительностью до минуты. При этом языковая модель ИИ хорошо понимает, что от неё хотят, а виртуальный мир получается очень похожим на реальный.
Нейросеть пока не лишена недостатков — например, она может перепутать лево и право или "забывает" оставить след на печенье, от которого откусил персонаж.
Авторы предоставили ряду художников, дизайнеров и режиссёров более функциональный доступ к своему продукту, чтобы усовершенствовать и улучшить его на основе их отзывов и критических замечаний.
Разработчики надеются научить нейросеть "понимать и моделировать реальный мир".
"Мы считаем, что эта способность станет важной вехой на пути к созданию искусственного интеллекта", — уверены они.
OpenAI заверила, что приняла меры во избежание использования Sora в неблаговидных целях. Из запросов отфильтровываются враждебные и разжигающие ненависть формулировки, а в метаданные видео добавляется классификатор, указывающий на то, что оно ненастоящее.