OpenAI запустила нейросеть Sora. Она генерирует видео по текстовому запросу

Время, когда фильмы будут сняты только при помощи искусственного интеллекта, все ближе.

Видео от нейросети Sora, которыми поделилась компания OpenAI, ничего, кроме восторга, не вызывают. Сам факт того, что искусственный интеллект может создать видеоролик, основываясь только лишь на текстовом запросе, заставляет усомниться в том, что это реальность, а не сюжет научно-фантастического фильма.

Что же умеет Sora? Во-первых, анимировать сложные сцены с несколькими персонажами с разными моделями поведения, при этом — четко воссоздавать детализированный фон. Нейросеть, как заявляет OpenAl, обладает глубоким пониманием языка, а потому она может точно интерпретировать подсказки и генерировать убедительных персонажей с весьма естественными эмоциями, например, изображать задумчивость, как в ролике, где текстовым запросом был «‎молодой человек в возрасте 20 лет сидит на облаке в небе и читает книгу»‎, или недовольство (в видео про то, как кошка разбудила своего спящего хозяина, требуя завтрака). Sora также может генерировать воображаемых существ — разных монстров, которые выглядят весьма умилительно (того, что играет со свечкой или того, который гуляет по сказочному лесу).

Во-вторых, Sora может воссоздавать реально существующие места: побережье Амальфи, снятое с дрона, город Лагос 2056 года в Нигерии или даже показать исторические кадры Калифорнии во время золотой лихорадки. Отдельно стоит отметить, что картинка сгенерированных видео отнюдь не статична — виртуальной съемке могут позавидовать многие режиссеры Голливуда.

Конечно, нейросеть несовершенна и имеет слабые стороны, в этом OpenAl признается весьма честно. Sora может неверно интерпретировать физику сложной сцены и неправильно понять причинно-следственную связь, из-за чего генерируются забавные, но порой ужасающие видео: мужчина на беговой дорожке развернут в другую сторону, щенки появляются друг из друга, стул начинает парить в воздухе, а свечи не гаснут от дуновения.

Видеоролики, безусловно, выглядят впечатляюще, однако возникает некоторое опасение за безопасность, в эпоху дипфейков особенно. По словам представителей OpenAl, нейросеть будет отклонять все запросы, в которых упоминаются знаменитости, чтобы не распространять ложные, но реалистичные видео. Помимо этого, Sora не будет отвечать на запросы, связанные с насилием и ненавистью. В данный момент нейросеть находится на стадии тестирование и недоступна широкой аудитории. 

Нейросоветы – канал с советами от искусственного интеллекта!