OpenAI разработала Sora - модель для создания видео по текстовым запросам

Published February 15, 2024

В четверг компания OpenAI представила новую модель под названием Sora, которая способна генерировать видео высокого разрешения продолжительностью до минуты на основе текстовых подсказок. Sora, в переводе с японского означающая «небо», пока не будет доступна широкой публике. В настоящее время используются ограничения для тестирования возможных вредоносных сценариев использования модели, и испытания проводятся небольшой группой ученых и исследователей.

Модель Sora может создавать сложные сцены с несколькими персонажами, определенными типами движения и точными деталями сюжета и фона. Примеры видео, сделанные с помощью Sora, включают реалистично выглядящих мамонтов, шагающих по снежному полю, и пару, гуляющую по снежному Токио среди лепестков сакуры.

Модель развивается благодаря глубокому пониманию языка, что позволяет точно интерпретировать текстовые подсказки. Еще одной особенностью Sora является то, что весь видеоролик создается целиком, а не кадр за кадром, что обеспечивает непрерывность и последовательность объектов.

ИИ, видео, технология