Компания «OpenAI» представила систему искусственного интеллекта, которая может на основе текстового описания создавать видеоролики
Об этом 15 февраля компания сообщила в блоге.
Согласно сообщению, «Sora» может генерировать видео продолжительностью до минуты, с несколькими персонажами, которые двигаются и ярко выражают эмоции, и с детальной проработкой объектов и фона.
При этом система сохраняет визуальное качество и придерживается пользовательских подсказок.
Компания добавляет, что модель понимает подсказки и знает, как ведут себя различные объекты в реальном мире.
Также в нее интегрировано глубокое понимание языка, что позволяет более точно интерпретировать подсказки.
Вместе с тем, в «OpenAI» отмечают, что текущая модель имеет слабые места.
Трудности могут возникать с точным моделированием физики, а также ей пока трудно прослеживать причинно-следственные связи.
Например, человек может откусить кусочек печенья, но после этого на печенье может не остаться следа от укуса.
Пока «Sora» доступна для тестирования ограниченному кругу пользователей.
Это в основном специалисты по противодействию распространению дезинформации и языка вражды и по кибербезопасности, которые должны оценить ее риски.