Тесты преобразования текста в видео с тремя генеративными моделями

2049.news · 21.03.2026, 13:25:03

Тесты преобразования текста в видео с тремя генеративными моделями


Была проведена серия тестов рендеринга «текст-видео» с использованием Sora 2, Kling 3.0, и Seedance 2.0 в указанном порядке.

Настройка теста и творческое задание

В запросе описывалась ультрареалистичная кинематографичная машина, где сотни отполированных стальных шариков проходят через ручной музыкальный механизм.

Материалы были заданы как тактильные и премиальные, включая берёзовую древесину, шлифованную латунь, отполированную сталь, войлочные демпферы, резиновые ремни и точёные шестерни.

Режиссура камеры запрашивала медленное макро-приближение (push-in), следя за ведущим шариком через многослойные взаимодействия, затем расширение до полуширокого кадра синхронизированных путей.

Визуальные и физические ограничения

Была запрошена точность физики: реалистичный вес, трение, инерция, столкновения и слегка несовершенное движение без преувеличенного или мультяшного поведения.

Осветительные указания сочетали тёплые характеристики мастерской и сцены с объемной пылью, насыщенными тенями, яркими отблесками стали и естественными отражениями на лакированной древесине.

Дизайн звука и движения

В звуковом дизайне в приоритете были чёткая механическая перкуссия, резонантные вибрафонные тона, изящные колокольчики, лёгкие удары барабана, жужжание шестерен и тонкая резонансность помещения.

Движение должно быть плавным, гипнотическим и точным, подчёркивая видимую причинно-следственную механику и синхронизированную координацию по нескольким дорожкам шариков.

Результаты моделей

  • Sora 2 предоставила плотные, текстурированные поверхности и богатые отражения, а также хорошо справлялась с близкими макро-деталями и согласованной передачей тактильных материалов.
  • Kling 3.0 сделала приоритет на более широкую кинематографическую композицию и атмосферное освещение, временами упрощая микрофизику столкновений и трение шариков.
  • Seedance 2.0 делала упор на плавную хореографию и синхронизированные траектории, иногда в ущерб микрореализму материалов и динамике контакта.

Во всех моделях наблюдались компромиссы между микроскопической физической точностью и кинематографической композицией, при этом каждая система отдаёт предпочтение разным аспектам задания.

Результаты показывают разные сильные стороны в зависимости от того, что было в приоритете: реализм материалов, атмосферное освещение или синхронизованная механическая хореография.


Похожие записи

Nvidia demonstrates DLSS 5 with neural realism and upscaling
Seedance 2.0 Appeared Briefly in CapCut Desktop
Прокрутите вниз для загрузки следующего материала