**Tencent**: выпустили генератор 3D миров [HY World 1.5]( (WorldPlay).
**Tencent**: выпустили генератор 3D миров [HY World 1.5]( (WorldPlay).
В отличие от версии 1.0 в новой модели фокус на реалтайм генерации новых углов обзора, стабильности получаемого мира, а также интерактивном взаимодействии с ним.
Реалтайм, консистентность, и умеренное потребление VRAM достигаются через стриминг 480p 24 fps видео, а также техникам для эффективного использования уже сгенерированных кадров, чтобы получить новые.
Можно на вход подавать текст или картинку, а навигация идёт клавой+мышью. Говорят нужно минимум 14 ГБ VRAM, остальное пойдёт в оперативку. А именно туда будет запихана Hy World 1.5 (все три bidirectional, autoregressive, distilled или только какая-то одна пока не ясно) и базовая видео модель Hy Video 1.5. Каждая весит по 33 ГБ, но можно у Кижая или Комфи подрезать fp8 как минимум на последнюю. Или вот [онлайн демо]( на китайском.
На днях к золотодобыче в эту сторону к [Genie]( [Odyssey]( итд присоединились Spatial с их моделью [Echo]( которые только по вейтлисту и по опросу ощущение словно ориентированы на b2b. Гля какой портальный переход между мирами [World Labs]( у себя замутили.
[Сайт](
[Демо](
[Гитхаб](
[Хаггинг](
Похожие записи
🤖 **Google DeepMind учит роботов предсказывать будущее с помощью уже существующей видеомодели Veo **
Kling releases Kling V 2.6 video model with audio
Прокрутите вниз для загрузки следующего материала