Ideogram выпустила Ideogram 4 и опубликовала веса с открытым исходным кодом

2049.news · 03.06.2026, 19:45:04

Ideogram выпустила Ideogram 4 и опубликовала веса с открытым исходным кодом


Ideogram опубликовала Ideogram 4 вместе с файлами весов, выложенными в открытом доступе; это первый случай публичного выпуска весов.

Возможности модели

Модель генерирует изображения в разрешении 2K и демонстрирует надёжную отрисовку текста в разных стилях и языках в разнообразных сценах.

Она поддерживает управление кадром с помощью цветовой палитры и выделения ограничивающей рамкой, чтобы влиять на композицию и размещение фокуса в сгенерированных изображениях.

Файлы весов, форматы и локальное использование

Файлы весов были опубликованы в вариантах FP8 и NFP4, тогда как наличие FP16 выглядит маловероятным, согласно заметкам к релизу.

Модель содержит 9.3B параметров; файл весов FP8 занимает 9.3 GB, а текстовый энкодер добавляет 8.8 GB.

Такие размеры означают, что полная модель и энкодер могут поместиться в системах с примерно 24 GB видеопамяти, что обеспечивает отзывчивый вывод на адекватно оснащённом оборудовании.

Инструменты подсказок и параметры инференса

В демонстрациях пользователи могут применять улучшитель подсказок, размещённый на серверах Ideogram, или запускать улучшитель локально с использованием модели Qwen для обработки на устройстве.

Разработчики отмечают три пресета инференса для баланса между скоростью и визуальным качеством: Turbo с 12 шагами, Default с 20 шагами и Quality с 48 шагами.

Лицензия и использование

Распространяемые веса предоставлены по non-commercial лицензии, что ограничивает варианты использования некоммерческими сценариями, если иное не лицензировано компанией Ideogram.


Похожие записи

Text-to-video tests with three generative models
Current Personal AI Tool Stack and Practical Notes
Прокрутите вниз для загрузки следующего материала