Ideogram выпустила Ideogram 4 и опубликовала веса с открытым исходным кодом
Ideogram выпустила Ideogram 4 и опубликовала веса с открытым исходным кодом
Ideogram опубликовала Ideogram 4 вместе с файлами весов, выложенными в открытом доступе; это первый случай публичного выпуска весов.
Возможности модели
Модель генерирует изображения в разрешении 2K и демонстрирует надёжную отрисовку текста в разных стилях и языках в разнообразных сценах.
Она поддерживает управление кадром с помощью цветовой палитры и выделения ограничивающей рамкой, чтобы влиять на композицию и размещение фокуса в сгенерированных изображениях.
Файлы весов, форматы и локальное использование
Файлы весов были опубликованы в вариантах FP8 и NFP4, тогда как наличие FP16 выглядит маловероятным, согласно заметкам к релизу.
Модель содержит 9.3B параметров; файл весов FP8 занимает 9.3 GB, а текстовый энкодер добавляет 8.8 GB.
Такие размеры означают, что полная модель и энкодер могут поместиться в системах с примерно 24 GB видеопамяти, что обеспечивает отзывчивый вывод на адекватно оснащённом оборудовании.
Инструменты подсказок и параметры инференса
В демонстрациях пользователи могут применять улучшитель подсказок, размещённый на серверах Ideogram, или запускать улучшитель локально с использованием модели Qwen для обработки на устройстве.
Разработчики отмечают три пресета инференса для баланса между скоростью и визуальным качеством: Turbo с 12 шагами, Default с 20 шагами и Quality с 48 шагами.
Лицензия и использование
Распространяемые веса предоставлены по non-commercial лицензии, что ограничивает варианты использования некоммерческими сценариями, если иное не лицензировано компанией Ideogram.
