ACE‑Step с открытым исходным кодом расширяет модели и аудио-интерфейсы
ACE‑Step с открытым исходным кодом расширяет модели и аудио-интерфейсы
Проект с открытым исходным кодом ACE‑Step расширяет свою библиотеку моделей, LORA, созданных сообществом, и пользовательские интерфейсы для генерации треков и обучения LORA. Интерфейсы теперь включают визуализаторы, редактирование по временной шкале и извлечение стемов с аппаратным ускорением через WebGPU, а разработчики поддерживают как открытые, так и коммерческие решения.
Пользовательский интерфейс ACE‑Step и основные функции
Интерфейс ACE‑Step использует рабочий процесс, похожий на другие инструменты генерации музыки: выбор модели, загрузка эталонного трека и режим кавера. Пользователи могут регулировать голос, BPM и текст песни, включать улучшитель и настраивать типичные параметры, такие как длительность, количество дорожек и шаги инференса.
Помимо стандартных элементов управления, интерфейс предоставляет расширенные опции, включая выбор метода инференса, конвейер создания текстов с поддержкой LLM, "Thinking" режим для итеративной доработки и аудио-инпейтинг для замены фрагментов сгенерированным материалом.
Возможности для каждой дорожки
Для каждой дорожки пользователи могут генерировать простой видео-визуализатор, синхронизированный с музыкой, редактировать аудио на временной шкале с помощью открытого редактора AudioMass и извлекать стемы с помощью открытого инструмента Demucs. В этой конфигурации Demucs запускается через WebGPU, обеспечивая ускоренную в браузере обработку без отдельного нативного ПО.
Производительность, использование ресурсов и установка
Пакет автоматизирует загрузку и запуск необходимых компонентов в отдельных окнах, упрощая настройку для конечных пользователей. Потребление ресурсов оценивается в 4+ GB без LLM и до 12 GB при включённом LLM, а типичное время генерации составляет менее <6 sec на трек на 4090.
Пакетная генерация может загружать несколько элементов в видеопамять одновременно и исчерпать VRAM; альтернативой является запуск через Comfy с динамической загрузкой GPU-памяти для смягчения всплесков. Установки возможны через обновлённый инсталлятор под названием Pinokio или напрямую из репозитория проекта.
Связанные интерфейсы и экосистема
Другие интерфейсы, построенные на ACE‑Step, включают Side‑Step, который имитирует эстетику магнитофона и делает упор на рабочие процессы обучения LORA, и AceJam, который преобразует описательные подсказки в аудио, используя квантизированную модель Qwen совместно с бэкендами ACE‑Step.
Comfy недавно добавил рабочие процессы для моделей ACE‑Step 1.5 XL, нацеленные на более высокое качество выходов, хотя структурная согласованность не всегда гарантируется. Качество звука в настоящее время отстаёт от ведущих инструментов, таких как Suno и Udio, но проект уже предоставляет проработанный пользовательский интерфейс и развивающуюся экосистему с открытым исходным кодом.
Коммерческие предложения и перспективы
Чтобы сбалансировать экосистему, команда проекта также поддерживает коммерческие сервисы: ACE Music для простой генерации и ACE Studio для студийных рабочих процессов. Сообщество с открытым исходным кодом и усилия разработчиков продолжают развивать интерфейсы и поддержку моделей по всему стеку.

