ACE‑Step с открытым исходным кодом расширяет модели и аудио-интерфейсы

2049.news · 30.04.2026, 07:20:03

ACE‑Step с открытым исходным кодом расширяет модели и аудио-интерфейсы


Проект с открытым исходным кодом ACE‑Step расширяет свою библиотеку моделей, LORA, созданных сообществом, и пользовательские интерфейсы для генерации треков и обучения LORA. Интерфейсы теперь включают визуализаторы, редактирование по временной шкале и извлечение стемов с аппаратным ускорением через WebGPU, а разработчики поддерживают как открытые, так и коммерческие решения.

Пользовательский интерфейс ACE‑Step и основные функции

Интерфейс ACE‑Step использует рабочий процесс, похожий на другие инструменты генерации музыки: выбор модели, загрузка эталонного трека и режим кавера. Пользователи могут регулировать голос, BPM и текст песни, включать улучшитель и настраивать типичные параметры, такие как длительность, количество дорожек и шаги инференса.

Помимо стандартных элементов управления, интерфейс предоставляет расширенные опции, включая выбор метода инференса, конвейер создания текстов с поддержкой LLM, "Thinking" режим для итеративной доработки и аудио-инпейтинг для замены фрагментов сгенерированным материалом.

Возможности для каждой дорожки

Для каждой дорожки пользователи могут генерировать простой видео-визуализатор, синхронизированный с музыкой, редактировать аудио на временной шкале с помощью открытого редактора AudioMass и извлекать стемы с помощью открытого инструмента Demucs. В этой конфигурации Demucs запускается через WebGPU, обеспечивая ускоренную в браузере обработку без отдельного нативного ПО.

Производительность, использование ресурсов и установка

Пакет автоматизирует загрузку и запуск необходимых компонентов в отдельных окнах, упрощая настройку для конечных пользователей. Потребление ресурсов оценивается в 4+ GB без LLM и до 12 GB при включённом LLM, а типичное время генерации составляет менее <6 sec на трек на 4090.

Пакетная генерация может загружать несколько элементов в видеопамять одновременно и исчерпать VRAM; альтернативой является запуск через Comfy с динамической загрузкой GPU-памяти для смягчения всплесков. Установки возможны через обновлённый инсталлятор под названием Pinokio или напрямую из репозитория проекта.

Связанные интерфейсы и экосистема

Другие интерфейсы, построенные на ACE‑Step, включают Side‑Step, который имитирует эстетику магнитофона и делает упор на рабочие процессы обучения LORA, и AceJam, который преобразует описательные подсказки в аудио, используя квантизированную модель Qwen совместно с бэкендами ACE‑Step.

Comfy недавно добавил рабочие процессы для моделей ACE‑Step 1.5 XL, нацеленные на более высокое качество выходов, хотя структурная согласованность не всегда гарантируется. Качество звука в настоящее время отстаёт от ведущих инструментов, таких как Suno и Udio, но проект уже предоставляет проработанный пользовательский интерфейс и развивающуюся экосистему с открытым исходным кодом.

Коммерческие предложения и перспективы

Чтобы сбалансировать экосистему, команда проекта также поддерживает коммерческие сервисы: ACE Music для простой генерации и ACE Studio для студийных рабочих процессов. Сообщество с открытым исходным кодом и усилия разработчиков продолжают развивать интерфейсы и поддержку моделей по всему стеку.


Похожие записи

Text-to-video tests with three generative models
Black Forest Labs releases Flux Klein 9B KV update
Прокрутите вниз для загрузки следующего материала