Новости Май 14, 2025
Stability AI представила миниатюрную модель генерации звука, способную создавать аудио прямо на мобильных устройствах — быстро, локально и без нарушения авторских прав.
Компания Stability AI, известная благодаря своей генеративной модели Stable Diffusion, решила выйти за рамки визуального контента и представила Stable Audio Open Small — компактный ИИ-движок для генерации аудио. Особенность? Он запускается на смартфоне, работает быстро и не требует облачного подключения.
Модель стала результатом партнёрства с Arm — производителем архитектуры, на которой работают миллионы мобильных процессоров. Это объясняет, почему Stable Audio Open Small работает эффективно именно на телефонах и планшетах.
Объём модели — 341 миллион параметров. Она предназначена для генерации коротких музыкальных фрагментов и звуковых эффектов (например, драм-сэмплов или гитарных риффов) и может сгенерировать до 11 секунд аудио менее чем за 8 секунд.
В отличие от конкурентов (вроде Suno или Udio), которые полагаются на мощные серверы и спорные датасеты, Stable Audio Open Small обучалась исключительно на легальном и бесплатном контенте: библиотеках Free Music Archive и Freesound. Это снижает риск нарушений авторского права — важный плюс для разработчиков и компаний.
Модель не лишена ограничений:
Поддерживает только англоязычные запросы
Не умеет генерировать реалистичный вокал и качественные полноценные треки
Лучше работает с западной музыкальной стилистикой из-за состава обучающего датасета
Кроме того, бесплатное использование разрешено только для исследователей, энтузиастов и компаний с доходом до $1 млн в год. Все, кто зарабатывает больше — должны приобрести корпоративную лицензию.
После кризисного 2023 года, увольнений и смены руководства, Stability AI стремится восстановить доверие инвесторов. В компанию вложились Эрик Шмидт и Шон Паркер, а в совет директоров вошёл Джеймс Кэмерон. За последние месяцы Stability уже представила несколько новых моделей — и Stable Audio Open Small выглядит как первый шаг к расширению за пределы изображения.