Это не обзор, это разговор за кофейком. Сейчас расскажу, почему стал относиться к Suno настороженно после последних обновлений их условий и зачем вообще собрал «одно окно» для тех, у кого нет мощного компьютера и есть желание экономить кучу времени и денег.
Решил написать в этот блог потому что давно занимаюсь нейросетями и автоматизацией, собственно по этому и родился Syntet.ru. Я собрал его не ради модного слова «стартап», а потому что сам устал: устал апгрейдить железо ради одной песни или видео и устал терять полдня на крутилки вместо результата. Мне нужно было одно окно — написал, нажал, получил, пошёл дальше. Без терминала, без CUDA, без мыслей, что я «не докрутил сэмплер». Если тебе близко — мы уже на одной волне. Я подсел на Suno ещё год назад. Сначала был в восторге: нажимаешь кнопку получаешь трек. Ептать, да я почувствовал себя музыкантом :). Я даже купил себе Pro и реально что-то делал, заставки для роликов, джинглы, и прочее. А потом словил легкую параною и разочарование.
Первая причина не звук, а ощущение, что тебя подписали под то, что ты не прочитал
Я не юрист. Я как и все не особо читают всякие политики и прочие оферты на сайтах, но вот появились первые новости от про пользователей по поводу нововведений Suno. Я пролистал до блока про голосовую модель и почувствовал странное ощущение что где-то меня сильно наебывают.
Речь о том, что сервис предлагает загрузить запись твоего голоса, чтобы синтезировать песни «как ты». Звучит круто. А дальше ты читаешь мелким шрифтом смысл: раз ты загрузил голос и нажал «ок», ты по сути даёшь компании очень широкое право использовать твои материалы, в том числе чтобы обучать и улучшать их нейросети. Не «только для твоей красоты», а в общем контуре продукта. Плюс формулировки про то, что нельзя брать их выход и кормить им чужие модели или конкурирующие сервисы — то есть твой творческий поток привязан к их правилам игры. Ещё там есть жёсткая история с арбитражем вместо суда, запрет на коллективные иски, бессрочное и безотзывное право на твой голос и прочее, согласитесь, звучит как план :) .
Я сидел и думал: мой голос по идее так то никому наверное не нужен кроме мошенников, но под коркой ощущение что ты его как будто продал, а я на это согласился одной галочкой, потому что хотел быстро попробовать фичу.
Отдельно больно про бесплатный тариф: коммерчески использовать выход там по смыслу нельзя — остаёшься в режиме «поиграл дома». А если начал бесплатно, а потом доплатил, часть ограничений не отмажешь задним числом. Это не злой умысел, это бизнес-модель. Но для автора, который хотел «просто выложить трек на стриминг», это ловушка.
К качеству звука у Suno у меня претензии скорее эстетические: всё слегка причёсано под одно радио, баллада и фолк начинают походить друг на друга. К этому я ещё мог бы привыкнуть или подстроить уши. А вот к ощущению, что я не владею ни процессом, ни последствиями для своего голоса, — уже нет.
Как я нашёл ACE-Step
Мне про него написали в чате. Мол: «попробуй, это как Suno, но дешевле». Я отмахнулся — думал, очередная недоделанная опенсорс-штука, где надо сначала три дня с настройками ковыряться, и на выходе звук с китайским акцентом.
Но попробовал. И вот тут началось.
Первый же трек EDM техно, женский вокал. Я нажал на воспроизведение и сидел с лицом, как будто меня облили водой. Голос на уровне. Он не был гладким — он был живым. В нём были вдохи, лёгкое хрипловатое подрагивание на длинных нотах. Там, где Suno сделал бы безупречную пустышку ACE-Step спел по-человечески.
Голос не файл. Я не хочу отдавать его ради одной кнопки «попробовать»
Я врубил второй трек уже на русском. Это тот случай, когда открытая модель поёт по-русски как человек, а не как иностранец, выучивший слова фонетически. Я до этого на русском в Suno почти не работал: там часто вылезает акцент, который невозможно прям слышно что это ИИ.
В чем он реально лучше Suno
Вокал честный. Если Suno это глянцевый журнал, ACE-Step это фотография плёночной камерой. Немножко зерно, немножко случайность. И от этого он живой.
Трек слышно по слоям. Пианино отдельно, струнные отдельно, вокал отдельно. Не слипается в кашу, как это иногда бывает у Suno на плотных аранжировках. Если потом решишь раскатать трек на стемы это реально возможно.
Можно переделать только припев. Не всю песню. Не с нуля. Только кусок, который тебе не зашёл. Это ощущение контроля, которое у Suno тоже есть, но там оно платное и ограниченное.
Длинные треки. До десяти минут одним куском. Ни дроблений, ни склеек. Хочешь написать эпик, напиши эпик.
Он дешевый. Вот это главное. Не «пробный период». Не «первые 50 треков». Реально почти бесплатный (если локально то вообще бесплатный). Люди, которые его сделали, выложили его под такой лицензией, что ты можешь брать и продавать треки на стоках, пускать в рекламу, монетизировать YouTube. Никто тебе в спину не дышит.
Где Suno пока сильнее — не буду врать
Я же обещал по-честному.
Попса. Если тебе нужен чартовый припев с бэками, который звучит как в радиоэфире Suno пока делает это стабильнее. ACE-Step может прыгнуть куда-то вбок: вроде бы делал ты лёгкий поп, а получил какой-то инди-фолк. Иногда это гениально. Иногда раздражает.
Дисциплина с первой попытки. Suno почти всегда даёт «среднее нормально». ACE-Step даёт рулетку: из пяти прогонов один — слёзный шедевр, два — в помойку, ещё два — норм. Но тот шедевр ты у Suno не услышишь никогда, потому что у него не бывает крайностей.
Удобство, если ты не технарь. Suno — открыл, нажал. ACE-Step, если ставить локально — CUDA, видеокарта, пляски. Это реально стена для обычного человека.
Вот на этом стоп. Именно из-за этой стены многие про эту модель ничего и не слышали.
Как я обошёл стену
Я сейчас не подбираю железо под новые модели, я как раз под это и делал Syntet.ru.
Идея была простая, если у тебя нет мощного компьютера, ты всё равно имеешь право на нормальный результат. Если тебе важнее скорость и ясность «написал в одном окне, нажал, получил» чем крутить десять экранов настроек, ты не должен чувствовать себя второсортным пользователем. Поэтому ACE-Step 1.5 XL Turbo у нас в облаке, обычный браузер, человеческий интерфейс, без CUDA и заморочек.
Заходишь на Syntet.ru — и работаешь там же, где и остальной каталог моделей.
И при регистрации тебе дают приветственные кредиты. Их реально хватает, чтобы попробовать, штук десять треков спокойно делаешь, выбираешь лучший, работаешь дальше.
Я с этой моделью уже залип на пару вечеров.
В чем удобство
Внутри каталога есть ещё одна штука, которая меня самому очень нравиться. Называется LTX 2.3 Lip Sync. Работает так, берёшь свой трек и берёшь фото. Любое. Хоть портрет жены, хоть картинку исполнителя из Midjourney, хоть кадр из старого фильма. И модель заставляет это лицо петь твой трек. Синхронно. С артикуляцией. С эмоцией.
Я сделал первый клип за десять минут. Сгенерировал песню на ACE-Step, взял готовый портрет, можно и свою фотографию или картинку персонажа, загрузил в Lip Sync, и она запела. Я сидел и смотрел и радовался. Пять лет назад за такое платили целым клипмейкерам.
И всё это в одном окне, на одном аккаунте.
Как я пишу промпты (если хочешь, попробуй)
Самое важное, что я понял ACE-Step любит две истории в одном запросе, и они должны совпадать.
Первая история — в поле стиля. Там ты описываешь, как это звучит. Жанр, настроение, инструменты, эпоха, характер вокала. Не пиши «грустная песня». Пиши «меланхоличный инди-фолк, женский голос с лёгкой хрипотцой, тёплая акустическая гитара, струнные издалека, запись как в домашней студии 90-х». Модель на такое реагирует как на хороший рецепт.
Вторая история — в тексте песни. Там ты размечаешь секции квадратными скобками: [Intro], [Verse 1], [Chorus], [Bridge], [Outro]. Если хочешь задать характер припева — пиши через дефис одно-два слова: [Chorus - anthemic], [Verse - whispered]. Больше не надо, модель запутается и начнёт петь сами теги.
Главное не противоречь в музыкально стиле, хотя чем черт не шутит может именно такая генерация родить тебе шедевр. И еще если нужен какой-то проигрыш, указывай его в поле с текстом песни в круглых скобках и пиши на чем он реализован.
Если хочется подробнее у меня есть тг канал я там делюсь промптами и новыми пайплайнами по создании ИИ контента, если любопытно залетай буду рад @syntetfactory
Что я хочу тебе сказать
Я не фанатик опенсорса. Мне без разницы, какая там лицензия, кто кого обогнал на бенчмарках и чей релиз свежее. Мне важно, какая штука приносит больше радости на единицу потраченного времени.
Suno приносит её меньше. Я не обижаюсь на них отличный продукт, я год с удовольствием пользовался. Но для меня потолок оказался не в «глянце звука», а в ощущении юридической и человеческих норм, голос, права, обучение моделей, запреты на то, как дальше распоряжаться результатом. Это уже не про вкус, а про доверие.
ACE-Step дает другие эмоции. Он может промахнуться. Он может удивить. Он иногда трогает за живое, и это ровно то, чего я жду от музыки.
И пока ты это читаешь ты можешь пойти и проверить, прав я или нет. Это займёт полчаса максимум, и тебе за это ничего не нужно платить.
Приветственные кредиты
До 10 треков и один клип бесплатно
Регистрируешься, получаешь кредиты. Делаешь музыку на ACE-Step 1.5 XL Turbo. Лучший трек оживляешь в видео через LTX 2.3 Lip Sync — и у тебя готовый клип с исполнителем. Всё в одном аккаунте.
Попробуй. Если не зайдёт, напишешь мне, что я ошибался. А если зайдёт, мы с тобой в одном клубе.