AI-мультики для TikTok: полный путь от идеи до ролика | Алекс про ИИ

Делюсь рабочей схемой создания AI-мультиков с говорящими фруктами для TikTok. Какие нейросети брать, где экономить токены и как обходить цензуру на русскую озвучку.

Сидел недавно у мамы на даче, листал телефон. Натыкаюсь на ролик: маленькая клубничка драматично рассказывает, как её бросил черничный пирог. Пять миллионов просмотров. Дальше алгоритм подкидывает ещё десяток похожих видосов с овощами, фруктами, кофейными зёрнами. Все эти ребята говорят, страдают, признаются в любви и собирают дикие охваты.

Меня зацепило. Полез разбираться, как вообще такое снимают. Через неделю у меня в архиве лежало пять собственных мультиков, а жена орала с банана-начальника, который пытается уговорить яблоко-секретаршу остаться на корпоратив.

Делюсь полным маршрутом, как повторить дома без бюджета студии Pixar.

Главная боль новичка

Когда читаешь гайды, складывается впечатление, что нужно подписаться на пять разных платформ. ChatGPT отдельно, Midjourney отдельно, какой-то генератор видео ещё отдельно. Везде валюта, иностранные карты, VPN. На этом этапе обычно все и сдуваются.

Я обошёл проблему через Syntx AI. Это такой сервис, куда зашиты почти все рабочие нейросети сразу и по одной подписке (да, да, не нужно платить за каждую ИИ отдельно). Картинки, видео, голос, текст. Заходишь либо через сайт, либо через Telegram-бот. Платишь обычной российской картой. Никаких прокси и танцев с бубном не нужно. Новичкам там сразу падают бесплатные токены, чтобы сделать свои первые генерации.

Внутри я постоянно использую четыре инструмента:

Nano Banana Pro для генерации статичных кадров
Seedream как запасной вариант, когда первая упрямится из-за цензуры
Veo 3.1 Fast для оживления картинок
ElevenLabs для качественной озвучки

Плюс отдельный помощник в ChatGPT, его зовут Object Talk. Бесплатный агент, который заменяет мне сценариста и промпт-инженера в одном лице.

Откуда брать идеи

Многие застревают на пустом листе. Сидят и придумывают сюжет с нуля, мучаются часами. Я делаю проще: открываю TikTok, вбиваю в поиск что-нибудь типа «говорящие фрукты» или «оживший овощ», смотрю первые двадцать роликов. Записываю в заметки механики, которые повторяются.

Что точно работает прямо сейчас. Драматические сериалы с продолжением: измена, расставание, неожиданная беременность хурмы. Образовательные ролики, где морковка между делом рассказывает про каротин. Узкие нишевые истории для конкретной аудитории, типа оживших ногтей или ресниц с советами по уходу.

Я не призываю копировать чужие сюжеты. Берите идею-каркас и накручивайте свою историю.

Как агент пишет промпты вместо меня

Object Talk ищется так: открываете ChatGPT в Syntx Ai, идёте в раздел Explore GPTs, вбиваете название агента, выбираете самый популярный из выдачи. У него под миллион диалогов на счётчике.

Дальше всё прозрачно. Описываете сценку максимально подробно. Я для офисного романа писал примерно следующее: «Помещение современного офиса. Главные герои: банан в роли босса, на нём чёрный пиджак и белая рубашка. Яблоко в роли секретарши, на ней деловая блузка. Пятница, конец рабочего дня. Босс намекает на совместный ужин. Дай мне два промпта: первый под Nano Banana Pro для статичной картинки, второй под Veo 3.1 для анимации с диалогом.»

Агент выдаёт два развёрнутых блока на английском. Если уверенно читаете, работайте с оригиналом. Не уверены — закидываете в переводчик и редактируете уже на русском.

Дуэль картинок: что выбрать

Я всегда генерю в две модели параллельно. Это занимает минуту, зато потом есть из чего выбирать.

Как создавать ИИ мультики через нейросеть, инструкция

Nano Banana Pro делает чистую, аккуратную, технически безупречную картинку. Но! У неё жёсткая внутренняя цензура. Я в промпте честно написал, что у яблока должна быть откровенная блузка с глубоким декольте. Модель проигнорировала и нарисовала строгий деловой воротник. Прописал ещё раз, явно подчеркнул. Снова блузка под горло. Бесполезно.

Переключаюсь на Seedream. Та же модель промпта, тот же запрос. С первой попытки получаю именно тот образ, который задумывал. Цензура у неё ощутимо лояльнее.

При этом Seedream иногда косячит с деталями одежды. Один раз нарядила моего банана-директора в розовый свитер с оленями вместо костюма. Решилось добавлением уточнений в промпт через того же Object Talk. После второй итерации картинка идеальная.

Анимация: где спрятана главная экономия

Дальше скачиваете кадр и переходите в видео-раздел Syntx AI. Тут выбор: обычная Veo 3.1 либо Veo 3.1 Fast. Объясняю на пальцах.

Стандартная версия съедает 119 токенов за восемь секунд видео. Версия Fast укладывается в 19 токенов. Разница в шесть раз. По качеству я честно тестировал обе: разница процентов десять-пятнадцать, и заметна она только если ставить ролики рядом и сравнивать. В ленте TikTok эту разницу не увидит ни один зритель.

Формат ставите 9:16 для вертикалки, длительность 8 секунд, прикрепляете картинку. Промпт берёте у агента.

Отдельная тема — русская озвучка. Veo по умолчанию пытается переводить реплики на английский, даже если кириллицей всё прописано. Лечится так: возвращаетесь к Object Talk, просите внутри промпта несколько раз повторить инструкцию вида «реплики строго на русском языке, без перевода». Когда модель видит требование три раза, она начинает слушаться.

Грабли, которые меня поджидали

Veo путает, кто из персонажей сейчас говорит. Бывает, банан открывает рот, а звучит женский голосок яблока. Только перегенерация.

Модель додумывает невидимое. Реальный случай: на исходной картинке у яблока была видна только половина головы, обрезано рамкой. Veo решила, что под обрезом должна быть пышная розовая шевелюра. И добавила. Кадр в мусорку. Мораль: следите, чтобы все герои попадали в кадр целиком.

Норма расхода токенов на одну удачную сцену: три-четыре генерации. На сложные сцены с несколькими персонажами уходило до семи попыток. Закладывайте этот запас в бюджет.

Звук и финальная сборка

Встроенный голос от Veo звучит специфически, я называю его «яичным». Слушать можно, но если хочется по-человечески, идите в аудиораздел Syntx AI и открывайте ElevenLabs. Там фильтр по русскому языку, выбираете тембр под характер героя. Я перепробовал штук восемь голосов, для апельсина-манипулятора остановился на Викторе с лёгкой хрипотцой.

Финальный монтаж делается в любом мобильном редакторе. CapCut, InShot, что под рукой. Накидываете подходящий бит фоном тихонько. Добавляете лёгкий зум процентов на пять для динамики. Склеиваете три ролика по шесть секунд каждый.

Получается восемнадцать секунд законченного видео. Стыки маскируются короткими звуковыми эффектами либо щелчками пальцев в самой анимации, чтобы переход выглядел осмысленно.

Что делать прямо сейчас

Не пытайтесь сразу замахиваться на пятиминутный сериал с восемью персонажами. Возьмите одного героя. Один овощ, один фрукт, одну кофейную чашку. Придумайте короткую историю секунд на двадцать. Пройдите весь путь от промпта до публикации.

После трёх-четырёх таких упражнений руки запомнят процесс, и вы начнёте делать ролики на автомате. Дальше уже масштабируйте: добавляйте героев, усложняйте сюжеты, экспериментируйте с жанрами.

AI-мультики это не магия и не удел избранных. Это просто новый инструмент, который доступен каждому с ноутбуком и желанием попробовать.

Как я делаю AI-мультики для TikTok дома на диване

Главная боль новичка

Откуда брать идеи

Как агент пишет промпты вместо меня

Дуэль картинок: что выбрать

Анимация: где спрятана главная экономия

Грабли, которые меня поджидали

Звук и финальная сборка

Что делать прямо сейчас

Комментарии

Оставить комментарий

По теме

Как превратить своё фото в аниме через нейросеть: рабочий промпт, который не теряет сходство внешности

Как соединить две фотографии в одну через нейросеть: подробная инструкция и рабочий промпт

Летняя ИИ фотосессия через нейросеть: мой гайд, как за 15 минут создать яркие нейрофото