Формулировать мысли
Любые нейросети начинаются со слова. Без четко сформулированной человеком мысли генеративные модели остаются пустышками. За три года активного коммерческого использования ИИ Анатолий Гейко, вопреки распространенному страху о том, что все глупеют, научился еще точнее выражать свои требования — потому что даже промпт для нейросети нужно сначала придумать и грамотно описать.
Отсюда первый и главный принцип профессионала, по его мнению, — наблюдение. Надо учиться видеть окружающих людей, их поведение, потребности и боли, чтобы потом превращать эти наблюдения в персонажей, продукты и услуги. Без насмотренности невозможно создать убедительный образ или полезное бизнес-решение.
Переходя к практическим инструментам, спикер поделился своим опытом работы с разными текстовыми моделями. Последние несколько месяцев он отдает предпочтение нейросети Claude 4.7 Opus — она глубоко анализирует задачу и выдает промпты, которые сразу можно брать в дело, практически не редактируя.
«Если сравнить ее с GPT, он сильно умничает. Наверное, он поверил в себя, потому что появился самым первым, — говорит Анатолий Гейко. — Мне не нравится, какие результаты он выдает: слишком много сухости и моментов, которые нельзя использовать в работе».
А вот Gemini и Grok идеально подходят для кодирования или разработки сайтов.
Контекст решает все
Особое внимание спикер уделил созданию сценариев и работе с персонажами. Он советует формировать идею в вордовском файле, а затем загружать этот файл нейросети с четкой инструкцией. Для кинопроизводства важно создать «библию персонажа» — карточку с описанием внешности, характера, походки, одежды, вплоть до цвета кроссовок.
«Нейросети хорошо пишут сценарии, но с одной оговоркой. Редакция все равно всегда остается за человеком. Когда я писал сценарии с помощью ИИ, я увидел, что в нем есть некоторые моменты, где нейросеть может подзабывать детали. И если загрузить в нее идею, она очень круто сможет держать ее контекст», — Анатолий Гейко.
Единый образ
Ключевой прорыв последнего года, по словам спикера, — нейросети наконец научились сохранять консистенцию персонажа. Раньше, если человек генерировал одного и того же героя в разных ракурсах и планах, результат выглядел как набор разных людей. Теперь технология изменилась: сначала создается изображение персонажа на нейтральном фоне. Затем на основе этого изображения нейросеть по промпту генерирует «карточку персонажа» — коллаж, где герой показан в анфас, в профиль, сбоку и крупным планом. Эта карточка становится референсом для всех последующих генераций.
Любая современная модель при создании новых кадров постоянно сверяется с этим референсом: как выглядят уши, затылок, рубашка, мимика, морщины. Пользователю достаточно сфотографировать модель с четырех ракурсов и склеить кадры в один файл через фотошоп или нейросеть.
Среди инструментов спикер выделил Nano Banana и новейшую GPT Image 2. Последняя, по его мнению, уже обгоняет предшественницу: с одного промта она может выдать карточку товара с русским текстом, дизайном и даже мелкой полиграфией, сохраняя все надписи читаемыми.
«Если говорить о нейрослопе, а это, по сути, мусор, созданный с помощью нейросетей, — любая генерация делается просто. 95% того, что сейчас выдают ИИ в интернете, как раз и есть он. Качественный продукт требует осознанной и вдумчивой работы», — говорит Анатолий Гейко.
Анимация кадра
Что касается генерации видео, спикер выделил два подхода. Первый — генерация из текста. Пользователь выдает промпт, и модель делает ролик на определенное количество секунд. Но проблема в том, что нельзя увидеть промежуточный результат и контролировать то, как будут выглядеть персонаж или локация.
Второй, более надежный способ — генерация из изображения. Уже готовый кадр, например карточку персонажа на нужном фоне, можно анимировать с помощью видеомоделей.
При генерации фильмов Анатолий Гейко старается добавлять «живую» камеру — легкую тряску, покачивание, будто снимает оператор с рук, а не стабилизированная техника. Это усиливает эффект реализма и маскирует «нейронность» картинки.
Дает успех
Звуковое сопровождение — еще одна важная область. Для создания дикторских голосов Анатолий Гейко использует Eleven Labs. Эта модель умеет генерировать голос любого пола, возраста и характера, а главное — передавать эмоции.
Секрет прост: надо попросить текстовую нейросеть обработать текст с помощью медиатегов — инструкций на английском языке в квадратных скобках, которые описывают нужную интонацию. Полученную размеченную фразу отправляют в Eleven Labs, и на выходе получается эмоционально окрашенная речь, которую почти невозможно отличить от человеческой.
«Я проводил небольшой мастер-класс в институте культуры для преподавателей, которые работают со сценической речью и некоторые не смогли определить, где живой человек, а где нейросеть», — добавил спикер.
Что касается музыки и шумов, современные видеогенераторы уже умеют параллельно создавать и звуковой ряд, причем качество саунд-дизайна зачастую можно оставлять без доработки. Анатолий Гейко добавил, что видео дает лишь 40-50% успеха, остальное делает звук. Атмосфера, эффекты, музыка и слова в кадре формируют нужное эмоциональное воздействие на зрителя.
Поддержка креативных предпринимателей в Алтайском крае осуществляется по нацпроекту «Эффективная и конкурентная экономика». В регионе также создан портал, где творческие предприниматели могут стать частью креативного сообщества — мойкреатив22.рф