Seedance 2.0  - это современная нейросеть генерации видео от ByteDance, ориентированная на создание реалистичных и кинематографичных сцен с высокой степенью контроля над элементами, персонажами и аудио.

Нейросеть поддерживает до 6 изображений, 3 видео и 3 аудио в качестве референсов. Отличается многосценным сторителлингом и выразительной анимацией.


🎥 Видео YouTube

Seedance 2.0 - обновлённая модель от ByteDance, которая принимает текст, изображения, аудио и видео одновременно и собирает из этого кинематографическое видео с родным звуком. Сегодня разбираем каждый режим и смотрим, на что она способна.

Переходите по ссылке ниже 👇

Что творит SeeDance 2.0? Полный разбор


🎛 Навигация

🏠Главное меню > 🎬 Видео будущего > 🧿 Seedance 2.0


💥 Пошаговое руководство по использованию Seedance 2.0 «Текст в видео»

Первым делом при работе с функцией “Текст в видео”, вам необходимо корректно составить текстовой запрос.

Составление текстового запроса

Качественная генерация напрямую зависит от того, насколько точно и последовательно описана сцена. Важно не просто задать идею, а зафиксировать персонажа, окружение и поведение, чтобы избежать искажений и случайных изменений в процессе генерации.

Хороший текстовый запрос должен включать в себя:

  1. Описание персонажа/объекта

На этом этапе необходимо максимально подробно зафиксировать внешний вид персонажа или объекта. Важно указать ключевые черты: лицо, телосложение, причёску, одежду, материалы, форму, цвет и другие визуальные особенности. Если в видео участвует один и тот же персонаж или объект, это нужно обозначить отдельно, чтобы модель сохраняла его внешний вид на протяжении всей генерации, например:

«Same person in all shots. Preserve exact appearance throughout. Stable face throughout.»

  1. Действие

Необходимо чётко описать, что именно делает персонаж или объект, в какой последовательности происходят действия и как они взаимодействуют с окружением. Лучше использовать конкретные формулировки: не «идёт красиво», а «идёт вперёд уверенным шагом, поворачивает голову в камеру, поправляет воротник». Чем точнее заданы движения и их логика, тем стабильнее и понятнее результат.

  1. Локация

Необходимо подробно описать и зафиксировать пространство, в котором происходит сцена: интерьер или экстерьер, расположение объектов, атмосферу, фон и важные детали окружения.

  1. Освещение

Освещение задаёт настроение и глубину сцены, поэтому его желательно указывать отдельно. Можно описывать источник света, его характер и цвет: мягкий дневной свет, жёсткий контровой свет, тёплое объёмное освещение, неоновые акценты и т.д.

  1. Движение камеры

Важно указать тип съёмки и движение камеры, так как именно они определяют динамику видео. Можно комбинировать разные подходы: плавные пролёты, резкие приближения, смену ракурсов и т.д.

  1. Ограничения и стабильность

В завершении запроса рекомендуется зафиксировать технические ограничения, которые помогают сделать результат чище и стабильнее. Обычно здесь указывают отсутствие искажений, мерцания, деформаций, случайных изменений лица, одежды или сцены, например:

«No deformation. No flickering. No ghosting. Stable face throughout. Realistic physics.»

Дополнительные рекомендации:

  • Избегайте размытых формулировок («красиво», «интересно», «круто») - они не дают модели чёткого понимания результата
  • При необходимости разбивайте сценарий по времени (например: [0–3s], [3–6s]) для более точного контроля динамики и последовательности действий
  • При работе с персонажами фиксируйте их внешний вид и поведение, чтобы избежать случайных изменений
  • Рекомендуется писать запросы на английском языке, так модель точнее интерпретирует формулировки и лучше понимает детали, стили и движения камеры. Это особенно важно для сложных сцен и динамики, где требуется высокая точность результата
  • Чем подробнее и точнее описан запрос, тем более качественным и предсказуемым будет результат.

Пример запроса:

« A blue elephant with smooth cartoon skin, large expressive eyes, big ears and a rounded body, standing on sand near the ocean. The elephant has a soft stylized look with clean shapes and subtle shading. Same elephant in all shots. Preserve exact appearance throughout. Stable character consistency.

The elephant calmly walks along the beach, leaving footprints in the sand. Suddenly, a powerful burst of sand explodes upward in front of it, scattering particles in all directions. From the explosion, a crocodile rapidly emerges, pushing through the sand with dynamic motion. At the same moment, penguins begin falling from the sky in different directions, landing around the scene and sliding across the sand. The moment turns into chaotic animal interaction: the elephant reacts with surprise, the crocodile moves energetically through the sand, penguins tumble and scatter, creating a playful, high-energy sequence.

The setting is a beach by the ocean with soft sand, gentle waves and a clear horizon. The environment remains the same, but becomes more dynamic during the action, starting calm, then transitioning into an energetic scene with multiple animals interacting across the frame.

Lighting starts as bright sunny daylight with warm tones, then intensifies during the explosion with stronger highlights and contrast, maintaining a vibrant, colorful cartoon atmosphere. Reflections on the water and highlights on the characters remain clean and stylized.

The camera begins with a smooth slow tracking shot following the elephant, then shifts into dynamic cinematic movement: crash zoom during the sand explosion, fast handheld-style motion for chaotic action, quick cuts between angles, low-angle shots to emphasize scale, and a brief orbital shot capturing all animals in motion. The sequence ends with a stabilized wide shot capturing the full chaotic scene.

Style: Pixar-like 3D animation, soft rounded shapes, high detail, expressive characters, vibrant colors. Color palette includes bright blues, warm sand tones and colorful accents from the animals. Tone is playful, energetic and slightly absurd.

4K cinematic, ultra detail, sharp focus, smooth animation, stylized physics with believable motion, high-quality particle effects for sand. No deformation, no flickering, no ghosting, stable appearance throughout, clean animation, 4K cinematic.»

Результат:

Настройки модели

После отправки текстового запроса, вам необходимо нажать кнопку «Настроить и запустить» и далее корректно проставить настройки для будущей генерации.

❣️Если вы хотите удалить отправленный запрос, нажмите кнопку «Удалить» или «Удалить всё». После этого вы сможете отправить новый запрос.

Промпт

При необходимости Вы можете скорректировать свой запрос в поле промпта. Если его оставить не тронутым, то при генерации возьмется текстовой запрос, который был отправлен вами изначально.

Режим

При работе по текстовому запросу вам предоставляется два режима на выбор:

Pro - режим с максимальным качеством генерации. Обеспечивает более детализированную картинку, реалистичную анимацию и точную проработку сцен, подходит для финальных видео.

Fast - быстрый режим генерации, оптимально подходит для тестов. Позволяет оперативно проверять идеи и сценарии, но может уступать в детализации и точности. Также имеет ограниченный выбор настроек качества.

Разрешение

При работе по текстовому запросу вам доступно три варианта разрешения:

• 480p

Базовое разрешение видео. Оно идеально подходит для просмотра на небольших экранах мобильных устройств и экономит интернет-трафик. Видео может выглядеть немного размытым, а мелкие детали будут не очень четкими.

• 720p

Среднее разрешение видео. Обеспечивает хороший баланс между качеством видео и размером файла. Этот формат стал популярным стандартом для онлайн-видео, включая YouTube, и обеспечивает четкую картинку, комфортную для просмотра на телевизорах среднего размера и большинстве современных устройств.

• 1080p

Представляет собой высококачественный формат видео, обеспечивающий превосходную детализацию и четкость. Этот формат идеально подходит для просмотра на больших экранах и телевизорах, хотя требует более быстрого интернет-соединения и занимает значительно больше места на устройстве хранения, но взамен предоставляет максимально четкое и детализированное видео.

❣️Разрешение 1080р доступно только при работе в Pro режиме.

Аудио

При работе в нейросети Seedance 2.0 у вас есть возможность создавать видео с аудио.

Чтобы добавить звуковые эффекты, включите ползунок - нейросеть автоматически подберёт и наложит аудио.

Если вы предпочитаете генерацию без звука - необходимо выключить ползунок.

Соотношение сторон

При работе по текстовому запросу вам доступно 6 вариантов соотношения сторон на выбор:

Длительность

У вас есть возможность установить длительность будущего видео от 1 до 15 секунд.

❣️Обратите внимание, что по умолчанию длительность в настройках выставлена на 4 секунды.

Примеры генераций

«A 27-year-old woman with long dark hair, pale skin, sharp facial features and a slim build. Same person in all shots. Preserve exact appearance throughout. Stable face throughout. She wears a modern black tailored suit with a fitted blazer, minimalistic design, matte fabric with subtle reflections.

Visual style: luxury minimalism, high contrast, monochrome palette with black, white and silver tones, soft cinematic lighting, clean reflections, premium aesthetic. Location: a large modern glass corridor with polished floors, floor-to-ceiling windows, and city skyline visible outside. Environment remains consistent throughout.

She walks forward with slow, confident steps, her reflection clearly visible on the glossy floor. As she moves, the environment subtly reacts — light shifts across the glass surfaces, reflections stretch and realign. She stops, slightly adjusts her sleeve, then continues walking. Midway, she turns sharply, and the camera shifts perspective, creating a dynamic visual transition. She places her hand on the glass wall, and a subtle ripple of light spreads outward. She resumes walking, then stops and looks directly into the camera with a calm, confident expression.

Camera: smooth tracking shots, low angles, slow push-ins and controlled orbital movement, stabilized cinematic motion, 35mm lens.

4K cinematic, ultra high detail, realistic reflections, volumetric lighting, high motion clarity. Stable face throughout. No morphing. No deformation. No flickering. No ghosting.»

«A fashion lifestyle lookbook shot from the top down, cinematic quality, ultra-high 8K resolution, smooth transitions, clean composition, soft realistic aesthetic with a cozy yet premium mood. Fixed overhead view (bird’s eye view), camera locked in position. A modern neutral-toned sofa placed in the center of a minimalistic apartment interior. Surroundings subtly change with props, but the base environment remains consistent. Clean textures, warm light, realistic materials. A young blonde woman with long soft hair, light skin, delicate facial features and expressive eyes, lying on the sofa in the same position throughout all scenes. Same person in all shots. Preserve exact appearance throughout. Stable face throughout. Only her outfits, props and small movements change smoothly.
[00:00–00:03] She is sleeping under a soft blanket, gentle breathing, hair spread on the pillow, morning light slowly filling the space.
[00:03–00:05] Instant transition — she now wears a fabric face mask with cucumber slices on her eyes, a small tray with skincare items appears, she slightly adjusts the mask in a relaxed mood.
[00:05–00:07] Soft transition — she is in a light home outfit, a breakfast tray appears with coffee and a croissant, she takes a slow bite, calm expression.
[00:07–00:09] Instant transition — a laptop appears on her lap, she types quickly, focused, a phone and notebook lie nearby.
[00:09–00:11] Hard transition — she is now more dressed, talking on the phone with a slightly irritated expression, gesturing with her free hand, movement becomes more active.
[00:11–00:13] Smooth transition — she is wearing an elegant party dress, a mirror and makeup items appear, she adjusts her hair and checks her look confidently.
[00:13–00:15] Final hold — she looks directly up toward the camera, fully ready for the party, confident and slightly playful expression, clean composition, minimal props.

Realistic natural sound design only, no music. Soft breathing, fabric movement, subtle sofa creaks, ambient room tone, light kitchen sounds during breakfast, keyboard typing, phone handling sounds, subtle voice during the call, natural object interaction sounds, all synchronized with actions.

Lighting: soft global illumination, warm indoor tones, gentle shadows, cinematic clean look, high quality render. Camera: fixed top-down shot, no movement, transitions and actions create the dynamic. 4K cinematic, high detail, realistic materials, smooth transitions. Stable face throughout. No morphing. No deformation. No flickering. No ghosting.»

«Key Concept: High-speed fashion photoshoot with rapid pose and styling changes within a single studio location, creating the effect of a continuous editorial shoot where each cut reveals a new pose, outfit variation, and prop change. Strong fashion energy, stylish and expressive. Final moment slows down for a confident closing pose. Transition mechanics: fast snap cuts with subtle motion blur, each cut introduces a new pose and slight prop or styling variation while staying in the same studio space. Character: young woman, early 20s, long pink hair, slim build, clear skin, defined facial features, confident and expressive, high-fashion presence, same character throughout with strict consistency. Setting: single professional photo studio with neutral seamless backdrop, controlled lighting setup, props changing between cuts (chair, fabric, fan, light panels, mirror).

[0:00–0:02] Medium shot, stabilized camera. The model stands in a clean studio setup, long pink hair flowing, wearing a stylish outfit, strong direct eye contact. Snap cut begins.

[0:02–0:03] Cut to new pose, hand near face, sharper expression, slight lighting shift.

[0:03–0:04] Full body shot, strong silhouette, a chair appears as prop, outfit variation visible.

[0:04–0:05] Close-up, focus on face and pink hair texture, soft highlights.

[0:05–0:06] Dynamic pose mid-movement, fabric slightly flowing, prop changes to fabric backdrop.

[0:06–0:07] Seated pose using chair, relaxed but confident posture.

[0:07–0:08] Cut to standing pose with fan blowing hair, more dynamic energy, hair movement emphasized.

[0:08–0:09] Close-up with mirror prop, reflection briefly visible, subtle head tilt.

[0:09–0:10] Full body pose, sharper angular stance, lighting becomes slightly more contrasty.

[0:10–0:11] Quick turn pose, mid-motion freeze-like fashion moment.

[0:11–0:12] Leaning pose against minimal prop, calm confident expression.

[0:12–0:13] Close-up, direct eye contact, minimal movement, strong editorial frame.

[0:13–0:15] Final sequence slows down. Clean studio frame with minimal props. Model holds a strong final pose, slight head tilt and micro-expression. Camera slowly pulls back to reveal full composition, ending on a polished fashion editorial look.

Stabilized camera, fast snap transitions with subtle motion blur, consistent character appearance throughout, no face changes, realistic fabric and hair movement, clean fashion lighting, no flickering, no ghosting, stable image, realistic motion, 4K cinematic quality.»

[0–3s] A hamster chef with fluffy beige fur and round cheeks cracks its tiny paws, adjusts a small chef hat with a confident smirk, camera zooms in. It begins rapidly chopping vegetables for ramen, movements lightning-fast, pieces falling perfectly into a bowl while scraps neatly fly aside.

[4–7s] Transition into a fast-paced montage: noodles are tossed into the air and softly fall back, broth pours into the bowl with a glossy shine, green onions are sliced with machine-gun precision, droplets of broth sparkle in the light, the hamster whisks ingredients so fast its body slightly vibrates.

[8–11s] It spins 360 degrees, carefully assembling the ramen: placing noodles, adding eggs, greens, and meat with surgical precision, tongue slightly out in concentration. It pushes the bowl forward with one confident motion, warm steam rising as soft light illuminates its face.

[12–15s] The hamster lifts the finished bowl of ramen, gently blows on it, then happily tastes the noodles. After that, it holds the dish in front of its chest with both paws, looks into the camera with a proud smile and winks. Final glossy highlight on the surface of the broth.

Style: Pixar-like 3D animation, soft shapes, high detail, warm volumetric lighting, cozy kitchen atmosphere. Sound: chopping, simmering broth, mixing, light sizzling, finishing with a warm musical accent.

4K Ultra HD, high detail, sharp image, cinematic texture, stable frame. Maintain character consistency, no distortion, smooth animation.»


💥 Пошаговое руководство по использованию Seedance 2.0 «Работа с референсами»

Первым делом при работе с изображениями, вам необходимо корректно их загрузить.

Загрузка изображений

Технические требования к изображениям:

  • Вы можете добавлять изображения в формате JPG и PNG.
  • Максимальный вес файла: до 10 MB.
  • Максимальное количество загружаемых изображений: 6.

Например:

Работа по одному изображению

Настройки модели

После загрузки изображения, вам необходимо выбрать кнопку «Настроить и запустить» и далее корректно проставить настройки для будущей генерации.

❣️Если вы хотите удалить отправленное изображение, нажмите кнопку «Удалить» или «Удалить всё». После этого вы сможете отправить новый запрос.

Промпт

Качественная генерация напрямую зависит от того, насколько точно и последовательно описана сцена. Важно не просто задать идею, а зафиксировать персонажа, окружение и поведение, чтобы избежать искажений и случайных изменений в процессе генерации.

Хороший текстовый запрос должен включать в себя:

  1. Описание персонажа/объекта

На этом этапе необходимо максимально подробно зафиксировать внешний вид персонажа или объекта. Важно указать ключевые черты: лицо, телосложение, причёску, одежду, материалы, форму, цвет и другие визуальные особенности. Если в видео участвует один и тот же персонаж или объект, это нужно обозначить отдельно, чтобы модель сохраняла его внешний вид на протяжении всей генерации, например:

«Same person in all shots. Preserve exact appearance throughout. Stable face throughout.»

  1. Действие

Необходимо чётко описать, что именно делает персонаж или объект, в какой последовательности происходят действия и как они взаимодействуют с окружением. Лучше использовать конкретные формулировки: не «идёт красиво», а «идёт вперёд уверенным шагом, поворачивает голову в камеру, поправляет воротник». Чем точнее заданы движения и их логика, тем стабильнее и понятнее результат.

  1. Локация

Необходимо подробно описать и зафиксировать пространство, в котором происходит сцена: интерьер или экстерьер, расположение объектов, атмосферу, фон и важные детали окружения.

  1. Освещение

Освещение задаёт настроение и глубину сцены, поэтому его желательно указывать отдельно. Можно описывать источник света, его характер и цвет: мягкий дневной свет, жёсткий контровой свет, тёплое объёмное освещение, неоновые акценты и т.д.

  1. Движение камеры

Важно указать тип съёмки и движение камеры, так как именно они определяют динамику видео. Можно комбинировать разные подходы: плавные пролёты, резкие приближения, смену ракурсов и т.д.

  1. Ограничения и стабильность

В завершении запроса рекомендуется зафиксировать технические ограничения, которые помогают сделать результат чище и стабильнее. Обычно здесь указывают отсутствие искажений, мерцания, деформаций, случайных изменений лица, одежды или сцены, например:

«No deformation. No flickering. No ghosting. Stable face throughout. Realistic physics.»

Дополнительные рекомендации:

  • Избегайте размытых формулировок («красиво», «интересно», «круто») - они не дают модели чёткого понимания результата
  • При необходимости разбивайте сценарий по времени (например: [0–3s], [3–6s]) для более точного контроля динамики и последовательности действий
  • При работе с персонажами фиксируйте их внешний вид и поведение, чтобы избежать случайных изменений
  • Рекомендуется писать запросы на английском языке, так модель точнее интерпретирует формулировки и лучше понимает детали, стили и движения камеры. Это особенно важно для сложных сцен и динамики, где требуется высокая точность результата
  • Чем подробнее и точнее описан запрос, тем более качественным и предсказуемым будет результат.
Система тегов

Главной особенностью при работе с референсами в данном инструменте является система тегов. Чтобы добавить тег в запрос, нажмите на миниатюру нужного изображения - тег будет автоматически вставлен в поле запроса.

Это помогает нейросети точнее понимать, какое изображение необходимо использовать в определённой части запроса.

Например:

«@ref1 — exact full-body identity, pose, outfit, and environment reference for the main character and the starting frame. Use @ref1 as the strict reference for the man’s body type, hair, facial structure, glasses, beard, clothing, posture, pointing gesture, room layout, gray walls, floor tiles, corner geometry, and the fork on the floor. Main character is an adult male with short brown hair, light skin, glasses, short beard, average heavyset build, wearing a light gray knit sweater, dark loose pants, and tan shoes. Preserve exact likeness throughout. No beautification. No deformation. Stable face throughout.

Visual style and color palette: cinematic live-action fantasy realism, grounded modern interior lighting, subtle 35mm film grain, realistic materials, soft neutral gray walls, cool concrete-gray floor tiles, charcoal trim, pale beige skin tones, warm golden magical light, glowing amber runes, volumetric dust, soft white portal core, controlled contrast, dramatic but believable supernatural lighting.

Location and atmosphere: a plain indoor hallway corner matching @ref1 exactly, with gray painted walls, black-gray base trim, light speckled tile floor, and a metal fork lying near the wall. The space begins as an ordinary modern interior, quiet and still, then transforms into a supernatural event localized around the fork. The magic feels ancient, luminous, and physically powerful, while the environment remains realistic and grounded.

[0:00-0:03] Medium wide shot, stabilized camera, slow push in from slightly above waist level, matching the perspective of @ref1. The man is crouched and pointing directly at the fork on the floor near the wall corner. He studies it with cautious curiosity. As his finger hovers toward it, a faint circle of glowing magical symbols begins to appear around him on the floor, tracing itself outward in amber light. The runes rotate slowly and cast soft reflections onto the tiles. 4K cinematic, IMAX quality.

[0:03-0:06] Closer medium shot, handheld with subtle tension shake. The magical circle around him brightens and completes itself, surrounding his feet and expanding toward the fork. Additional floating rune fragments rise in the air around his arm and shoulder. He notices the change and shifts his balance, startled but still pointing. The fork begins to vibrate slightly on the floor. Dust grains and tiny debris start to lift from the tiles as energy gathers in the corner.

[0:06-0:09] Low-angle close shot focused on the fork and floor, stabilized camera with a slow arc move. The tile directly beneath the fork darkens and opens into a circular bottomless portal, edged with molten-looking glowing symbols. A blinding white-gold light erupts upward from inside the portal. The fork hovers above the opening, trembling in the beam. Wind starts blasting outward from the portal, pushing dust and loose particles across the floor and rippling the man’s sweater hem.

[0:09-0:12] Dynamic medium shot, handheld with stronger shake for impact. The portal expands slightly and releases a powerful upward burst of light, wind, and swirling dust. The man stumbles backward and braces himself, one arm thrown out for balance while the other instinctively shields his face. His sweater and pant legs whip in the wind, and his glasses catch the flare from the portal light. Use slow motion 120fps during the strongest burst of air and flying dust, then snap to real-time as he nearly loses footing.

[0:12-0:15] Wide shot, stabilized camera with a slight crane back and up. The man is barely holding his stance at the edge of the glowing symbol circle as the portal roars beneath the fork. The beam of light streams upward, dust spins through the hallway, and the rune circle around him pulses in sync with the portal. End on a dramatic frame with the ordinary gray hallway transformed by ancient magic, the man leaning against the force of the wind, and the fork suspended above the bottomless opening.

Stable face throughout. No morphing. No deformation. No flickering. No ghosting. Realistic physics. 4K cinematic.»

Результат:

Режим

При работе с референсом вам предоставляется два режима на выбор:

Pro - режим с максимальным качеством генерации. Обеспечивает более детализированную картинку, реалистичную анимацию и точную проработку сцен, подходит для финальных видео.

Fast - быстрый режим генерации, оптимально подходит для тестов и быстрых итераций. Позволяет оперативно проверять идеи и сценарии, но может уступать в детализации и точности. Также имеет ограниченный выбор настроек качества.

Разрешение

При работе с референсом вам доступно три варианта разрешения:

• 480p

Базовое разрешение видео. Оно идеально подходит для просмотра на небольших экранах мобильных устройств и экономит интернет-трафик. Видео может выглядеть немного размытым, а мелкие детали будут не очень четкими.

• 720p

Среднее разрешение видео. Обеспечивает хороший баланс между качеством видео и размером файла. Этот формат стал популярным стандартом для онлайн-видео, включая YouTube, и обеспечивает четкую картинку, комфортную для просмотра на телевизорах среднего размера и большинстве современных устройств.

• 1080p

Представляет собой высококачественный формат видео, обеспечивающий превосходную детализацию и четкость. Этот формат идеально подходит для просмотра на больших экранах и телевизорах, хотя требует более быстрого интернет-соединения и занимает значительно больше места на устройстве хранения, но взамен предоставляет максимально четкое и детализированное видео.

❣️Разрешение 1080р доступно только при работе в Pro режиме.

Аудио

При работе в нейросети Seedance 2.0 у вас есть возможность создавать видео с аудио.Чтобы добавить звуковые эффекты, включите ползунок - нейросеть автоматически подберёт и наложит аудио.

Если вы предпочитаете генерацию без звука - необходимо выключить ползунок.

Соотношение сторон

При работе с референсами вам доступно 6 вариантов соотношения сторон на выбор:

Длительность

У вас есть возможность установить длительность будущего видео от 1 до 15 секунд.

❣️Обратите внимание, что по умолчанию длительность в настройках выставлена на 4 секунды.

Работа с несколькими изображениями

Настройки модели

После загрузки изображений, вам необходимо выбрать кнопку «Настроить и запустить» и далее корректно проставить настройки для будущей генерации.

❣️Если вы хотите удалить отправленные изображения, нажмите кнопку «Удалить» или «Удалить всё». После этого вы сможете отправить новый запрос.

Промпт

Качественная генерация напрямую зависит от того, насколько точно и последовательно описана сцена. Важно не просто задать идею, а зафиксировать персонажа, окружение и поведение, чтобы избежать искажений и случайных изменений в процессе генерации.

Хороший текстовый запрос должен включать в себя:

  1. Описание персонажа/объекта

На этом этапе необходимо максимально подробно зафиксировать внешний вид персонажа или объекта. Важно указать ключевые черты: лицо, телосложение, причёску, одежду, материалы, форму, цвет и другие визуальные особенности. Если в видео участвует один и тот же персонаж или объект, это нужно обозначить отдельно, чтобы модель сохраняла его внешний вид на протяжении всей генерации, например:

«Same person in all shots. Preserve exact appearance throughout. Stable face throughout.»

  1. Действие

Необходимо чётко описать, что именно делает персонаж или объект, в какой последовательности происходят действия и как они взаимодействуют с окружением. Лучше использовать конкретные формулировки: не «идёт красиво», а «идёт вперёд уверенным шагом, поворачивает голову в камеру, поправляет воротник». Чем точнее заданы движения и их логика, тем стабильнее и понятнее результат.

  1. Локация

Необходимо подробно описать и зафиксировать пространство, в котором происходит сцена: интерьер или экстерьер, расположение объектов, атмосферу, фон и важные детали окружения.

  1. Освещение

Освещение задаёт настроение и глубину сцены, поэтому его желательно указывать отдельно. Можно описывать источник света, его характер и цвет: мягкий дневной свет, жёсткий контровой свет, тёплое объёмное освещение, неоновые акценты и т.д.

  1. Движение камеры

Важно указать тип съёмки и движение камеры, так как именно они определяют динамику видео. Можно комбинировать разные подходы: плавные пролёты, резкие приближения, смену ракурсов и т.д.

  1. Ограничения и стабильность

В завершении запроса рекомендуется зафиксировать технические ограничения, которые помогают сделать результат чище и стабильнее. Обычно здесь указывают отсутствие искажений, мерцания, деформаций, случайных изменений лица, одежды или сцены, например:

«No deformation. No flickering. No ghosting. Stable face throughout. Realistic physics.»

Дополнительные рекомендации:

  • Избегайте размытых формулировок («красиво», «интересно», «круто») - они не дают модели чёткого понимания результата
  • При необходимости разбивайте сценарий по времени (например: [0–3s], [3–6s]) для более точного контроля динамики и последовательности действий
  • При работе с персонажами фиксируйте их внешний вид и поведение, чтобы избежать случайных изменений
  • Рекомендуется писать запросы на английском языке, так модель точнее интерпретирует формулировки и лучше понимает детали, стили и движения камеры. Это особенно важно для сложных сцен и динамики, где требуется высокая точность результата
  • Чем подробнее и точнее описан запрос, тем более качественным и предсказуемым будет результат.
Система тегов

Главной особенностью при работе с референсами в данном инструменте является система тегов. Чтобы добавить тег в запрос, нажмите на миниатюру нужного изображения - тег будет автоматически вставлен в поле запроса.

Это помогает нейросети точнее понимать, какое изображение необходимо использовать в определённой части запроса.

Например:

«@ref1 — exact identity reference for the main character. Use @ref1 as the strict identity reference for the man’s face, hairstyle, glasses, beard, body type, proportions, and overall likeness. Main character is an adult light-skinned male with short brown hair, glasses, short beard, average heavyset build. Preserve exact likeness throughout. No beautification. No deformation. Stable face throughout.

@ref2 — exact outfit reference for the main character. Use @ref2 as the strict wardrobe reference for the transformed streetwear sports look: black long-sleeve athletic top with white shoulder and sleeve stripes, black wide athletic pants with white side stripes, black crossbody bag, black over-ear headphones, and black sneakers with white stripes and gum soles. Apply this exact full outfit to the main character while preserving his exact identity from @ref1.

@ref3— exact environment reference for the duel scene. Use @ref3as the strict location reference for the urban alley courtyard: brick buildings, chain-link fence, sidewalk, scattered trash bags, dumpsters, small boxes, pallet, fire escape, and warm late-afternoon city light.

Visual style and color palette: cinematic live-action urban action comedy, hyper-serious dramatic tone with absurd stakes, grounded realism, 35mm film grain, high contrast late-afternoon sunlight, warm amber highlights on brick walls, cool gray pavement, black sportswear with crisp white stripe accents, dusty air, sharp shadows, premium action-film framing.

Location and atmosphere: the entire scene takes place in the alley courtyard from @ref3. Start immediately in the alley with the fork already on the ground in the center like a sacred object. The main character is already transformed into the exact outfit from @ref2. The tone is intensely serious, stylish, and exaggerated, like a legendary neighborhood duel over a completely ordinary fork. A rival emerges from the shadows and challenges him through posture and movement only. No graphic violence.

[0:00-0:03] Wide cinematic establishing shot in the alley from @ref3, stabilized camera, slow low-angle push in from street level. The main character stands in the exact outfit from @ref2, facing the center of the alley with intense focus. The ordinary fork lies on the pavement between him and an empty shadowed space near the fence. Wind moves lightly through the alley, dust drifts near the ground, and the crossbody bag and pant legs move naturally. From the shadowed side near the fence, a second adult male rival steps forward slowly. He is a different person with a different face and identity, athletic build, wearing dark urban streetwear. Both men lock eyes, then glance down at the fork.

[0:03-0:06] Medium close-ups and dramatic inserts, handheld with subtle tension shake. Tight close-up on the main character’s face: glasses, short beard, focused eyes, determined jaw. Tight close-up on the rival’s stern face. Low-angle insert on the fork resting on the pavement in the exact center between them. Close-up of shoes shifting into fighting stance. The main character circles one step left, the rival mirrors him from the opposite side. The camera slowly orbits around the fork, making it feel sacred and absurdly important.

[0:06-0:09] Dynamic action burst, aggressive handheld tracking shot. Both men suddenly sprint toward the fork at the exact same moment. The rival lunges first. The main character performs a sharp sidestep and pivots around him, using speed and body positioning rather than direct impact. He slides low across the pavement, one hand reaching toward the fork. The rival reacts instantly, cutting across and forcing a last-second miss. The camera tracks tightly with the movement, keeping the fork centered in the action.

[0:09-0:12] Fast cinematic duel sequence, mixed low-angle tracking and orbital motion. The rival jumps over the pallet and lands closer to the fork. The main character spins, regains balance, and rushes back in. Use slow motion 120fps for the most dramatic moment: both men dive for the fork at once, shoes skid across the pavement, dust kicks up, sunlight flashes across the metal fork, clothing and bag swing realistically, and the camera whips around them in a heroic circular motion. Snap to real-time as the main character narrowly gains position.

[0:12-0:15] Hero victory ending, stabilized camera with slight crane up and subtle orbit. The main character rises first and lifts the ordinary fork upright like a sacred trophy, breathing hard and looking triumphant. The rival stops and lowers his stance in disbelief, defeated by timing and precision. Warm late-afternoon sunlight hits the fork and the black sports outfit with exaggerated cinematic glory. End on a powerful absurd frame: the main character in the alley from @ref3, wearing the exact outfit from @ref2, standing like a neighborhood champion while proudly holding the completely ordinary fork.

Stable face throughout. No morphing. No deformation. No flickering. No ghosting. Realistic physics. 4K cinematic.»

Результат:

Режим

При работе с референсами вам предоставляется два режима на выбор:

Pro - режим с максимальным качеством генерации. Обеспечивает более детализированную картинку, реалистичную анимацию и точную проработку сцен, подходит для финальных видео.

Fast - быстрый режим генерации, оптимально подходит для тестов и быстрых итераций. Позволяет оперативно проверять идеи и сценарии, но может уступать в детализации и точности. Также имеет ограниченный выбор настроек качества.

Разрешение

При работе с референсами вам доступно три варианта разрешения:

• 480p

Базовое разрешение видео. Оно идеально подходит для просмотра на небольших экранах мобильных устройств и экономит интернет-трафик. Видео может выглядеть немного размытым, а мелкие детали будут не очень четкими.

• 720p

Среднее разрешение видео. Обеспечивает хороший баланс между качеством видео и размером файла. Этот формат стал популярным стандартом для онлайн-видео, включая YouTube, и обеспечивает четкую картинку, комфортную для просмотра на телевизорах среднего размера и большинстве современных устройств.

• 1080p

Представляет собой высококачественный формат видео, обеспечивающий превосходную детализацию и четкость. Этот формат идеально подходит для просмотра на больших экранах и телевизорах, хотя требует более быстрого интернет-соединения и занимает значительно больше места на устройстве хранения, но взамен предоставляет максимально четкое и детализированное видео.

❣️Разрешение 1080р доступно только при работе в Pro режиме.

Аудио

При работе в нейросети Seedance 2.0 у вас есть возможность создавать видео с аудио.Чтобы добавить звуковые эффекты, включите ползунок - нейросеть автоматически подберёт и наложит аудио.

Если вы предпочитаете генерацию без звука - необходимо выключить ползунок.

Соотношение сторон

При работе с референсами вам доступно 6 вариантов соотношения сторон на выбор:

Длительность

У вас есть возможность установить длительность будущего видео от 1 до 15 секунд.

❣️Обратите внимание, что по умолчанию длительность в настройках выставлена на 4 секунды.

Примеры генераций

«@ref1 — strict identity reference for the main character only. Use @ref1 only for the man’s facial features, hairstyle, glasses, beard, body type, age, proportions, and overall likeness. The main character is an adult light-skinned male with short brown hair, glasses, a short beard, and an average heavyset build. Do not use the original pose, corridor setup, fork, or any objects from @ref1. Preserve exact likeness throughout. No beautification. No deformation. Stable face throughout.
@ref2 — exact outfit reference for the main character. Use @ref2 as the strict clothing reference for the kimono ensemble: light sage-beige haori outer robe, muted olive inner kimono layers, dark charcoal-brown pleated hakama, traditional waist ties, wide sleeves, layered fabric silhouette, and authentic formal proportions.
@ref3 — exact environment reference for the scene. Use @ref3 as the strict location reference for the urban alley courtyard: brick walls, chain-link fence, sidewalk edge, dumpsters, scattered trash bags, wooden pallet, fire escape, graffiti, and late-afternoon city light. Keep the alley layout and grounded urban atmosphere.
@ref4 — exact prop reference for the main character. Use @ref4 as the strict reference for the folding hand fan: cream paper surface, painted botanical artwork, wooden ribs, elegant traditional construction, and natural hand-held scale.
Visual style and color palette: cinematic live-action parody of an epic battle introduction, hyper-serious tone with restrained absurdity, grounded realism, IMAX quality, subtle 35mm film grain, warm amber late-afternoon sunlight, dusty beige concrete, muted red-brown brick, black iron fire escape, sage-beige kimono fabric, dark charcoal hakama, cream fan with ink-style botanical details. Premium dramatic framing, strong contrast, sharp shadows, rich fabric motion.
Location and atmosphere: the entire video takes place in the urban alley courtyard from @ [0:00-0:03] Wide establishing shot, stabilized camera, slow low-angle push in from the sidewalk into the alley from @ref3. The main character already stands centered beyond the chain-link opening, wearing the exact kimono and hakama from @ref2 and holding the folded fan from @ref4 at his side. He is motionless, shoulders squared, staring forward with intense seriousness. Wind lightly stirs the robe sleeves and hakama pleats. The alley debris, dumpsters, fence, and fire escape remain clearly visible, making the scene feel like a grand battle intro in a completely ordinary urban courtyard.
[0:03-0:06] Medium close-up, stabilized camera with subtle forward drift. Frame the exact face from @ref1: short brown hair, glasses, short beard, focused eyes, stern expression. He slowly raises the folded fan from waist level to chest level with ritual precision, as if preparing to reveal a legendary weapon. The kimono layers from @ref2 shift naturally with the movement. Warm sunlight hits one side of his face while the background alley stays gritty and grounded.
[0:06-0:09] Heroic low-angle shot, slight orbital camera movement around the character. He snaps the folding fan open in one deliberate, dramatic motion. Emphasize the exact fan design from @ref4: cream paper, painted botanical artwork, wooden ribs. The motion is treated with exaggerated importance. The sleeves flare slightly, dust moves near the ground, and the camera circles as if introducing a final boss before battle.
[0:09-0:12] Dynamic pose sequence, handheld with controlled tension and short tracking movement. The character performs two or three intensely serious martial-looking stances using only the fan: one side-facing defensive pose, one forward-leaning challenge pose, one still upright finishing pose. Every movement is elegant and overcommitted, but there is no opponent and no combat. The comedy comes entirely from the mismatch between the alley from @ref3 and the grand cinematic seriousness of the poses.
[0:12-0:15] Final heroic tableau, stabilized slight crane up with subtle orbit. The character freezes in his ultimate “battle-ready” stance, holding the open fan near his face or shoulder, eyes locked forward with absolute conviction. The kimono from @ref2 flows softly in the alley breeze, the fan from @ref4 is clearly readable, and the exact identity from @ref1 remains fully recognizable. End like the title-card shot of an epic showdown, except nothing has happened except a sequence of dramatically serious fan poses in the middle of the alley.
Stable face throughout. No morphing. No deformation. No flickering. No ghosting. Realistic physics. 4K cinematic.

«@ref1 — strict identity reference for the main character only. Use @ref1 only for the man’s facial features, hairstyle, glasses, beard, body type, age, proportions, and overall likeness. The main character is an adult light-skinned male with short light brown hair, glasses, a short beard, and a broad average-heavy build. Do not use the original pose, corridor, pointing gesture, or any object from @ref1. Preserve exact likeness throughout. No beautification. No deformation. Stable face throughout.

@ref2 — exact environment reference for the supermarket checkout scene. Use @ref2 as the strict location reference for the grocery checkout area: cashier station, conveyor belt, checkout monitor, scanner, bags, nearby store shelves, retail lighting, and realistic supermarket perspective. Preserve the checkout layout and supermarket atmosphere.

Visual style and color palette: cinematic absurdist comedy, grounded supermarket realism transforming into surreal imperial fantasy. Start with bright fluorescent grocery store lighting and realistic commercial color tones, then shift into grand mythic visual language with warm gold highlights, floating paper receipts, rich beige and olive fabric, saturated fruit colors, dramatic product motion, subtle 35mm film grain, IMAX quality, 4K cinematic detail.

Location and atmosphere: the video starts in a completely ordinary supermarket checkout area from @ref2. The main character uses the exact identity from @ref1. He is scanning groceries with serious focus. One exaggerated barcode beep triggers an absurd fantasy vision in which he becomes a majestic supermarket emperor. The checkout lane transforms into a ceremonial throne hall made of grocery items, shopping carts, receipts, and packaged food. The comedy comes from the extreme contrast between boring retail reality and an impossibly grand royal supermarket hallucination. At the end, everything instantly returns to normal.

[0:00-0:03] Wide establishing shot, stabilized camera, slow push in toward the checkout lane from @ref2. The main character stands at the register, scanning groceries one by one with dead-serious concentration. He looks completely ordinary and grounded in the supermarket setting. Fluorescent lights, shelves, and checkout equipment are clearly visible. The scene feels realistic and routine.

[0:03-0:06] Medium shot at the register, stabilized with subtle handheld realism. He scans another item. Then he scans one more product and the barcode beep lands with strangely dramatic emphasis. He pauses. His eyes narrow slightly behind his glasses. The checkout monitor glow reflects on his face. The atmosphere becomes subtly tense, as if something sacred or dangerous has just been activated.

[0:06-0:09] Sudden surreal transition. Crash zoom into the scanner, then hard visual shift. The supermarket reality blooms into absurd imperial fantasy. The man is now wearing the king outfit while preserving the exact face and body identity from @ref1. The checkout lane has transformed into a ceremonial throne platform built from shopping carts, stacked produce crates, receipt streamers, and glowing supermarket lights. Fruits, bread, cereal boxes, and plastic bags drift through the air in majestic slow motion 120fps. He stands upright like a crowned ruler of retail destiny.

[0:09-0:12] Full absurd fantasy escalation. Dynamic low-angle shots, orbital camera movement, dramatic crane motion. The man in king outfit slowly raises one hand or a grocery item like a royal decree. Receipt paper whips around him like banners. Shopping carts form symmetrical rows like palace guards. Packaged foods slide across polished floors like sacred offerings. His expression remains completely grave and regal, as if he truly rules this impossible supermarket kingdom. The tone is epic, ceremonial, and intentionally ridiculous.

[0:12-0:15] Hard snap back to reality. Medium close-up, stabilized camera. He is suddenly back in the normal checkout from @ref2, no king fantasy visible anymore, holding a single ordinary grocery item at the scanner. He stares forward for one beat with a dead-serious expression, as if nothing unusual happened. Then he calmly scans the item with one final normal beep. End on his exact recognizable face from @ref1 in the boring supermarket setting.

Stable face throughout. No morphing. No deformation. No flickering. No ghosting. Realistic physics. 4K cinematic.»

«@ref1 — strict identity reference for the main character only. Use @ref1 only for the man’s facial features, hairstyle, glasses, beard, body type, age, proportions, and overall likeness. The main character is an adult light-skinned male with short light brown hair, glasses, a short beard, and a broad average-heavy build. Do not use the original pose, clothing, background, wall, floor, lighting, or any object from @ref1. Preserve exact likeness throughout. No beautification. No deformation. Stable face throughout. Format: 16:9.

Visual style and color palette: hyper-dynamic cinematic sci-fi chase sequence on a red desert planet. Deep rust red sand, burnt orange dunes, copper dust clouds, harsh white-yellow sun, dark graphite shadows, metallic vehicle surfaces, heat haze, aggressive contrast, subtle 35mm film grain, IMAX quality, 4K cinematic detail. Fast, loud, kinetic, intense, with sharp editorial energy and blockbuster scale.

Location and atmosphere: a vast red desert on an alien planet under a brutal sun, with endless dunes, airborne dust, strong desert wind, heat shimmer, and a sense of dangerous speed. The main character, using the exact identity from @ref1 only, drives a wild armored off-road machine across the dunes at extreme speed. Ahead of him, a gigantic dinosaur-like creature sprints and leaps across the desert, kicking up huge plumes of sand. The sequence feels like a high-speed pursuit between machine and beast. Add powerful heavy bass pulses, roaring engine sound, deep dinosaur roars, and hard sand-blast wind impacts. The sound design should feel massive, percussive, and tightly synced to cuts and movement.

Wardrobe: rugged sci-fi desert racer outfit, dark protective driving jacket with structured shoulders, matte charcoal armored panels, dust-covered dark gloves, fitted tactical inner layer, weathered dark utility pants, reinforced boots. He is seated in the driver’s position inside a brutal custom off-road vehicle with exposed metal framework, oversized suspension, aggressive tires, dust-covered windshield edges, and a muscular silhouette designed for alien desert pursuit.

[0:00-0:03] Explosive opening. Wide aerial drone shot over a red alien desert, then immediate hard cut into a low-angle tracking shot beside the speeding vehicle. The machine tears across the dunes throwing red dust behind it. The giant dinosaur-like creature is visible far ahead, bounding over the sand with massive strides. Heavy bass starts immediately with engine roar and violent wind blasts. The sun burns high above through dust haze.

[0:03-0:06] Rapid interior and mechanical cut sequence. Handheld close-up of the driver’s eyes locked forward. Crash cut to gloved hand gripping the steering wheel. Crash cut to boot slamming the accelerator pedal. Crash cut to spinning tire shredding red sand. Crash cut to suspension compressing over a dune. Snap to real-time pacing with hard rhythmic edits synced to bass hits and engine revs. Keep exact facial likeness from @ref1 stable in the interior shots.

[0:06-0:09] The chase escalates. Wide stabilized tracking shot from the front quarter angle of the vehicle climbing a dune. As it crests, reveal the enormous dinosaur-like creature much closer now, leaping across the next ridge and sending sand into the air. Use one low-angle shot from near the wheel as the vehicle lands hard. Add a deep roar from the creature that cuts through the engine noise. Dust and sunlight flare across the frame.

[0:09-0:12] Aggressive pursuit peak. Fast side tracking shot as the vehicle races parallel to the creature along the dunes. The hero is now close enough to nearly match its speed. Alternate between exterior chase shots and one intense close-up of his focused face behind the wheel. The dinosaur-like beast launches over a dune in a huge powerful leap. Use one brief slow motion 120fps moment as sand explodes beneath its body in midair, then snap back to real-time with a heavy bass hit.

[0:12-0:15] Final confrontation shot. The vehicle surges over the last dune and closes the distance. The dinosaur-like creature lands, skids, and suddenly turns its head and upper body toward camera in a violent frontal reveal. Sharp crash zoom into a head-on shot of the beast roaring directly toward the viewer with dust blasting outward. The vehicle is charging straight behind the line of action. End on a brutal high-impact front-facing frame with engine thunder, creature roar, and a hard sand-blast sound hit.

Stable face throughout. No morphing. No deformation. No flickering. No ghosting. Realistic physics. 4K cinematic.»


💥 Пошаговое руководство по использованию Seedance New «Работа с использованием референсов видео»

Первым делом при работе с референсом видео, вам необходимо корректно его загрузить.

Загрузка видео

Технические требования к видео:

  • Формат файла: MP4
  • Максимальный вес файла: до 19 MB
  • Минимальное разрешение видео: 640×640
  • Максимальное разрешение видео: 1284×722
  • Максимальное количество загружаемых видео: 3
  • Суммарная длительность всех видео: до 15 секунд

Например:

Настройки модели

После загрузки референсов, вам необходимо выбрать кнопку «Настроить и запустить» и далее корректно проставить настройки для будущей генерации.

❣️Если вы хотите удалить отправленные референсы, нажмите кнопку «Удалить» или «Удалить всё». После этого вы сможете отправить новый запрос.

Промпт

Качественная генерация напрямую зависит от того, насколько точно и последовательно описана сцена. Важно не просто задать идею, а зафиксировать персонажа, окружение и поведение, чтобы избежать искажений и случайных изменений в процессе генерации.

Хороший текстовый запрос должен включать в себя:

  1. Описание персонажа/объекта

На этом этапе необходимо максимально подробно зафиксировать внешний вид персонажа или объекта. Важно указать ключевые черты: лицо, телосложение, причёску, одежду, материалы, форму, цвет и другие визуальные особенности. Если в видео участвует один и тот же персонаж или объект, это нужно обозначить отдельно, чтобы модель сохраняла его внешний вид на протяжении всей генерации, например:

«Same person in all shots. Preserve exact appearance throughout. Stable face throughout.»

  1. Действие

Необходимо чётко описать, что именно делает персонаж или объект, в какой последовательности происходят действия и как они взаимодействуют с окружением. Лучше использовать конкретные формулировки: не «идёт красиво», а «идёт вперёд уверенным шагом, поворачивает голову в камеру, поправляет воротник». Чем точнее заданы движения и их логика, тем стабильнее и понятнее результат.

  1. Локация

Необходимо подробно описать и зафиксировать пространство, в котором происходит сцена: интерьер или экстерьер, расположение объектов, атмосферу, фон и важные детали окружения.

  1. Освещение

Освещение задаёт настроение и глубину сцены, поэтому его желательно указывать отдельно. Можно описывать источник света, его характер и цвет: мягкий дневной свет, жёсткий контровой свет, тёплое объёмное освещение, неоновые акценты и т.д.

  1. Движение камеры

Важно указать тип съёмки и движение камеры, так как именно они определяют динамику видео. Можно комбинировать разные подходы: плавные пролёты, резкие приближения, смену ракурсов и т.д.

  1. Ограничения и стабильность

В завершении запроса рекомендуется зафиксировать технические ограничения, которые помогают сделать результат чище и стабильнее. Обычно здесь указывают отсутствие искажений, мерцания, деформаций, случайных изменений лица, одежды или сцены, например:

«No deformation. No flickering. No ghosting. Stable face throughout. Realistic physics.»

Дополнительные рекомендации:

  • Избегайте размытых формулировок («красиво», «интересно», «круто») - они не дают модели чёткого понимания результата
  • При необходимости разбивайте сценарий по времени (например: [0–3s], [3–6s]) для более точного контроля динамики и последовательности действий
  • При работе с персонажами фиксируйте их внешний вид и поведение, чтобы избежать случайных изменений
  • Рекомендуется писать запросы на английском языке, так модель точнее интерпретирует формулировки и лучше понимает детали, стили и движения камеры. Это особенно важно для сложных сцен и динамики, где требуется высокая точность результата
  • Чем подробнее и точнее описан запрос, тем более качественным и предсказуемым будет результат.
Система тегов

Главной особенностью при работе с референсами в данном инструменте является система тегов. Чтобы добавить тег в запрос, нажмите на миниатюру нужного изображения - тег будет автоматически вставлен в поле запроса.

Это помогает нейросети точнее понимать, какое изображение необходимо использовать в определённой части запроса.

Например:

«@ref1 — base video reference for exact track location, shot sequence, camera angles, camera movement, transitions, timing, framing, vehicle path, pacing, and full scene structure. Replicate every shot, camera angle, movement and transition from @ref1 exactly. Keep the exact same location, background, track layout, and camera behavior from @ref1.

@ref2 — strict vehicle identity reference for the replacement car. Use @ref2 as exact appearance reference for body shape, proportions, paint finish, headlights, grille, wheels, windows, mirrors, and surface details. Preserve exact vehicle likeness throughout. Stable vehicle design throughout.

Visual style and color palette: match @ref1 exactly, premium automotive commercial look, clean reflections, balanced contrast, natural daylight tones, detailed asphalt texture, polished highlights, subtle 35mm film grain.

Location and atmosphere: keep the exact same track location, asphalt surface, lane markings, safety barriers, curbs, background elements, lighting, weather conditions, and overall atmosphere from @ref1. Replace only the original car with the vehicle from @ref2.

Vehicle description: use the exact car from @ref2 with matching body silhouette, front fascia, side profile, rear design, wheel design, paint color, glass tint, trim details, and realistic proportions. Preserve exact vehicle likeness throughout. Stable vehicle design throughout.

Motion transfer: the replacement vehicle must follow the exact same driving path, speed pattern, wheel rotation timing, cornering behavior, body motion, and screen position as the original car in @ref1. Keep the exact same choreography, pacing, and shot timing.

[0:00-3s] Replicate the opening shot from @ref1 exactly. Same framing, same camera movement, same vehicle position, same motion timing, same location details. Replace only the original car with the vehicle from @ref2.

[3:00-7s] Replicate the middle shot from @ref1 exactly. Same camera angle, same tracking behavior, same motion, same timing, same transition. Keep the environment identical to @ref1 and keep the replacement vehicle consistent with @ref2.

[7:00-10s] Replicate the final shot from @ref1 exactly. Same framing, same camera motion, same vehicle movement, same ending position or transition. Preserve the exact track environment and replace only the car.

Technical requirements: shot-for-shot remake of @ref1 with vehicle replacement only. Keep exact location, exact camera motion, exact vehicle path, exact timing, and exact transitions from @ref1. Maintain realistic reflections, accurate wheel rotation, stable car proportions, consistent vehicle details, realistic physics, clean automotive rendering. No morphing. No deformation. No flickering. No ghosting. Realistic physics. 4K cinematic.»

Режим

При работе с референсами вам предоставляется два режима на выбор:

Pro - режим с максимальным качеством генерации. Обеспечивает более детализированную картинку, реалистичную анимацию и точную проработку сцен, подходит для финальных видео.

Fast - быстрый режим генерации, оптимально подходит для тестов и быстрых итераций. Позволяет оперативно проверять идеи и сценарии, но может уступать в детализации и точности. Также имеет ограниченный выбор настроек качества.

Разрешение

При работе с референсами вам доступно три варианта разрешения:

• 480p

Базовое разрешение видео. Оно идеально подходит для просмотра на небольших экранах мобильных устройств и экономит интернет-трафик. Видео может выглядеть немного размытым, а мелкие детали будут не очень четкими.

• 720p

Среднее разрешение видео. Обеспечивает хороший баланс между качеством видео и размером файла. Этот формат стал популярным стандартом для онлайн-видео, включая YouTube, и обеспечивает четкую картинку, комфортную для просмотра на телевизорах среднего размера и большинстве современных устройств.

• 1080p

Представляет собой высококачественный формат видео, обеспечивающий превосходную детализацию и четкость. Этот формат идеально подходит для просмотра на больших экранах и телевизорах, хотя требует более быстрого интернет-соединения и занимает значительно больше места на устройстве хранения, но взамен предоставляет максимально четкое и детализированное видео.

❣️Разрешение 1080р доступно только при работе в Pro режиме.

Аудио

При работе в нейросети Seedance 2.0 у вас есть возможность создавать видео с аудио.Чтобы добавить звуковые эффекты, включите ползунок - нейросеть автоматически подберёт и наложит аудио.

Если вы предпочитаете генерацию без звука - необходимо выключить ползунок.

Соотношение сторон

При работе с референсами вам доступно 6 вариантов соотношения сторон на выбор:

Длительность

У вас есть возможность установить длительность будущего видео от 1 до 15 секунд.

❣️Обратите внимание, что по умолчанию длительность в настройках выставлена на 4 секунды.

Результат

@ref1 — base video reference for exact track location, shot sequence, camera angles, camera movement, transitions, timing, framing, vehicle path, pacing, and full scene structure. Replicate every shot, camera angle, movement and transition from @ref1 exactly. Keep the exact same location, background, track layout, and camera behavior from @ref1.

@ref2 — strict vehicle identity reference for the replacement car. Use @ref2 as exact appearance reference for body shape, proportions, paint finish, headlights, grille, wheels, windows, mirrors, and surface details. Preserve exact vehicle likeness throughout. Stable vehicle design throughout.

Visual style and color palette: match @ref1 exactly, premium automotive commercial look, clean reflections, balanced contrast, natural daylight tones, detailed asphalt texture, polished highlights, subtle 35mm film grain.

Location and atmosphere: keep the exact same track location, asphalt surface, lane markings, safety barriers, curbs, background elements, lighting, weather conditions, and overall atmosphere from @ref1. Replace only the original car with the vehicle from @ref2.

Vehicle description: use the exact car from @ref2 with matching body silhouette, front fascia, side profile, rear design, wheel design, paint color, glass tint, trim details, and realistic proportions. Preserve exact vehicle likeness throughout. Stable vehicle design throughout.

Motion transfer: the replacement vehicle must follow the exact same driving path, speed pattern, wheel rotation timing, cornering behavior, body motion, and screen position as the original car in @ref1. Keep the exact same choreography, pacing, and shot timing.

[0:00-3s] Replicate the opening shot from @ref1 exactly. Same framing, same camera movement, same vehicle position, same motion timing, same location details. Replace only the original car with the vehicle from @ref2.

[3:00-7s] Replicate the middle shot from @ref1 exactly. Same camera angle, same tracking behavior, same motion, same timing, same transition. Keep the environment identical to @ref1 and keep the replacement vehicle consistent with @ref2.

[7:00-10s] Replicate the final shot from @ref1 exactly. Same framing, same camera motion, same vehicle movement, same ending position or transition. Preserve the exact track environment and replace only the car.

Technical requirements: shot-for-shot remake of @ref1 with vehicle replacement only. Keep exact location, exact camera motion, exact vehicle path, exact timing, and exact transitions from @ref1. Maintain realistic reflections, accurate wheel rotation, stable car proportions, consistent vehicle details, realistic physics, clean automotive rendering. No morphing. No deformation. No flickering. No ghosting. Realistic physics. 4K cinematic.


💥 Пошаговое руководство по использованию Seedance New «Работа с использованием аудио»

Если вам необходимо добавить собственную озвучку, вы можете сделать это с помощью аудио-референса.

Первым делом при работе с референсом аудио, вам необходимо загрузить изображение или видео. Далее необходимо корректно загрузить аудио.

Загрузка аудио

Технические требования к аудио:

  • Формат файла: MP3
  • Максимальное количество загружаемых аудио: 3
  • Суммарная длительность всех аудио: до 15 секунд

Например:

Настройки модели

После загрузки референсов, вам необходимо выбрать кнопку «Настроить и запустить» и далее корректно проставить настройки для будущей генерации.

❣️Если вы хотите удалить отправленные референсы, нажмите кнопку «Удалить» или «Удалить всё». После этого вы сможете отправить новый запрос.

Промпт

Качественная генерация напрямую зависит от того, насколько точно и последовательно описана сцена. Важно не просто задать идею, а зафиксировать персонажа, окружение и поведение, чтобы избежать искажений и случайных изменений в процессе генерации.

Хороший текстовый запрос должен включать в себя:

  1. Описание персонажа/объекта

На этом этапе необходимо максимально подробно зафиксировать внешний вид персонажа или объекта. Важно указать ключевые черты: лицо, телосложение, причёску, одежду, материалы, форму, цвет и другие визуальные особенности. Если в видео участвует один и тот же персонаж или объект, это нужно обозначить отдельно, чтобы модель сохраняла его внешний вид на протяжении всей генерации, например:

«Same person in all shots. Preserve exact appearance throughout. Stable face throughout.»

  1. Действие

Необходимо чётко описать, что именно делает персонаж или объект, в какой последовательности происходят действия и как они взаимодействуют с окружением. Лучше использовать конкретные формулировки: не «идёт красиво», а «идёт вперёд уверенным шагом, поворачивает голову в камеру, поправляет воротник». Чем точнее заданы движения и их логика, тем стабильнее и понятнее результат.

  1. Локация

Необходимо подробно описать и зафиксировать пространство, в котором происходит сцена: интерьер или экстерьер, расположение объектов, атмосферу, фон и важные детали окружения.

  1. Освещение

Освещение задаёт настроение и глубину сцены, поэтому его желательно указывать отдельно. Можно описывать источник света, его характер и цвет: мягкий дневной свет, жёсткий контровой свет, тёплое объёмное освещение, неоновые акценты и т.д.

  1. Движение камеры

Важно указать тип съёмки и движение камеры, так как именно они определяют динамику видео. Можно комбинировать разные подходы: плавные пролёты, резкие приближения, смену ракурсов и т.д.

  1. Ограничения и стабильность

В завершении запроса рекомендуется зафиксировать технические ограничения, которые помогают сделать результат чище и стабильнее. Обычно здесь указывают отсутствие искажений, мерцания, деформаций, случайных изменений лица, одежды или сцены, например:

«No deformation. No flickering. No ghosting. Stable face throughout. Realistic physics.»

Дополнительные рекомендации:

  • Избегайте размытых формулировок («красиво», «интересно», «круто») - они не дают модели чёткого понимания результата
  • При необходимости разбивайте сценарий по времени (например: [0–3s], [3–6s]) для более точного контроля динамики и последовательности действий
  • При работе с персонажами фиксируйте их внешний вид и поведение, чтобы избежать случайных изменений
  • Рекомендуется писать запросы на английском языке, так модель точнее интерпретирует формулировки и лучше понимает детали, стили и движения камеры. Это особенно важно для сложных сцен и динамики, где требуется высокая точность результата
  • Чем подробнее и точнее описан запрос, тем более качественным и предсказуемым будет результат.
Система тегов

Главной особенностью при работе с референсами в данном инструменте является система тегов. Чтобы добавить тег в запрос, нажмите на миниатюру нужного изображения - тег будет автоматически вставлен в поле запроса.

Это помогает нейросети точнее понимать, какое изображение необходимо использовать в определённой части запроса.

Например:

«@ref1— exact face and body reference for the main male character. Use @ref1 as strict identity reference for his face, hairstyle, facial features, skin tone, body proportions, and overall likeness. Preserve exact likeness throughout. No beautification. No deformation. Stable face throughout.

@ref2 — exact background and location reference. Use @ref2 as the strict environment reference for the setting, architecture, spatial layout, background details, lighting mood, and atmosphere.

@ref3 — voice and lip sync reference for the male character. The man on screen speaks the audio from @ref3 exactly. Voice and lip sync reference @ref3 exactly.

Visual style and color palette: realistic cinematic portrait, natural skin tones, color palette matchin @ref2, balanced contrast, soft realistic lighting, subtle 35mm film grain, polished 4K cinematic look.

Location and atmosphere: place the male character from @ref1 inside the exact environment from @ref2. Keep the same background composition, location details, lighting direction, atmosphere, and overall visual mood from @ref2.

Character description: one adult male based exactly on @ref1. Match his hairstyle, face shape, eyes, nose, jawline, skin tone, body proportions, and expression style exactly. Match his clothing from @ref1 with the same outfit design, colors, fabric, fit, and visible accessories. Preserve exact likeness throughout. No beautification. No deformation. Stable face throughout.

[0:00-3s] Medium shot, stabilized camera. The man stands naturally in the location from @ref2 and begins speaking directly to camera. Slow push in. Accurate facial performance and lip sync to @ref3.

[3:00-7s] Medium close-up, stabilized camera. Continue the speech with natural head movement, subtle blinking, realistic mouth articulation, and consistent expression. Keep the environment identical to @ref2 and the character fully consistent with @ref1.

[7:00-10s] Close-up, stabilized camera. The man finishes speaking while maintaining eye contact with the camera. Gentle cinematic push in, natural posture, stable identity, precise lip sync to@ref3. At the end of the video, he winks with one eye.

Technical requirements: one continuous speaking male character using @ref1 as strict identity reference and @ref2 as strict location reference. Accurate lip sync to @ref3. Natural facial motion, realistic blinking, realistic breathing, stable hands, stable clothing, stable face throughout. No morphing. No deformation. No flickering. No ghosting. Realistic physics. 4K cinematic.»

Режим

При работе с референсами вам предоставляется два режима на выбор:

Pro - режим с максимальным качеством генерации. Обеспечивает более детализированную картинку, реалистичную анимацию и точную проработку сцен, подходит для финальных видео.

Fast - быстрый режим генерации, оптимально подходит для тестов и быстрых итераций. Позволяет оперативно проверять идеи и сценарии, но может уступать в детализации и точности. Также имеет ограниченный выбор настроек качества.

Разрешение

При работе с референсами вам доступно три варианта разрешения:

• 480p

Базовое разрешение видео. Оно идеально подходит для просмотра на небольших экранах мобильных устройств и экономит интернет-трафик. Видео может выглядеть немного размытым, а мелкие детали будут не очень четкими.

• 720p

Среднее разрешение видео. Обеспечивает хороший баланс между качеством видео и размером файла. Этот формат стал популярным стандартом для онлайн-видео, включая YouTube, и обеспечивает четкую картинку, комфортную для просмотра на телевизорах среднего размера и большинстве современных устройств.

• 1080p

Представляет собой высококачественный формат видео, обеспечивающий превосходную детализацию и четкость. Этот формат идеально подходит для просмотра на больших экранах и телевизорах, хотя требует более быстрого интернет-соединения и занимает значительно больше места на устройстве хранения, но взамен предоставляет максимально четкое и детализированное видео.

❣️Разрешение 1080р доступно только при работе в Pro режиме.

Аудио

При использовании аудио-референса ползунок должен быть включён. Если его отключить, генерация будет происходить без звука, даже при наличии аудио.

Соотношение сторон

При работе с референсами вам доступно 6 вариантов соотношения сторон на выбор:

Длительность

У вас есть возможность установить длительность будущего видео от 1 до 15 секунд.

❣️Обратите внимание, что по умолчанию длительность в настройках выставлена на 4 секунды.

Результат

@ref1 — exact face and body reference for the main male character. Use @ref1 as strict identity reference for his face, hairstyle, facial features, skin tone, body proportions, and overall likeness. Preserve exact likeness throughout. No beautification. No deformation. Stable face throughout.

@ref2 — exact background and location reference. Use @ref2 as the strict environment reference for the setting, architecture, spatial layout, background details, lighting mood, and atmosphere.

@ref3 — voice and lip sync reference for the male character. The man on screen speaks the audio from @ref3 exactly. Voice and lip sync reference @ref3 exactly.

Visual style and color palette: realistic cinematic portrait, natural skin tones, color palette matching @ref2, balanced contrast, soft realistic lighting, subtle 35mm film grain, polished 4K cinematic look.

Location and atmosphere: place the male character from @ref1 inside the exact environment from @ref2. Keep the same background composition, location details, lighting direction, atmosphere, and overall visual mood from @ref2.

Character description: one adult male based exactly on @ref1. Match his hairstyle, face shape, eyes, nose, jawline, skin tone, body proportions, and expression style exactly. Match his clothing from @ref1 with the same outfit design, colors, fabric, fit, and visible accessories. Preserve exact likeness throughout. No beautification. No deformation. Stable face throughout.

[0:00-3s] Medium shot, stabilized camera. The man stands naturally in the location from @ref2 and begins speaking directly to camera. Slow push in. Accurate facial performance and lip sync to @ref3.

[3:00-7s] Medium close-up, stabilized camera. Continue the speech with natural head movement, subtle blinking, realistic mouth articulation, and consistent expression. Keep the environment identical to @ref2 and the character fully consistent with @ref1.

[7:00-10s] Close-up, stabilized camera. The man finishes speaking while maintaining eye contact with the camera. Gentle cinematic push in, natural posture, stable identity, precise lip sync to @ref3. At the end of the video, he winks with one eye.

Technical requirements: one continuous speaking male character using @ref1 as strict identity reference and @ref2 as strict location reference. Accurate lip sync to @ref3. Natural facial motion, realistic blinking, realistic breathing, stable hands, stable clothing, stable face throughout. No morphing. No deformation. No flickering. No ghosting. Realistic physics. 4K cinematic.


Мы надеемся, что эта инструкция поможет вам лучше понять возможности Seedance 2.0 и уверенно использовать инструмент в работе. Мы постарались сделать её максимально простой и понятной, чтобы вы могли быстро приступить к практике. Если в процессе возникают сложности - это естественно.

Экспериментируйте, пробуйте разные подходы и постепенно находите решения, которые подходят именно вам. Со временем вы сможете всё точнее управлять результатом и получать именно тот визуал, который задумывали. 💛


SYNTX AI: Syntx AI
SYNTX Сообщество: Syntx Community
Блог SYNTX FAMILY: Syntx Family Служба Заботы SYNTX: Syntx Support