@syntxaibot | April 30, 2024

ElevenLabs Voice - это инструмент для генерации реалистичной речи на основе текста или аудио с высокой точностью передачи интонации и звучания. Он подходит как для повседневных задач, так и для профессионального использования.

🎛 Навигация:

🏠 Главное меню > 🔊 Аудио с ИИ > 🎙️ ElevenLabs Voice


💥 Пошаговое руководство по работе в режиме «Текст в речь»

Данный режим преобразует письменный текст более чем на 70 языках в естественно звучащую речь с использованием более 200 различных голосов. Вам доступен широкий выбор голосов с разными акцентами, адаптированных под различные задачи, которые звучат максимально реалистично и приближенно к живому общению.

❣️Максимальное количество символов в запросе - 4090 символов.

❣️В редких случаях нейросеть может самостоятельно изменить тон голоса в середине аудио. К сожалению, этот процесс не поддаётся контролю. Если вы столкнулись с такой ситуацией, рекомендуется просто перегенерировать аудиодорожку.

Первым шагом необходимо отправить текст, который вы хотите озвучить. Далее нажмите на кнопку «Выбрать голос», чтобы подобрать озвучку для будущей генерации.

❣️ Система заранее покажет количество символов и итоговую стоимость генерации!

Пример запроса:

После выбора голоса у вас будет возможность удалить запрос, выбрать другой голос или начать синтез.

Удалить запрос
Данная кнопка полностью очищает введённый текст, позволяя начать работу заново.

Выбрать другой голос
Данная кнопка открывает библиотеку доступных голосов, где вы можете сменить диктора, выбрать другой акцент или стиль звучания для вашей озвучки.

Начать синтез
Данная кнопка запускает процесс генерации аудио на основе введённого текста и выбранных настроек.

Результат:


💥 Пошаговое руководство по работе в режиме «Речь в речь»

Данный режим позволяет изменить исходный голос на другой, копируя его тембр и стиль подачи. В качестве аудио можно использовать как загруженный аудиофайл, так и запись с микрофона.

❣️ Максимальный вес загружаемого аудиофайла 20 мегабайт.

❣️В редких случаях нейросеть может самостоятельно изменить тон голоса в середине аудио. К сожалению, этот процесс не поддаётся контролю. Если вы столкнулись с такой ситуацией, рекомендуется просто перегенерировать аудиодорожку.

Особенности использования режима «Речь в речь»:

• Высокая точность передачи шёпота и тихой речи;
• Возможность добавления естественных звуков: вздохов, смеха или плача;
• Качественное распознавание и передача тона и эмоций;
• Точное соблюдение речевого ритма и каденции;
• Сохранение исходного языка и акцента.

Первым шагом необходимо отправить аудио, с которым вы хотите работать. Далее нажмите на кнопку «Выбрать голос», чтобы подобрать озвучку для будущей генерации.

Пример запроса:

После выбора голоса у вас будет возможность удалить запрос, выбрать другой голос или начать синтез.

Удалить запрос
Данная кнопка полностью очищает введённый текст, позволяя начать работу заново.

Выбрать другой голос
Данная кнопка открывает библиотеку доступных голосов, где вы можете сменить диктора, выбрать другой акцент или стиль звучания для вашей озвучки.

Начать синтез
Данная кнопка запускает процесс генерации аудио на основе введённого текста и выбранных настроек.

Первичный вариант:

Результат:


💥 Пошаговое руководство по работе в режиме «Создание диалогов»

Если вам необходимо озвучить диалог, вы можете переключиться в режим «Создание диалогов». В этом режиме инструмент корректно обрабатывает структуру диалога и учитывает пунктуацию, обеспечивая более естественное звучание.

Для начала в базе голосов необходимо выбрать модель «Создание диалогов».

После этого отправьте свой диалог в чат-бот и выберите язык для озвучки.

Пример запроса:

После выбора голоса у вас будет возможность удалить запрос, выбрать другой голос или начать синтез.

Результат:


База голосов

Библиотека голосов делится на две группы: Премиум и PRO. Все разделы доступны для использования, начиная с подписки BASIC.

Премиум голоса

В данном разделе вы можете фильтровать голоса по возрасту, полу и сфере применения, чтобы подобрать наиболее подходящий вариант для вашей задачи.

Пол:

  •   Мужской
  • Женский

Возраст:

  • Средний возраст
  • Молодой

Применение:

  • Для рекламы
  • Озвучка персонажей
  • Разговорные голоса
  • Для развлечений
  • Для образования
  • Для рассказов
  • Для социальных сетей

PRO голоса

В данном разделе вы можете фильтровать голоса по имени, возрасту, полу, сфере применения, акценту и родному языку диктора, чтобы точно подобрать подходящий вариант.

Пол:

  • Мужской
  • Женский
  • Нейтральный

Возраст:

  • Молодой
  • Средний возраст        
  • Пожилой

Применение:

  • Для рекламы
  • Озвучка персонажей
  • Разговорные голоса
  • Для развлечений
  • Для образования
  • Для рассказов
  • Для социальных сетей

Акцент:

Вам доступно 118 различных акцентов на выбор. Они позволяют изменить произношение и звучание голоса, делая речь более аутентичной и приближённой к конкретному региону или языковой среде.

african, african american, american, andalusian, arabic, argentine, athenian, australian, bavarian, beijing mandarin, bengali, berlinerisch, bihari, boston, brabantian, brazilian, british, bucovina, budapest, calabrese, canadian, canary islands, cebuano, central, chennai, chicago, chilean, chinese, colombian, creole, croatian, cuban, cypriot, danish, dutch, egyptian, european, filipino, flemish, french, galician, german, gothenburg, greek, gujarati, gulf, gyeongsang, haryanvi, helsinki, hindi, hong kong cantonese, indian, irish, istanbul, italian, jamaican, japanese, javanese, jeolla, kansai, kanto, kyushu, latin american, levantine, madeiran, malay, marathi, mazovian, mexican, milanese, modern standard, moscow, new york, new zealand, nigerian, northern, oslo, parisian, peninsular, peruvian, polish, portuguese, prague, puerto rican, punjabi, quebec, received pronunciation, rhine franconian, romanesco, romanian, russian, saint petersburg, saudi, scottish, scouse, seoul, sicilian, singaporean, south african, southern, spanish, standard, stockholm, swabian, swedish, taiwan mandarin, tamil, tunisian, turkish, tuscan, ukrainian, us midwest, us southern, venezuelan, welsh, western, yorkshire, zagreb

Поиск по имени:

Данный фильтр позволяет быстро найти нужный голос по его названию, если вы запомнили его.

🔀 Сортировка

  • Сортировка по рейтингу

Позволяет отобразить наиболее высоко оценённые голоса, помогая быстрее найти лучшие варианты и сэкономить время.

  • Сортировка по последним обновлениям

Показывает недавно добавленные или обновлённые голоса, чтобы вы могли легко отслеживать новинки.

  • Сортировка от А до Я

Идеально подходит для случаев, когда вам известно точное название. Обеспечивает быстрый и простой доступ к нужному голосу.

  • Сортировка от Я до А

Меняет порядок списка, позволяя начать просмотр с конца и найти менее заметные варианты.

❤️ Любимые

Если вы нашли голос, который вам понравился, вы можете добавить его в раздел «Любимые». Для этого достаточно нажать на значок «лайка» рядом с выбранным голосом.

Добавленные голоса сохраняются в отдельном разделе, что позволяет быстро находить и использовать их в дальнейшем.

⚙️ Опции

Опции позволяют настраивать параметры генерации: регулировать скорость воспроизведения, стабильность звучания, степень сходства с оригинальным голосом, а также добавлять стилистическое преувеличение для более выразительной речи.

Скорость аудио

Отвечает за темп воспроизведения речи и то, насколько быстро или медленно голос произносит текст. Параметр можно регулировать, чтобы адаптировать звучание под задачу: сделать речь более динамичной или, наоборот, более размеренной и понятной.

Стабильность

Отвечает за плавность и предсказуемость звучания голоса. При снижении значения речь становится более эмоциональной и выразительной, с вариациями высоты и интонации. При повышении ползунка голос звучит ровнее и стабильнее, но может становиться более монотонным. Слишком низкие значения могут привести к резким и непредсказуемым изменениям в звучании.

Сходство

Определяет, насколько точно сгенерированный голос будет повторять оригинал. При высоких значениях сохраняется больше особенностей исходного голоса, включая возможные шумы записи. При снижении ползунка звучание становится более «чистым», но может терять индивидуальные черты оригинала.

Стилистическое преувеличение

Позволяет усилить характерные особенности и выразительность голоса исходного спикера. Однако увеличение значения требует больше ресурсов и может замедлить генерацию. В большинстве случаев рекомендуется оставлять параметр на уровне 0.

  • Чаще всего стабильность устанавливают на уровне 50, а сходство на уровне 80. Эти значения дают сбалансированный результат, после чего изменения обычно незначительны.
  • Для более живого и драматичного звучания рекомендуется снизить стабильность и сгенерировать несколько вариантов, чтобы выбрать наиболее удачный.
  • Если требуется более сдержанное и ровное звучание, близкое к монотонному, рекомендуется увеличить значение стабильности.

💡 Общие рекомендации

  • При использовании чисел в цифровом формате качество воспроизведения может снижаться, поэтому рекомендуется записывать их словами.

  • При составлении текста обязательно следует соблюдать все орфографические правила, включая использование буквы «ё» и знаков препинаний. Это напрямую влияет на качество звучания.

❌ Неправильно:
елка украшенная мерцающими гирляндами стояла прямо в центре гостиной

✅ Правильно: 
Ёлка, украшенная мерцающими гирляндами, стояла прямо в центре гостиной.


💡 Рекомендации по выделению пауз и ударения

Для обозначения ударения рекомендуется удлинять нужную букву с помощью тройного повторения. Поскольку у системы нет встроенной функции постановки ударений, результат может быть не всегда идеальным.

Пример:
В тиши ночиии, на пустынной улице, вдруг раздался громкий звон разбитого стекла.

Для обозначения паузы в тексте рекомендуется использовать многоточие. При этом важно соблюдать все орфографические правила, так как это напрямую влияет на качество звучания.

Пример:

В тёмной, едва освещённой комнате, сидела женщина….. Вдруг, в полной тишине, раздался звук — тихий, еле уловимый скрип пола за её спиной.


💡 Способы применения:

  • Обучение и развитие: инструмент может использоваться для создания интерактивных учебных материалов, аудиокниг и образовательных курсов.
  • Видеоигры и развлечения: инструмент позволяет создавать уникальные голоса и диалоги, делая контент более живым и погружающим.
  • Маркетинг и реклама: инструмент помогает генерировать персонализированные аудиосообщения для повышения вовлечённости аудитории.
  • Аудиокниги: инструмент даёт возможность быстро превращать текстовые материалы в аудиоформат, что делает литературу доступной широкому кругу слушателей, включая людей с особыми потребностями.
  • Подкасты: инструмент упрощает создание контента, особенно если есть сложности с записью собственного голоса или требуется несколько дикторов.
  • Доступность: инструмент облегчает получение информации для людей с нарушениями зрения и другими ограничениями.

Благодарим вас за то, что уделили время на изучение данной инструкции. Мы уверены, что полученные знания помогут вам успешно использовать наш инструмент и добиваться отличных результатов в генерациях. Желаем вам удачи и вдохновения в ваших дальнейших творческих начинаниях! 💛


SYNTX AI: Syntx AI
SYNTX Сообщество: Syntx Community
Блог SYNTX FAMILY: Syntx Family Служба Заботы SYNTX: Syntx Support