
Быстро и удобно создавайте неограниченное количество голосов с помощью инструмента клонирования голоса и синтеза речи. Доступны разные модели на выбор, множество гибких настроек, поддержка 24 языков и удобный интерфейс для управления голосами.
- 🎛 Навигация
- 💥 Пошаговое руководство по использованию Клонирования голоса.
- 💥 Пошаговое руководство по использованию Cинтеза речи.
🎛 Навигация
🏠 Главное меню > 🔊 Аудио с ИИ > 👥 Клонирование голоса


💥 Пошаговое руководство по использованию Клонирования голоса.
Настройки модели
Перейдите в раздел «Настройки модели», затем откройте вкладку «Настройки». После этого прокрутите страницу немного вниз и внимательно заполните параметры в разделе «Настройки клонирования».

Шумоподавление - если данная настройка включена, то он активирует процесс удаления фонового шума и артефактов из аудиозаписи, чтобы сделать голос чище и более реалистичным.
Нормализация громкости — если данная настройка включена, то он активирует процесс выравнивания уровня громкости аудиофайла, чтобы звук не был слишком тихим или слишком громким, а оставался комфортным и стабильным при воспроизведении.
Загрузка аудио файла
Требования к загружаемым аудиофайлам:
-
Допустимая длина аудио — от 30 секунд до 5 минут.
-
Поддерживаемые форматы: MP3, M4A, WAV.
-
Максимальный вес файла - 5 МБ.
Чем длиннее аудиофайл, тем выше качество итогового голосового клонирования. Для наилучшего результата рекомендуется загружать запись, содержащую только ваш голос — без посторонних шумов, голосов других людей или фоновых звуков. Это позволяет нейросети точнее распознать особенности вашей речи и создать максимально чёткую и достоверную голосовую копию.
Например ( Актуально только как пример голоса. Формат не актуален):
Начать клонирование собственного голоса
После загрузки аудиофайла вы сможете либо отправить его на генерацию голосового клона, либо удалить, если файл был загружен ошибочно.

Результат
После успешного клонирования вашего голоса вы получите уведомление о завершении процесса.

Затем перейдите в настройки модели, откройте раздел «Мои голоса» — там вы найдете созданный вами голос. Для того, что бы синтезировать ваш текст с клонированым вами голосом, просто нажмите на него, тем самым выбрав голос для будущего аудио.
В этом разделе вы сможете:
- Выбрать голос для синтеза,
- изменить название голоса,
- добавить его в избранное,
- прослушать результат.


💥 Пошаговое руководство по использованию Cинтеза речи.
Настройки модели
Голоса
Данный раздел предоставляет собой список добавленных нами голосов, который поможет вам подобрать голос для синтеза речи очень быстро и не клонируя свой собственный, а подбирая его по фильтрам и названию.

Инструкция по выбору голосов
1. Определение пола голоса
Для удобства поиска вы можете ориентироваться на пол диктора. Это поможет быстрее подобрать подходящий голос.
-
Иконка с кружком и стрелкой вверх (♂) — обозначает мужской голос.
-
Иконка с кружком и вертикальной палочкой вниз (♀) — обозначает женский голос.
2. Названия голосов
Названия голосов указаны на английском языке. Перевод может дать представление о характере или стиле голоса.
Пример:
Friendly person — «дружелюбный человек».
-
Тон: тёплый, мягкий, без резких или агрессивных нот.
-
Тембр: средний или умеренно высокий. Даже низкий голос может звучать дружелюбно, если он спокойный и выразительный.
-
Темп речи: умеренный. Излишне быстрая речь может восприниматься как навязчивая, а слишком медленная — как скучная.
-
Громкость: средняя. Голос должен звучать уверенно, но не громко и без излишнего давления.
3. Выбор голоса
Чтобы выбрать голос для дальнейшего использования:
-
Кликните на нужный голос.
-
Если вокруг него появился фиолетовый ободок, это означает, что голос выбран, и именно он будет использоваться при генерации.
5. Прослушивание
- Нажмите на зелёную кнопку “Play”, чтобы прослушать как звучит голос перед выбором.
6. Добавление в избранное
-
Нажмите на значок “Сердце”, чтобы сохранить понравившийся голос в избранное.
-
Если сердце стало красным, этот голос будет доступен в разделе «Любимые» для быстрого доступа в будущем.
Мои голоса
В данном разделе находятся голоса, которые были ранее клонированы вами.

Любимые
В данном разделе находятся голоса, которые вы пометили ранее “сердцем”.Данный раздел поможет вам упростить поиск понравившихся голосов.

Настройки

1. Выбор модели
Доступны две модели синтеза речи:
-
Turbo — оптимальный вариант по скорости и стоимости. Обеспечивает быстрое воспроизведение текста с базовым качеством звучания.
-
HD — модель высокого качества. Обеспечивает более естественное и выразительное звучание, однако стоит дороже.
2. Скорость воспроизведения речи
Параметр скорости определяет, с какой скоростью будет произноситься текст голосом, выбранным пользователем.
Диапазон значений: от 0.5 до 2.0.
-
Значение 1.0 соответствует естественной скорости речи.
-
Значения выше 1.0 увеличивают темп речи — голос будет говорить быстрее.
-
Значения ниже 1.0 замедляют воспроизведение — голос будет говорить медленнее.
3. Громкость
Параметр «Громкость» отвечает за уровень звука воспроизводимого аудио.
Допустимые значения: от 0 до 10.
-
Значение 1.0 соответствует естественной громкости речи.
-
Значения выше 1.0 повышают громкость, делая голос звучнее.
-
Значения ниже 1.0 снижают громкость, делая голос тише и мягче.
4. Высота тона
Параметр «Высота тона» регулирует, насколько высокий или низкий тембр будет у голоса.
Допустимые значения: от -12 до 12.
-
Значение 0 соответствует естественной высоте голоса.
-
Значения больше 0 повышают тональность — голос становится выше и может звучать более пискляво.
-
Значения меньше 0 понижают тональность — голос звучит ниже и грубее.
5. Эмоция
Мы предоставляем ряд эмоций, которые будут использованы при синтезе для того что бы передать более ярко прописанный Вами текст. Доступные эмоции:
- Автоматически - звучит ровно и безжизненно — он монотонный, без интонационных скачков, чаще всего вызывает ощущение отчуждённости или нейтральности. Полностью соответствует голосу, который вы слышите, нажав на иконку “Play”(зелёная кнопка).
- Нейтральный - живой, но сдержанный — он уравновешен, лишён ярко выраженных эмоций, используется в официальной или информативной речи, где важно сохранить объективность.
- Счастливый - Когда человек испытывает счастье, голос становится светлее, интонации более оживлёнными, фразы звучат бодро и часто чуть быстрее обычного. Он будто “улыбается”, и это чувствуется даже без визуального контакта
- Грустный - голос низкий, становится медленным, мягким и приглушённым — словно в нём исчезает энергия, а слова даются с трудом.
- Злой - громкий, напряжённый, резкий, с резкими интонационными скачками и короткими фразами. В нём ощущается внутреннее давление.
- Напуганный - голос может дрожать, становиться высоким, неустойчивым — как будто слова срываются с губ. Интонации скачут, дыхание учащается, появляются сбивчивость.
- Вызывающий отвращений - в голосе проявляется в виде тягучих, замедленных интонаций, с оттенком презрения — он словно демонстрирует нежелание продолжать разговор.
- Удивленный - всегда сопровождается всплеском интонации: голос внезапно становится выше, особенно на ключевых словах, появляется пауза перед реакцией, будто мозг ещё обрабатывает информацию. Этот голос звучит открыто, с элементом неожиданности или восхищения.
6. Канал
Канал голоса - это количестве аудиоканалов, с которыми работает нейросеть при обработке звука. Мы предоставляем два канала - Моно и Стерео.
Моно — это формат аудиосигнала, в котором используется один канал для записи и воспроизведения звука. Все аудиоинформации обрабатываются как поступающие из одного источника, без разделения по пространству.
Примеры использования:
- Телефонные разговоры
- Запись речи диктофоном
Стерео — это формат, использующий два независимых канала (левый и правый), что позволяет создать эффект пространственного звучания. Такое распределение каналов помогает слушателю воспринимать направление и глубину источников звука.
Примеры использования:
- Музыкальные композиции
- Видеоконтент (фильмы, сериалы)
7. Уклон языка
В разделе “Уклон языка” вы можете выбрать один из 24 доступных языков, чтобы задать акцент для озвучивания. Если вы заранее введёте текст на выбранном языке, система воспроизведёт его с наиболее приближённым и выразительным акцентом носителя.
Например:
Голос с Английским уклоном:
Текст и результат
После того как вы завершите настройку всех параметров, закройте соответствующее окно, введите текст для озвучивания и нажмите «Начать синтез речи». Ваш запрос будет автоматически отправлен на обработку.

Мы искренне надеемся, что данная инструкция поможет вам лучше понять и эффективно использовать инструмент Клонированием голоса . Мы старались сделать этот процесс максимально простым и интуитивно понятным.
Не забывайте: каждая ошибка — это шаг к успеху. Если что-то не получается с первого раза, не расстраивайтесь. Экспериментируйте, изучайте, и вы обязательно достигнете желаемых результатов 💛
SYNTX AI: Syntx AI
SYNTX Сообщество: Syntx Community
Блог SYNTX FAMILY: Syntx Family
Служба Заботы SYNTX: Syntx Support