![[v1 1.png]]
Быстро и удобно создавайте неограниченное количество голосов с помощью инструмента **клонирования голоса и синтеза речи**. Доступны разные модели на выбор, множество гибких настроек, поддержка 24 языков и удобный интерфейс для управления голосами.
- [[#🎛 Навигация|🎛 Навигация]]
- [[#💥 Пошаговое руководство по использованию Клонирования голоса.|💥 Пошаговое руководство по использованию Клонирования голоса.]]
- [[#💥 Пошаговое руководство по использованию Клонирования голоса.#Настройки модели|Настройки модели]]
- [[#💥 Пошаговое руководство по использованию Клонирования голоса.#Загрузка аудио файла|Загрузка аудио файла]]
- [[#💥 Пошаговое руководство по использованию Клонирования голоса.#Начать клонирование собственного голоса|Начать клонирование собственного голоса]]
- [[#💥 Пошаговое руководство по использованию Клонирования голоса.#Результат|Результат]]
- [[#💥 Пошаговое руководство по использованию Cинтеза речи.|💥 Пошаговое руководство по использованию Cинтеза речи.]]
- [[#💥 Пошаговое руководство по использованию Cинтеза речи.#Настройки модели|Настройки модели]]
- [[#Настройки модели#Голоса|Голоса]]
- [[#Настройки модели#Мои голоса|Мои голоса]]
- [[#Настройки модели#Любимые|Любимые]]
- [[#Настройки модели#Настройки|Настройки]]
- [[#💥 Пошаговое руководство по использованию Cинтеза речи.#Текст и результат|Текст и результат]]
### 🎛 Навигация
**🏠 Главное меню > 🔊 Аудио с ИИ > 👥 Клонирование голоса**
![[Screenshot 2025-05-08 at 17.41.25.png]]
![[Screenshot 2025-05-08 at 17.42.00.png]]
---
### 💥 Пошаговое руководство по использованию Клонирования голоса.
#### Настройки модели
Перейдите в раздел **«Настройки модели»**, затем откройте вкладку **«Настройки»**. После этого прокрутите страницу немного вниз и внимательно заполните параметры в разделе **«Настройки клонирования»**.
![[Screenshot 2025-05-09 at 18.07.33.png]]
**Шумоподавление** - если данная настройка включена, то он активирует процесс удаления фонового шума и артефактов из аудиозаписи, чтобы сделать голос чище и более реалистичным.
**Нормализация громкости** — если данная настройка включена, то он активирует процесс выравнивания уровня громкости аудиофайла, чтобы звук не был слишком тихим или слишком громким, а оставался комфортным и стабильным при воспроизведении.
#### Загрузка аудио файла
**Требования к загружаемым аудиофайлам:**
- Допустимая длина аудио — **от 30 секунд до 5 минут.**
- Поддерживаемые форматы: **MP3, M4A, WAV**.
- Максимальный вес файла - **5 МБ**.
Чем длиннее аудиофайл, тем выше качество итогового голосового клонирования. Для наилучшего результата рекомендуется загружать запись, содержащую только ваш голос — без посторонних шумов, голосов других людей или фоновых звуков. Это позволяет нейросети точнее распознать особенности вашей речи и создать максимально чёткую и достоверную голосовую копию.
**Например ( Актуально только как пример голоса. Формат не актуален):**
![[0508.mp4]]
#### Начать клонирование собственного голоса
После загрузки аудиофайла вы сможете либо отправить его на генерацию голосового клона, либо удалить, если файл был загружен ошибочно.
![[Screenshot 2025-05-08 at 18.49.52.png]]
#### Результат
После успешного клонирования вашего голоса вы получите уведомление о завершении процесса.
![[Screenshot 2025-05-08 at 18.56.25.png]]
Затем перейдите в настройки модели, откройте раздел **«Мои голоса»** — там вы найдете созданный вами голос. Для того, что бы синтезировать ваш текст с клонированым вами голосом, просто нажмите на него, тем самым выбрав голос для будущего аудио.
В этом разделе вы сможете:
- Выбрать голос для синтеза,
- изменить название голоса,
- добавить его в избранное,
- прослушать результат.
![[Screenshot 2025-05-08 at 19.09.56.png]]![[Screenshot 2025-05-08 at 19.10.52.png]]
---
### 💥 Пошаговое руководство по использованию Cинтеза речи.
#### Настройки модели
##### Голоса
Данный раздел предоставляет собой список добавленных нами голосов, который поможет вам подобрать голос для синтеза речи очень быстро и не клонируя свой собственный, а подбирая его по фильтрам и названию.
![[2025-05-08 19.21.23.jpg]]
Инструкция по выбору голосов
**1. Определение пола голоса**
Для удобства поиска вы можете ориентироваться на пол диктора. Это поможет быстрее подобрать подходящий голос.
- **Иконка с кружком и стрелкой вверх (♂)** — обозначает **мужской голос**.
- **Иконка с кружком и вертикальной палочкой вниз (♀)** — обозначает **женский голос**.
**2. Названия голосов**
Названия голосов указаны на английском языке. Перевод может дать представление о характере или стиле голоса.
**Пример:**
Friendly person — «дружелюбный человек».
- **Тон:** тёплый, мягкий, без резких или агрессивных нот.
- **Тембр:** средний или умеренно высокий. Даже низкий голос может звучать дружелюбно, если он спокойный и выразительный.
- **Темп речи:** умеренный. Излишне быстрая речь может восприниматься как навязчивая, а слишком медленная — как скучная.
- **Громкость:** средняя. Голос должен звучать уверенно, но не громко и без излишнего давления.
**3. Выбор голоса**
Чтобы выбрать голос для дальнейшего использования:
- Кликните на нужный голос.
- Если вокруг него появился **фиолетовый ободок**, это означает, что голос выбран, и именно он будет использоваться при генерации.
**5. Прослушивание**
- Нажмите на **зелёную кнопку "Play"**, чтобы прослушать как звучит голос перед выбором.
**6. Добавление в избранное**
- Нажмите на **значок "Сердце"**, чтобы сохранить понравившийся голос в избранное.
- Если сердце стало **красным**, этот голос будет доступен в разделе **«Любимые»** для быстрого доступа в будущем.
##### Мои голоса
В данном разделе находятся голоса, которые были ранее клонированы вами.
![[2025-05-08 19.47.27.jpg]]
##### Любимые
В данном разделе находятся голоса, которые вы пометили ранее "сердцем".Данный раздел поможет вам упростить поиск понравившихся голосов.
![[2025-05-08 19.52.42.jpg]]
##### Настройки
![[Screenshot 2025-05-09 at 18.08.14.png]]
**1. Выбор модели**
Доступны две модели синтеза речи:
- **Turbo** — оптимальный вариант по скорости и стоимости. Обеспечивает быстрое воспроизведение текста с базовым качеством звучания.
- **HD** — модель высокого качества. Обеспечивает более естественное и выразительное звучание, однако стоит дороже.
**2. Скорость воспроизведения речи**
Параметр скорости определяет, с какой скоростью будет произноситься текст голосом, выбранным пользователем.
Диапазон значений: от **0.5** до **2.0**.
- Значение **1.0** соответствует естественной скорости речи.
- Значения **выше 1.0** увеличивают темп речи — голос будет говорить быстрее.
- Значения **ниже 1.0** замедляют воспроизведение — голос будет говорить медленнее.
**3. Громкость**
Параметр **«Громкость»** отвечает за уровень звука воспроизводимого аудио.
Допустимые значения: **от 0 до 10**.
- Значение **1.0** соответствует естественной громкости речи.
- Значения **выше 1.0** повышают громкость, делая голос звучнее.
- Значения **ниже 1.0** снижают громкость, делая голос тише и мягче.
**4. Высота тона**
Параметр **«Высота тона»** регулирует, насколько высокий или низкий тембр будет у голоса.
Допустимые значения: **от -12 до 12**.
- Значение **0** соответствует естественной высоте голоса.
- Значения **больше 0** повышают тональность — голос становится выше и может звучать более пискляво.
- Значения **меньше 0** понижают тональность — голос звучит ниже и грубее.
**5. Эмоция**
Мы предоставляем ряд эмоций, которые будут использованы при синтезе для того что бы передать более ярко прописанный Вами текст. Доступные эмоции:
- **Автоматически** - звучит ровно и безжизненно — он монотонный, без интонационных скачков, чаще всего вызывает ощущение отчуждённости или нейтральности. Полностью соответствует голосу, который вы слышите, нажав на иконку "Play"(зелёная кнопка).
![[автоматический.mp4]]
- **Нейтральный** - живой, но сдержанный — он уравновешен, лишён ярко выраженных эмоций, используется в официальной или информативной речи, где важно сохранить объективность.
![[нейтральный.mp4]]
- **Счастливый** - Когда человек испытывает **счастье**, голос становится светлее, интонации более оживлёнными, фразы звучат бодро и часто чуть быстрее обычного. Он будто "улыбается", и это чувствуется даже без визуального контакта
![[счастливый.mp4]]
- **Грустный** - голос низкий, становится медленным, мягким и приглушённым — словно в нём исчезает энергия, а слова даются с трудом.
![[грустный.mp4]]
- **Злой** - громкий, напряжённый, резкий, с резкими интонационными скачками и короткими фразами. В нём ощущается внутреннее давление.
![[злой.mp4]]
- **Напуганный** - голос может дрожать, становиться высоким, неустойчивым — как будто слова срываются с губ. Интонации скачут, дыхание учащается, появляются сбивчивость.
![[напуганный.mp4]]
- **Вызывающий отвращений** - в голосе проявляется в виде тягучих, замедленных интонаций, с оттенком презрения — он словно демонстрирует нежелание продолжать разговор.
![[вызывающий отвращение.mp4]]
- **Удивленный** - всегда сопровождается всплеском интонации: голос внезапно становится выше, особенно на ключевых словах, появляется пауза перед реакцией, будто мозг ещё обрабатывает информацию. Этот голос звучит открыто, с элементом неожиданности или восхищения.
![[удивленный.mp4]]
**6. Канал**
Канал голоса - это **количестве аудиоканалов**, с которыми работает нейросеть при обработке звука. Мы предоставляем два канала - Моно и Стерео.
**Моно** — это формат аудиосигнала, в котором используется **один канал** для записи и воспроизведения звука. Все аудиоинформации обрабатываются как поступающие из **одного источника**, без разделения по пространству.
Примеры использования:
- Телефонные разговоры
- Запись речи диктофоном
**Стерео** — это формат, использующий **два независимых канала** (левый и правый), что позволяет создать эффект пространственного звучания. Такое распределение каналов помогает слушателю воспринимать направление и глубину источников звука.
Примеры использования:
- Музыкальные композиции
- Видеоконтент (фильмы, сериалы)
**7. Уклон языка**
В разделе "Уклон языка" вы можете выбрать один из 24 доступных языков, чтобы задать акцент для озвучивания. Если вы заранее введёте текст на выбранном языке, система воспроизведёт его с наиболее приближённым и выразительным акцентом носителя.
**Например:**
Голос с Английским уклоном:
![[0509.mp4]]
#### Текст и результат
После того как вы завершите настройку всех параметров, закройте соответствующее окно, введите текст для озвучивания и нажмите «Начать синтез речи». Ваш запрос будет автоматически отправлен на обработку.
![[Screenshot 2025-05-09 at 19.27.54.png]]
---
***Мы искренне надеемся, что данная инструкция поможет вам лучше понять и эффективно использовать инструмент Клонированием голоса . Мы старались сделать этот процесс максимально простым и интуитивно понятным.***
***Не забывайте: каждая ошибка — это шаг к успеху. Если что-то не получается с первого раза, не расстраивайтесь. Экспериментируйте, изучайте, и вы обязательно достигнете желаемых результатов 💛***
---
**SYNTX AI:** [Syntx AI](https://t.me/syntxaibot)
**SYNTX Сообщество:** [Syntx Community](https://t.me/syntxaicommunity)
**Блог SYNTX FAMILY:** [Syntx Family](https://t.me/syntxfamily)
**Служба Заботы SYNTX:** [Syntx Support](https://t.me/syntxhelp)