👥 Клонирование голоса

![[v1 1.png]] Быстро и удобно создавайте неограниченное количество голосов с помощью инструмента **клонирования голоса и синтеза речи**. Доступны разные модели на выбор, множество гибких настроек, поддержка 24 языков и удобный интерфейс для управления голосами. - [[#🎛 Навигация|🎛 Навигация]] - [[#💥 Пошаговое руководство по использованию Клонирования голоса.|💥 Пошаговое руководство по использованию Клонирования голоса.]] - [[#💥 Пошаговое руководство по использованию Клонирования голоса.#Настройки модели|Настройки модели]] - [[#💥 Пошаговое руководство по использованию Клонирования голоса.#Загрузка аудио файла|Загрузка аудио файла]] - [[#💥 Пошаговое руководство по использованию Клонирования голоса.#Начать клонирование собственного голоса|Начать клонирование собственного голоса]] - [[#💥 Пошаговое руководство по использованию Клонирования голоса.#Результат|Результат]] - [[#💥 Пошаговое руководство по использованию Cинтеза речи.|💥 Пошаговое руководство по использованию Cинтеза речи.]] - [[#💥 Пошаговое руководство по использованию Cинтеза речи.#Настройки модели|Настройки модели]] - [[#Настройки модели#Голоса|Голоса]] - [[#Настройки модели#Мои голоса|Мои голоса]] - [[#Настройки модели#Любимые|Любимые]] - [[#Настройки модели#Настройки|Настройки]] - [[#💥 Пошаговое руководство по использованию Cинтеза речи.#Текст и результат|Текст и результат]] ### 🎛 Навигация **🏠 Главное меню > 🔊 Аудио с ИИ > 👥 Клонирование голоса** ![[Screenshot 2025-05-08 at 17.41.25.png]] ![[Screenshot 2025-05-08 at 17.42.00.png]] --- ### 💥 Пошаговое руководство по использованию Клонирования голоса. #### Настройки модели Перейдите в раздел **«Настройки модели»**, затем откройте вкладку **«Настройки»**. После этого прокрутите страницу немного вниз и внимательно заполните параметры в разделе **«Настройки клонирования»**. ![[Screenshot 2025-05-09 at 18.07.33.png]] **Шумоподавление** - если данная настройка включена, то он активирует процесс удаления фонового шума и артефактов из аудиозаписи, чтобы сделать голос чище и более реалистичным. **Нормализация громкости** — если данная настройка включена, то он активирует процесс выравнивания уровня громкости аудиофайла, чтобы звук не был слишком тихим или слишком громким, а оставался комфортным и стабильным при воспроизведении. #### Загрузка аудио файла **Требования к загружаемым аудиофайлам:** - Допустимая длина аудио — **от 30 секунд до 5 минут.** - Поддерживаемые форматы: **MP3, M4A, WAV**. - Максимальный вес файла - **5 МБ**. Чем длиннее аудиофайл, тем выше качество итогового голосового клонирования. Для наилучшего результата рекомендуется загружать запись, содержащую только ваш голос — без посторонних шумов, голосов других людей или фоновых звуков. Это позволяет нейросети точнее распознать особенности вашей речи и создать максимально чёткую и достоверную голосовую копию. **Например ( Актуально только как пример голоса. Формат не актуален):** ![[0508.mp4]] #### Начать клонирование собственного голоса После загрузки аудиофайла вы сможете либо отправить его на генерацию голосового клона, либо удалить, если файл был загружен ошибочно. ![[Screenshot 2025-05-08 at 18.49.52.png]] #### Результат После успешного клонирования вашего голоса вы получите уведомление о завершении процесса. ![[Screenshot 2025-05-08 at 18.56.25.png]] Затем перейдите в настройки модели, откройте раздел **«Мои голоса»** — там вы найдете созданный вами голос. Для того, что бы синтезировать ваш текст с клонированым вами голосом, просто нажмите на него, тем самым выбрав голос для будущего аудио. В этом разделе вы сможете: - Выбрать голос для синтеза, - изменить название голоса, - добавить его в избранное, - прослушать результат. ![[Screenshot 2025-05-08 at 19.09.56.png]]![[Screenshot 2025-05-08 at 19.10.52.png]] --- ### 💥 Пошаговое руководство по использованию Cинтеза речи. #### Настройки модели ##### Голоса Данный раздел предоставляет собой список добавленных нами голосов, который поможет вам подобрать голос для синтеза речи очень быстро и не клонируя свой собственный, а подбирая его по фильтрам и названию. ![[2025-05-08 19.21.23.jpg]] Инструкция по выбору голосов **1. Определение пола голоса** Для удобства поиска вы можете ориентироваться на пол диктора. Это поможет быстрее подобрать подходящий голос. - **Иконка с кружком и стрелкой вверх (♂)** — обозначает **мужской голос**. - **Иконка с кружком и вертикальной палочкой вниз (♀)** — обозначает **женский голос**. **2. Названия голосов** Названия голосов указаны на английском языке. Перевод может дать представление о характере или стиле голоса. **Пример:** Friendly person — «дружелюбный человек». - **Тон:** тёплый, мягкий, без резких или агрессивных нот. - **Тембр:** средний или умеренно высокий. Даже низкий голос может звучать дружелюбно, если он спокойный и выразительный. - **Темп речи:** умеренный. Излишне быстрая речь может восприниматься как навязчивая, а слишком медленная — как скучная. - **Громкость:** средняя. Голос должен звучать уверенно, но не громко и без излишнего давления. **3. Выбор голоса** Чтобы выбрать голос для дальнейшего использования: - Кликните на нужный голос. - Если вокруг него появился **фиолетовый ободок**, это означает, что голос выбран, и именно он будет использоваться при генерации. **5. Прослушивание** - Нажмите на **зелёную кнопку "Play"**, чтобы прослушать как звучит голос перед выбором. **6. Добавление в избранное** - Нажмите на **значок "Сердце"**, чтобы сохранить понравившийся голос в избранное. - Если сердце стало **красным**, этот голос будет доступен в разделе **«Любимые»** для быстрого доступа в будущем. ##### Мои голоса В данном разделе находятся голоса, которые были ранее клонированы вами. ![[2025-05-08 19.47.27.jpg]] ##### Любимые В данном разделе находятся голоса, которые вы пометили ранее "сердцем".Данный раздел поможет вам упростить поиск понравившихся голосов. ![[2025-05-08 19.52.42.jpg]] ##### Настройки ![[Screenshot 2025-05-09 at 18.08.14.png]] **1. Выбор модели** Доступны две модели синтеза речи: - **Turbo** — оптимальный вариант по скорости и стоимости. Обеспечивает быстрое воспроизведение текста с базовым качеством звучания. - **HD** — модель высокого качества. Обеспечивает более естественное и выразительное звучание, однако стоит дороже. **2. Скорость воспроизведения речи** Параметр скорости определяет, с какой скоростью будет произноситься текст голосом, выбранным пользователем. Диапазон значений: от **0.5** до **2.0**. - Значение **1.0** соответствует естественной скорости речи. - Значения **выше 1.0** увеличивают темп речи — голос будет говорить быстрее. - Значения **ниже 1.0** замедляют воспроизведение — голос будет говорить медленнее. **3. Громкость** Параметр **«Громкость»** отвечает за уровень звука воспроизводимого аудио. Допустимые значения: **от 0 до 10**. - Значение **1.0** соответствует естественной громкости речи. - Значения **выше 1.0** повышают громкость, делая голос звучнее. - Значения **ниже 1.0** снижают громкость, делая голос тише и мягче. **4. Высота тона** Параметр **«Высота тона»** регулирует, насколько высокий или низкий тембр будет у голоса. Допустимые значения: **от -12 до 12**. - Значение **0** соответствует естественной высоте голоса. - Значения **больше 0** повышают тональность — голос становится выше и может звучать более пискляво. - Значения **меньше 0** понижают тональность — голос звучит ниже и грубее. **5. Эмоция** Мы предоставляем ряд эмоций, которые будут использованы при синтезе для того что бы передать более ярко прописанный Вами текст. Доступные эмоции: - **Автоматически** - звучит ровно и безжизненно — он монотонный, без интонационных скачков, чаще всего вызывает ощущение отчуждённости или нейтральности. Полностью соответствует голосу, который вы слышите, нажав на иконку "Play"(зелёная кнопка). ![[автоматический.mp4]] - **Нейтральный** - живой, но сдержанный — он уравновешен, лишён ярко выраженных эмоций, используется в официальной или информативной речи, где важно сохранить объективность. ![[нейтральный.mp4]] - **Счастливый** - Когда человек испытывает **счастье**, голос становится светлее, интонации более оживлёнными, фразы звучат бодро и часто чуть быстрее обычного. Он будто "улыбается", и это чувствуется даже без визуального контакта ![[счастливый.mp4]] - **Грустный** - голос низкий, становится медленным, мягким и приглушённым — словно в нём исчезает энергия, а слова даются с трудом. ![[грустный.mp4]] - **Злой** - громкий, напряжённый, резкий, с резкими интонационными скачками и короткими фразами. В нём ощущается внутреннее давление. ![[злой.mp4]] - **Напуганный** - голос может дрожать, становиться высоким, неустойчивым — как будто слова срываются с губ. Интонации скачут, дыхание учащается, появляются сбивчивость. ![[напуганный.mp4]] - **Вызывающий отвращений** - в голосе проявляется в виде тягучих, замедленных интонаций, с оттенком презрения — он словно демонстрирует нежелание продолжать разговор. ![[вызывающий отвращение.mp4]] - **Удивленный** - всегда сопровождается всплеском интонации: голос внезапно становится выше, особенно на ключевых словах, появляется пауза перед реакцией, будто мозг ещё обрабатывает информацию. Этот голос звучит открыто, с элементом неожиданности или восхищения. ![[удивленный.mp4]] **6. Канал** Канал голоса - это **количестве аудиоканалов**, с которыми работает нейросеть при обработке звука. Мы предоставляем два канала - Моно и Стерео. **Моно** — это формат аудиосигнала, в котором используется **один канал** для записи и воспроизведения звука. Все аудиоинформации обрабатываются как поступающие из **одного источника**, без разделения по пространству. Примеры использования: - Телефонные разговоры - Запись речи диктофоном **Стерео** — это формат, использующий **два независимых канала** (левый и правый), что позволяет создать эффект пространственного звучания. Такое распределение каналов помогает слушателю воспринимать направление и глубину источников звука. Примеры использования: - Музыкальные композиции - Видеоконтент (фильмы, сериалы) **7. Уклон языка** В разделе "Уклон языка" вы можете выбрать один из 24 доступных языков, чтобы задать акцент для озвучивания. Если вы заранее введёте текст на выбранном языке, система воспроизведёт его с наиболее приближённым и выразительным акцентом носителя. **Например:** Голос с Английским уклоном: ![[0509.mp4]] #### Текст и результат После того как вы завершите настройку всех параметров, закройте соответствующее окно, введите текст для озвучивания и нажмите «Начать синтез речи». Ваш запрос будет автоматически отправлен на обработку. ![[Screenshot 2025-05-09 at 19.27.54.png]] --- ***Мы искренне надеемся, что данная инструкция поможет вам лучше понять и эффективно использовать инструмент Клонированием голоса . Мы старались сделать этот процесс максимально простым и интуитивно понятным.*** ***Не забывайте: каждая ошибка — это шаг к успеху. Если что-то не получается с первого раза, не расстраивайтесь. Экспериментируйте, изучайте, и вы обязательно достигнете желаемых результатов 💛*** --- **SYNTX AI:** [Syntx AI](https://t.me/syntxaibot) **SYNTX Сообщество:** [Syntx Community](https://t.me/syntxaicommunity) **Блог SYNTX FAMILY:** [Syntx Family](https://t.me/syntxfamily) **Служба Заботы SYNTX:** [Syntx Support](https://t.me/syntxhelp)