Нейросеть elevenlabs.io пополнилась новым инструментом Speech to Speech, который умеет изменять голос и даже клонировать чужой голос с помощью дополнительного инструмента VoiceLab. Посмотрим как это можно применить в аффилейт маркетинге и арбитраже трафика на примере работы с креативами.
Примеры замены голоса
Нейросеть можно использовать для озвучки креативов с нуля, без необходимости найма актеров или для замены голоса на имеющихся креативах. Ниже пару примеров.
Пример Text to Speech + клонирование голоса
Клонировали голос оригинальной озвучки Морфеуса и сделали синтез речи Text to Speech. Также применили технологию дипфейк из этой статьи: https://cpa.rip/services/facefusion-deepfake/
Пример Speech to Speech
Замена голоса на креативе:
- 00:00 – Оригинальный голос.
- 00:34 – Голос 1.
- 00:55 – Голос 2.
Возможности нейросети Elevenlabs
Нейросеть Elevenlabs – это комбайн для работы с голосом: умеет клонировать (VoiceLab), синтезировать речь (Text to Speech), дублировать на разные языки (dubbing).
Наш обзор нейросети dubbing от Elevenlabs.io, которая переводит и дублирует на разные языки видео- и аудиозаписи с сохранением голоса: https://cpa.rip/services/elevenlabs-dubbing/.
Нейросеть изменяющая голос Speech to Speech – это дополнение к уже имеющемуся инструменту Text to Speech, которое сильно расширяет возможности и область применения нейросети Elevenlabs.
На сегодняшний день модель Eleven Multilingual v2 поддерживает 29 языков, включая русский:
Также имеется большое количество готовых голосов озвучки. У каждого из них есть теги с информацией о языке, стиле и интонации:
Тарифы
- Free – 0
- Starter – $5 ($1 в первый месяц) +включает быстрое клонирование голоса.
- Creator – $22 ($11 в первый месяц) +включает профессиональное клонирование голоса.
- Independent Publisher – $99
- Growing Business – $330
Бесплатный тариф включает в себя 10000 символов (кредитов) для генерации.
Для оплаты можно использовать карту выпущенную в карточных сервисах из нашей подборки: https://cpa.rip/finance/bank-cards/
Работа со Text to Speech
Для синтеза речи из произвольного текста, используйте режим Text to Speech.
- Выберите “Text to Speech”
- Выберите один из стандартных голосов озвучки или созданный самостоятельно в инструменте VoiceLab.
- В поле “Text” впишите текст для озвучки
- Нажмите “Generate”
Генерация занимает всего несколько секунд. Готовую озвучку можно прослушать и скачать в формате mp3, нажав кнопку загрузки:
При каждой новой генерации, ударения и интонация немного меняется, и при необходимости можно генерировать повторно, пока не получится нужный результат. Также можно подкрутить дополнительные настройки:
Работа со Speech to Speech
Speech to Speech новый и более интересный инструмент, он меняет голос у оригинальной озвучки.
- Выберите “Speech to Speech”
- Выберите один из стандартных голосов озвучки или созданный самостоятельно в инструменте VoiceLab.
- В поле “Audio” загрузите звуковой или видео файл. Максимальный вес – 50Mb. Или запишите свой через микрофон. Для достижения лучшего результата используйте чистый звук без посторонних фоновых шумов.
- Нажмите “Generate”
Генерация также происходит за считанные секунды и сразу можно скачать готовый результат замены голоса.
Копировать голос в Elevenlabs
Перейдем к самому интересному инструменту – VoiceLab. В нем есть возможность быстро скопировать чужой голос (голосовой DeepFake), синтезировать голос, задав различные параметры, или использовать голоса из огромной библиотеки сообщества.
Рассмотрим как клонировать голос. Перейдите на страницу VoiceLab, нажав в левом боковом меню “Voices” или “Add Voice” возле списка стандартных голосов на странице “Speech”:
- Откроется инструмент VoiceLab
- Нажмите “Add Generative or Cloned Voice”
- Ранее созданные голоса можно использовать, нажав кнопку “Use” или выбрав в списке голосов на странице “Speech”.
- Выберите “Instant Voice Cloning” для мгновенного клонирования голоса
- Задайте имя
- В поле загрузите референс голоса, который собираетесь клонировать или запишите свой через микрофон.
- При необходимости заполните дополнительное текстовое описание
- Согласитесь с условиями и нажмите “Add Voice”.
Длина записи голоса должна быть не меньше одной минуты, без посторонних шумов и загружаемый файл не больше 10Mb. Мы пробовали клонировать голос на основе 4х секундной записи и тоже получили хороший результат.
Все, клонированный голос можно использовать для озвучки текста в Text to Speech или для изменения голоса в Speech to Speech.
Не используйте клонированные чужие голоса в незаконных или мошеннических целях и если это нарушает авторские права.