Microsoft представила нейросеть VALL-E, которая может скопировать голос любого человека

Microsoft представила нейросеть VALL-E, которая может скопировать голос любого человека

Компания Microsoft сообщила о создании нейросети под названием VALL-E, которая имитирует любой голос. Для этого ей нужно не более 3 секунд записи оригинального голоса. Нейросеть способна не только имитировать голос, но и даже дублировать эмоциональный фон.

Microsoft представила нейросеть VALL-E, которая может скопировать голос любого человекаТак работает нейросеть VALL-EТак работает нейросеть VALL-E

Система включает в себя нейронную языковую модель, в основе которой лежит EnCodec. Она разделает голос человека на компоненты и сопоставляет со своей базой данных. После этого нейросеть использует эти сведения для построения новых фраз.

Отзывы

0 %

Оценка пользователя

0 рейтинги
Оцените это

Поделиться

Оставьте свой комментарий