Google AI учиться воспроизводить речь человека

Идея заключается в том, чтобы создать более натуральное общение с персональным помощником через динамики Google Home.

Компания Google создала систему под названием Tacotron 2 для синтеза речи напрямую из текста.

Система обладает рядом интересных особенностей например корректировкой правописания во время ввода текста и произношение правильного варианта.

Также система во время произношения теста останавливается перед запятыми, меняет интонацию в зависимости от наличия знаков препинания и корректно воспроизводит более сложные названия и термины.

В произношении системой Tacotron 2 не отличить произношения системы на основе Google AI от произношения человека.

Новая способ синтеза речи от технического гиганта Google объединил предыдущий опыт из проектов WaveNet и оригинального Tacotron.

Проект WaveNet являлся нейронной сетью для синтеза речи.

Он начинался с аудио записей человеческих голосов для копирования и дальнейшего улучшения с каждой итерацией до тех пор пока синтезированный голос не будет похож на человеческий оригинал.

Система использовала 16, 000 образцов каждую секунду.

В свою очередь оригинальный проект Tacotron должен был эмулировать интонацию и просодию.

Объединенные вместе эти две системы должны воспроизводить голос максимально подобный человеческому произношению.

Источник: The Verge

[ratings]

Приложению WhatsApp запретили делиться данными о пользователях с компанией Facebook

Секретный патент Surface преобразовался в рабочий 3D концепт

Apple инвестирует $390 миллионов в созданный лазер

Google Chrome beta может заглушать автовоспроизведение видео

Недавний патент от Samsung продемонстрировал смартфон с обернутым экраном