Идея заключается в том, чтобы создать более натуральное общение с персональным помощником через динамики Google Home.
Компания Google создала систему под названием Tacotron 2 для синтеза речи напрямую из текста.
Система обладает рядом интересных особенностей например корректировкой правописания во время ввода текста и произношение правильного варианта.
Также система во время произношения теста останавливается перед запятыми, меняет интонацию в зависимости от наличия знаков препинания и корректно воспроизводит более сложные названия и термины.
В произношении системой Tacotron 2 не отличить произношения системы на основе Google AI от произношения человека.
Новая способ синтеза речи от технического гиганта Google объединил предыдущий опыт из проектов WaveNet и оригинального Tacotron.
Проект WaveNet являлся нейронной сетью для синтеза речи.
Он начинался с аудио записей человеческих голосов для копирования и дальнейшего улучшения с каждой итерацией до тех пор пока синтезированный голос не будет похож на человеческий оригинал.
Система использовала 16, 000 образцов каждую секунду.
В свою очередь оригинальный проект Tacotron должен был эмулировать интонацию и просодию.
Объединенные вместе эти две системы должны воспроизводить голос максимально подобный человеческому произношению.
Источник: The Verge
[ratings]
Смотрите также:
YouTube правильно отображает на iOS вертикальные видео
Приложению WhatsApp запретили делиться данными о пользователях с компанией Facebook
Секретный патент Surface преобразовался в рабочий 3D концепт
Apple инвестирует $390 миллионов в созданный лазер
Google Chrome beta может заглушать автовоспроизведение видео
Недавний патент от Samsung продемонстрировал смартфон с обернутым экраном