Microsoft создала систему распознавания беззвучной речи

Ученые исследовательского подразделения Microsoft Research Asia создали технологию SilentVoice, которая способна с точностью до 98,8% распознавать речь, даже если говорящий не произносит ни звука. Достаточно поднести микрофон к губам и говорить, артикулируя слова, но не задействуя голосовые связки. С тем, как работает SilentVoice, можно ознакомиться в этом видео.

SilentVoice представляет собой программное обеспечение и специальный микрофон с поп-фильтром. Система призвана решить проблему трудностей при использовании голосовых ассистентов, разговорах по телефону и записи голосовых сообщений в публичных местах: на работе, в транспорте и т.д. Для активации не нужно произносить специальные команды — достаточно начать говорить беззвучно и SilentVoice автоматически активируется, определив разницу в воздушных потоках, создаваемых разными видами речи.

Создатель SilentVoice Масааки Фукумото предполагает, что его разработка будет особенно полезной в носимых гаджетах. Например, такой микрофон можно встроить в умные часы, кольцо или даже кулон.

Ученые из Microsoft Research давно работают над технологией распознавания речи. В 2017 году созданной в Microsoft системе впервые удалось сравниться с человеком в точности распознавания (количество ошибок тогда составило всего 5,1%). Эта технология используется в операционной системе Windows, Microsoft Office, Skype и других продуктах компании.

Tags: , ,

Связанные посты