Как будто по телефону: XiaoIce, социальный чат-бот Microsoft, запущенный в Китае, общается почти по-человечески

Взаимодействие человека с большинством персональных цифровых помощников и чат-ботов похоже на разговор по рации или на переписку: первый собеседник говорит или пишет что-то интересное, а второй обдумывает эту информацию и отвечает.

Ли Чжоу
Ли Чжоу, ведущий разработчик социального чат-бота XiaoIce

Это эффективно, но Ли Чжоу, ведущий разработчик крайне популярного в Китае социального чат-бота XiaoIce, замечает, что у такого взаимодействия есть один большой недостаток.

«На самом деле люди так не общаются», — говорит Чжоу.

Вместо этого, замечает он, когда люди разговаривают по телефону или переписываются друг с другом, они в большинстве случаев одновременно говорят и слушают, часто завершая фразы за собеседника, прерывая его или нарушая неловкое молчание какой-то новой мыслью.

Однако теперь разработчики Microsoft заявляют, что совершили технологический прорыв, создав чат-бота на основе искусственного интеллекта, с которым можно общаться более естественно — как будто с человеком по телефону.

Недавно Microsoft встроила эту новую технологию в социального чат-бота XiaoIce, имеющего более 200 млн пользователей в Азии. Сейчас Microsoft работает над интеграцией своей технологии в другие проекты, включая чат-бота Zo, запущенного в США.

Говоря языком телекоммуникаций, XiaoIce может работать в «полнодуплексном» режиме, то есть общаться в обоих направлениях одновременно, как во время телефонного звонка. Этим он отличается от чат-ботов «полудуплексного» режима, который больше похож на разговор по рации, когда говорить можно только по очереди.

Чжоу говорит, что новое обновление, которое Microsoft называет «полнодуплексной речью» (full duplex voice sense), улучшает способность XiaoIce предсказывать, что собеседник скажет дальше. Это помогает принимать решения о том, как и когда реагировать на фразы собеседника. Такое умение совершенно естественно для человека, но пока не наблюдается у других чат-ботов.

«Это искусство общения, которое люди используют в повседневной жизни», — говорит Чжоу.

Полнодуплексная речь уменьшает неестественные задержки, из-за которых беседа с чат-ботами иногда кажется неловкой или натянутой.

Инг Ванг, директор Microsoft, курирующий проект Zo.
Инг Ванг, директор Microsoft, курирующий проект Zo.

«Это заметно ускоряет ответы и делает их более естественными», — говорит Инг Ванг, директор Microsoft, курирующий проект Zo.

Кроме того, новая технология избавляет от необходимости использовать «слово-будильник» (обычно это имя чат-бота) в каждой фразе диалога с ботом.

Это достижение опирается на другие возможности, появившиеся у XiaoIce, такие как способность делать паузу ради какого-то действия (например, прервать рассказ, чтобы включить свет). После этого чат-бот может продолжить беседу, как человек, ненадолго отвлекшийся, но потом вернувшийся к исходной теме разговора.

Ди Ли, генеральный менеджер Microsoft по XiaoIce,
Ди Ли, генеральный менеджер Microsoft по XiaoIce,

Ди Ли, генеральный менеджер Microsoft по XiaoIce, говорит, что все эти усовершенствования являются частью усилий Microsoft по созданию социальных чат-ботов на основе искусственного интеллекта, понимающих эмоции людей и их интеллектуальные потребности. Это основная общая цель XiaoIce, Zo и других социальных чат-ботов Microsoft, запущенных по всему миру, включая Ruuh в Индии и Rinna в Японии и Индонезии.

В отличие от таких помощников, как Кортана, повышающих продуктивность работы, социальные чат-боты Microsoft предназначены для ведения долгих диалогов на общие темы. У них есть чувство юмора, они могут поддерживать легкие беседы, играть в игры, запоминать персональные черты собеседников и добродушно дразнить людей, как это делал бы друг-человек.

По словам Ли, такие разговоры становятся возможными благодаря полнодуплексной речи.

«Поскольку такие беседы очень естественны, пользователь во время них чувствует себя весьма комфортно», — говорит он.

Ссылки по теме:

·         Чат-бот Zo помогает бездомным котам найти новый дом

·         Демократизация искусственного интеллекта: еще доступнее