На зависть Азимову: смартфон в контексте твоей жизни

Эволюционный путь компьютерного интерфейса лежит от клавиатуры до распознавания мыслей. Но, на самом деле, радикальное упрощение в работе со смартфонами, планшетами и прочей машинерией происходит не от замены клавиатуры на диктовку в микрофон. Главное – чтобы компьютер требовал меньше внимания и усилий со стороны пользователя и решал задачи владельца с максимально возможной автономностью. Рывок в области человеко-машинного взаимодействия мы увидим, когда смартфоны и другие персональные устройства будут не тупо ожидать команды, а активно обрабатывать окружающую информацию, учитывать ваши невысказанные пожелания или восстанавливать пропущенные звенья в цепочке команд, а порой действовать самостоятельно.

Самый простой и в то же время очень важный элемент самостоятельности – разумная интерактивность. Если запрос пользователя или ситуация не вполне ясны – нужно всё уточнить, как это сделал бы человек. Например, получив довольно расплывчатое указание «позвони ей», смартфон должен «понять», что речь идет о наиболее частой собеседнице владельца. А если таковых несколько – переспросить – «Кате или Маше?». Причём способ «переспрашивания» смартфон должен выбрать самостоятельно – если владелец смотрит на экран, можно вывести запрос в виде двух портретов. А если сидит за рулем и в машине нет пассажиров – можно переспросить голосом.

Для того, чтобы демонстрировать подобные чудеса сообразительности, смартфону нужно две вещи, которыми сегодня он обладает не в полной мере: понимать контекст, в котором находятся владелец и его устройство, а также обладать базой решений для каждой распознанной ситуации.

Контекст – это текущая обстановка: местоположение владельца, компания людей, в которой он находится, то, чем он сейчас занимается, и так далее. Чтобы правильно определять контекст, смартфон должен быть снабжен целой батареей сенсоров и грамотно комбинировать их показания. Уже сегодня смартфоны, в принципе, снабжены неплохо: две камеры, микрофон, датчик освещенности, акселерометр, GPS и другие детекторы местоположения. Сличая показания всего перечисленного, можно весьма точно определить контекст. Но пока сделаны лишь первые шаги в нужном направлении. Например, телефоны Nokia N8 и E7 не требуют разблокировки экрана во время входящего звонка. Они включают экран и принимают команды только когда датчик освещенности и акселерометр показывают, что владелец взял аппарат в руку, достал его из кармана или сумки (корпус куда-то двигается, изменилась освещенность).
Другой пример – в недавно анонсированном Android 4.0 наконец появилась вполне очевидная функция «разблокировки по лицу» – чтобы отключить экран блокировки не нужно вводить пароль, смартфон распознает владельца с помощью фронтальной камеры. Очень много и вспомогательных источников информации о контексте. Например, очень полезен органайзер, если пользователь его аккуратно ведет. Тогда смартфон будет «знать» о совещаниях, авиаперелетах и прочих важных обстоятельствах жизни, и правильно их учитывать. Другие примеры – подключенная громкая связь Bluetooth или USB-кабель . Первое почти наверняка означает, что владелец едет на авто (и не может особо смотреть на экран), а второе – что он дома или в офисе (точное положение уточняем по GPS).

Комбинирование информации вроде описанной выше с различными базами данных в интернете дает мощный синергетический эффект. В результате смартфон может выполнять работу, характерную для вышколенной секретарши. Например, вы планируете вылетать в командировку в понедельник в 11 утра, в аэропорт выезжать в 8 утра, просыпаться в 7. Все эти события занесены в будильник и органайзер. Скачав прогноз погоды и узнав, что рано утром выпал мокрый снег и ожидается гололед, смартфон должен сам (!) спрогнозировать сложную ситуацию на дорогах и сам (!) подать сигнал будильника на 20 минут раньше, снабдив его своим устным комментарием «придется выехать пораньше». Подобные сценарии не являются фантастикой, научная и технологическая база для них уже существует. Уже сегодня ряд приложений для путешественников, например, предлагают направиться в аэропорт за три часа до вылета. А если за полчаса до вылета владелец все еще не в аэропорту – начинают автоматически искать ему другой авиарейс на замену.

На самом деле, подобные умные действия не являются плодом работы полноценного самообучаемого искусственного интеллекта. Пока ИИ учится, он нередко ошибается, а потребитель нетолерантен к ошибкам. Поэтому для имитации разума в смартфоне лучше подходит экспертная система, то есть обширная база ситуаций с критерием определения каждой из них и рекомендуемым действием. Составив на основе контекстов «где», «когда», «что» и «с кем» справочник примерно тысячи типовых ситуаций, можно быть уверенным, что смартфон будет адекватно помогать владельцу в 80-90% его повседневных дел – от выбора утреннего маршрута в офис до заказа билетов в отпуск. А вот в оставшихся 10% дел человеку придется пошевелить мозгами самому – если он не разучился это делать, избалованный умной техникой.

Связанные посты