Демократизация искусственного интеллекта
Для каждого человека и любой организации
Microsoft поставила перед собой амбициозную цель – демократизировать искусственный интеллект (ИИ) и сделать технологию, которая сейчас считается привилегией ограниченного круга избранных, доступной для всех.
Размышляя о будущем, бывает полезно оглянуться в прошлое. Давайте вспомним, как зарождалась современная информационная эра. С появлением печатного станка в 15 веке объем информации резко повысился, что стало первым шагом к демократизации доступа к ней и позволило людям во всем мире открывать для себя новые знания.
Уровень доступности информации с тех пор только повышается. Наша жизнь полностью изменилась, благодаря нашей способности создавать знания и делиться ими. Однако один ресурс по-прежнему остается дефицитным – это время.
Столкнувшись с таким изобилием информации, мы все еще ограничены возможностью человеческого мозга усваивать ее. Поэтому возникает вопрос о том, как доступные на сегодняшний день вычислительные мощности помогут нам снять это ограничение. В этом и заключается основной принцип искусственного интеллекта. Он создавался не для того, чтобы побеждать людей в играх, а для того, чтобы помогать людям достигать большего, позволить человеку и машинам работать вместе и менять мир к лучшему.
Наш подход основан на четырех принципах, которые описывают пути демократизации искусственного интеллекта для всего населения Земли:
• Мы намерены развивать и использовать технологии искусственного интеллекта для того, чтобы в корне поменять способы взаимодействия с компьютерами и другими устройствами.
• Мы намерены «наделить интеллектом» каждое приложение, с которым люди взаимодействуют, вне зависимости от типа устройств.
• Мы намерены предоставить доступ к возможностям искусственного интеллекта, которые заложены в наших собственных приложениях (когнитивные способности), разработчикам приложений во всем мире.
• Мы создаем самый мощный в мире суперкомпьютер, основанный на технологиях искусственного интеллекта, и с помощью облачных технологий предоставляем каждому желающему доступ к нему, чтобы максимально задействовать его мощь для решения задач, связанных с ИИ, на всех уровнях.
Чего нам удалось достичь
Более 133 миллионов активных пользователей, которые установили виртуальный помощник Cortana[1], уже задали ей более 12 миллиардов вопросов. Теперь она лучше понимает мир и учится лучше понимать людей, а главное – учится использовать эту информацию в нужном контексте.
Cortana работает с самыми различными устройствами, благодаря чему создается эффект экосистемы. Она находит информацию о ваших повседневных занятиях зачастую даже до того, как вы осознаете, что эта информация вам понадобится.
Мы разрабатываем приложения, значительно влияющие на вашу продуктивность, коммуникации и бизнес-процессы – и «наполняем их интеллектом».
В числе таких приложений можно выделить Microsoft Pix, инструмент для обработки фотографий со способностью распознавать детали изображений, который позволяет вам каждый раз получать самую лучшую фотографию из серии снимков.
«Умное» приложение MileIQ для отслеживания рабочих поездок помогает с легкостью классифицировать их по целям и подсчитать расстояние. Пользователи приложения уже проехали свыше 17 миллиардов километров и получили от работодателей компенсацию в размере более 1 миллиарда долларов.
SwiftKey, «умная» клавиатура, разработанная на основе технологии нейронных сетей, следит за тем, как вы набираете слова, и предлагает вам следующее слово, которое вы, возможно, захотите напечатать. Таким образом, даже такое простое занятие, как набор текста, становится более интеллектуальным! При этом приложение не привязано к конкретной платформе и установлено более чем на 300 миллионов устройств, работающих на ОС Android и iOS. SwiftKey уже распознал более 10 триллионов нажатий клавиш и сэкономил пользователям свыше 100 тысяч лет жизни.
Инструмент My Analytics, используемый в Office 365 и основанный на технологиях ИИ, является своего рода фитнес-трекером вашей деловой активности в течение дня и показывает в Microsoft Graph наглядный отчет о проведенном на работе времени.
Помимо того, что повседневные приложения становятся более интеллектуальными, мы стремимся создавать «умные» системы управления взаимоотношениями с клиентами (CRM). CRM-системы обычно представляют собой обособленные решения, которые моделируют активность клиентов и демонстрируют ее в наглядном виде. Они создавались для управления, а не для повышения продаж.
Теперь давайте представим, что специалисты по продажам получат возможность принимать решения на основе информации об активности клиентов вне CRM-систем компании: в Twitter и Facebook, в приложениях для обслуживания клиентов и тому подобное. Это позволит принимать комплексные меры и задействовать эффективные инструменты, способные собирать данные из различных источников.
Кроме того, мы работаем над созданием интеллектуального агента или виртуального помощника, который решает поставленные задачи и в то же время учится, анализируя ваши запросы, как это делают поисковые системы.
Агенты теперь могут получать больше информации, используя алгоритмы самообучения. Это не только стало прорывом для разработчиков виртуальных помощников, но и может оказать сильное влияние на экономическую модель обслуживания клиентов.
Наделяя «интеллектом» самые разнообразные устройства и приложения, от клавиатуры и камеры до бизнес-приложений, мы обучаем приложения видеть, слышать, предугадывать, учиться и действовать.
Мы намерены предоставить все эти возможности в виде набора API всем разработчикам, после чего каждый из них сможет использовать те же модули и структурные элементы, что и Microsoft при разработке Office, Cortana и Dynamics 365.
Например, модулем, включающим в себя возможности машинного обучения и продвинутой аналитики, можно назвать сервис Cortana Intelligence Suite. Он применяется в самых разнообразных отраслях: экономике, здравоохранении, медицине и сельском хозяйстве, и его используют такие компании, как Ecolab, Schneider Electric и Rolls-Royce. Например, благодаря Cortana Intelligent Suite, прогноз погоды теперь можно использовать для определения идеального времени для посева семян.
Еще одним примером можно назвать Bot Framework – набор инструментов для разработки ботов, который позволяет добавлять возможности искусственного интеллекта в новые приложения. Он был представлен на конференции Build 2016, и с тех пор его использовали свыше 40 тыс. разработчиков. В их числе знаменитый сервис Uber, который внедрил в свое приложение возможность распознавания лиц для идентификации водителей в начале рабочего дня. Это позволило повысить уровень безопасности как для самих водителей, так и для пассажиров.
Представьте, что будет, если устройство дополненной реальности HoloLens объединить с когнитивными способностями Azure и с системой определения предпочтений, как в Pinterest. Так, например, поступил ритейлер товаров для дома Lowe’s, изменив процесс перепланировки дома до неузнаваемости.
Как сейчас происходит процесс выбора мебели для дома? Вы идете в магазин, выбираете определённые модели, возвращаетесь домой, смотрите на них, понимаете, что они не подходят, идете обратно в магазин, выбираете, отменяете заказ, и все начинается заново. Однако теперь, благодаря машинному обучению и HoloLens, вы сможете посетить магазин, создать проект перепланировки прямо на месте и сразу заказать подходящую модель. Мы видим, что новые технологии меняют не только бизнес продавцов, но и жизнь их клиентов.
Все это стало возможным благодаря высокой доступности вычислительных ресурсов, которые позволяют нам обрабатывать огромные объемы данных. Мы решили пойти еще дальше.
Для эффективной работы сервисов на основе технологии искусственного интеллекта требуются компоненты более высокого уровня. Мы «разместили» в облаке Azure множество программируемых вентильных матриц (Field-Programmable Gate Arrays, FPGA), которые могут напрямую взаимодействовать с сетями. FPGA представляют собой программируемые аппаратные средства, которые не только повышают скорость и продуктивность работы, но также предоставляют нужную гибкость.
На данный момент мы обладаем глобальной облачной инфраструктурой огромного масштаба, которую мы продолжаем развивать по ряду направлений, включая производительность, масштабируемость и повышение уровня самых продвинутых сервисов, которые выполняют такие сценарии, которые ранее нельзя было даже представить. Наше решение оснащено графическими процессорами, благодаря чему оно стало самым производительным облаком из всех, представленных на рынке.
Наши клиенты, среди которых Jellyfish Pictures и Политехнический университет Вирджинии, используют виртуальные машины на базе мощностей центрального процессора, благодаря чему могут быстро масштабировать свои решения, в зависимости от ситуации. Мы включили FPGA-матрицы в облачные технологии и добились непревзойденной производительности Azure, повысив скорость выполнения любой задачи, включая работу таких критически важных приложений, как SAP.
Это также отличная платформа для работы с технологиями искусственного интеллекта. Мы поддерживаем все фреймворки для ИИ, включая наш собственный инструментарий CNTK (самый быстрый из существующих наборов для работы с нейронными сетями и единственный фреймворк в свободном доступе, способный задействовать мощности более чем одного компьютера), а также платформы TensorFlow, Caffe и Torch.
Все, о чем мы говорили выше, общедоступно уже сейчас. Но мы не будем останавливаться на этом. Облачные технологии Azure стали лишь основой для первого в мире суперкомпьютера на базе технологий искусственного интеллекта. Иными словами, мы поддерживаем закон Мура и стремимся найти решение проблемы снижения темпов роста вычислительных мощностей.
Внедряя эти технологии в облако, мы можем делать удивительные вещи. К примеру, переводы. Задействовав всего один узел структуры FPGA, мы можем перевести все 1440 страниц «Войны и мира» с русского на английский за две с половиной секунды.
Если задействовать все ресурсы суперкомпьютера на базе искусственного интеллекта, можно полностью перевести Википедию – которая в печатном виде представляла бы из себя стопку высотой более 400 метров – быстрее, чем за одну десятую долю секунды. Вы даже не успеете моргнуть за это время.
Такой же набор узлов структуры FPGA может перевести 38 миллионов книг, хранящихся в Библиотеке Конгресса, всего за 76 секунд. За это время вы успеете лишь взять себе кофе.
Облако Azure использует эти технологии для ускорения работы в сети с помощью виртуальной машины, которая может обрабатывать 25 гигабит в секунду со снижением времени ожидания в 10 раз. Каждый раз, когда вы ищете что-то в Bing, вы задействуете их для получения более совершенного результата.
На сегодняшний день у нас самое мощное, самое интеллектуальное и самое гибкое облако в мире. Для нас, как для создателей этой технологии, важно принимать обдуманные решения, чтобы она приносила людям только пользу. Это значит, что в приоритете для нас будут её прозрачность и регулируемость.
Речь идет не только о прогрессивности самих технологий, важно понимать, что человеческая изобретательность и стремление к совершенству, совмещенные с возможностями новых технологий, способны побороть фундаментальные проблемы человечества.
Сегодня мы лишь поверхностно коснулись тех возможностей, которые перед нами открывают технологии искусственного интеллекта. В конце концов, мы верим, что люди и машины могут работать вместе на общее благо, чтобы разрешить глобальные проблемы общества, подарить человеку уникальные впечатления и изменить мир.
[1] Недоступно в России.