Новый сервис CaptionBot демонстрирует всем желающим, насколько хорошо компьютерное зрение позволяет видеть окружающий мир, запечатленный на фотографиях. Вы загружаете свои фото, а CaptionBot пытается понять, что на них изображено. С каждым днем это получается у него все лучше, поскольку, как и любая другая обучающаяся система, он способен быстро учиться на своих ошибках.
Сервис основан на наборе инструментов, доступных разработчикам в Microsoft Cognitive Services. Это – новое название интеллектуальных сервисов, созданных исследователями Microsoft Research с помощью технологий машинного обучения и ранее известных как Project Oxford. Новое название и новые возможности, например, интеграция Cortana Intelligence Suite, были презентованы на Build-2016.
Необязательно знать латынь, чтобы понять смысл нового названия. Когнитивный, значит, связанный с познанием. В случае с обучающимися системами речь идет о некой машинной версии восприятия, представления и продуцирования информации. Чуть подробнее мы рассказывали о принципах работы таких систем в статье «Распознавание образов и новое поколение нейронных сетей Microsoft». Если вы прочли ее, то прекрасно понимаете, что CaptionBot является демонстрацией возможностей API когнитивных сервисов от Microsoft, но работают они далеко не в полную силу и обучаются спонтанно, а не в рамках определенной программы. Поэтому и процент ошибок, которые он допускает, значительно больше, чем у специализированных сервисов. Однако точность распознавания уже сегодня достаточно велика, чтобы продемонстрировать сам факт существования машинного восприятия, а также огромные перспективы, которые открывает это направление ИТ.