Две группы ученых из России стали победителями конкурса Azure for Research, проводившегося исследовательским подразделением Microsoft Research. Молодые ученые получили возможность бесплатно использовать облачную платформу Microsoft Azure для своих исследований в течение года.
Обладателями облачных грантов от Microsoft стали представители Лаборатории технологий программирования факультета Вычислительной математики и кибернетики Московского Государственного Университета им. М.В. Ломоносова и научная группа Центра Изучения Интернета и Общества. Каждая из них при работе над проектами использует технологии машинного обучения и создает инновационные решения, которые могут быть использованы в самых разных областях жизни человека и общества.
Группа ученых Центра Изучения Интернета и Общества ставит своей целью изучение социальных сетей, а также поведения различных групп пользователей в онлайн и оффлайн среде. «Поскольку количество пользователей социальных сетей исчисляется миллионами, даже самый простой анализ структуры представляет собой нетривиальную вычислительную задачу, не говоря уже об анализе содержания сообщений, – рассказывает Иван Климов, руководитель Центра. – В нашем проекте мы можем отслеживать распространение социальных сетей в различных городах России и изучать влияние от их распространения на поведение людей в реальной жизни. Например, на их участие в различных сообществах, общественно важных действиях, протестных акциях. В перспективе данные позволят изучить, каким образом структура социальных сетей влияет на распространение информации и на то, как эта информация отражается на поведении людей в оффлайн». Параллельно Центр проводит исследования в области цифровой антропологии, использующие анализ данных фотобанков общественных выступлений и митингов, лозунгов. Это позволяет проанализировать ключевые требования жителей, сравнить их с наиболее острой повесткой онлайн-дискуссий, выявить тенденции. Также проводятся исследования в области филантропии и благотворительности. Например, изучается феномен онлайн-благотворительности, когда люди делают взносы с помощью онлайн-инструментов. «Некоторые наши исследования касаются и прикладных аспектов, таких, как изучение роли мобильных гаджетов в повседневной жизни горожанина, формирование так называемого «планшетного этикета», сетей неэкономического обмена и даже феномена лайка», – говорит Иван Климов.
Все эти и другие проекты предполагают исследование огромного количества данных, их систематизацию, единовременное проведение вычислений. В решении задач молодым ученым помогла платформа Microsoft Azure, предоставленная бесплатно в качестве гранта Microsoft Research. «Цель программы грантовой поддержки – дать ученым различных отраслей, использующим в работе анализ больших данных, возможность расширить зону работы и ускорить получение результата с использованием мощностей Azure, – пояснил Дмитрий Халин, директор департамента технологической политики Microsoft в России. – Таким образом, Microsoft меняет способ взаимодействия человека с технологиями, предлагая смелые и оригинальные подходы к ИТ».
Исследовательская группа МГУ, специализирующаяся на Data Mining интеллектуальном анализе данных, собирается использовать облачную инфраструктуру от Microsoft в ряде проектов и направлений своей работы. «Круг интересов нашей лаборатории сосредоточен на применении методов машинного обучения в решении наиболее актуальных сегодня прикладных задач. В качестве примера можно привести широкий спектр задач в области компьютерной безопасности: раннее обнаружение компьютерных вторжений в корпоративную сеть или, к примеру, поведенческая мобильная аутентификация пользователя, предполагающая анализ информации, поступающей с датчиков мобильных устройств (например, акселерометра, гироскопа), вместо привычных, но не всегда надежных и безопасных паролей», – поясняет Сергей Герасимов, сотрудник Лаборатории технологий программирования МГУ.
«Преимущество платформы Microsoft Azure для наших исследований заключается в том, что она позволяет не только хранить большие объемы данных, но и параллельно исполнять сотни процедур обработки информации, что является критически важным для многих задач машинного обучения, например, при оценке характеристик моделей или тонком тьюнинге их параметров, – объясняет Сергей Герасимов. – В настоящее время мы работаем над целым комплексом проектов в области больших данных и машинного обучения, развивать которые стало намного проще благодаря инфраструктуре Microsoft Azure».
Другой сферой интересов лаборатории МГУ в рамках машинного обучения, требующей значительных вычислительных мощностей, является текстовая аналитика (Text Mining). Один из исследовательских проектов был направлен на создание метода объективной оценки качества и профессионального уровня научных материалов (статей, диссертаций и т.д.). Он сочетает глубокий семантический анализ текста, библиографический анализ, проверку на плагиат, возможность интеграции экспертного знания в процесс принятия решения. «На сегодняшний день значительная часть задач Data Mining сопряжена с анализом содержимого (документов, веб-сайтов), либо поведения пользователей и систем. Подобные задачи требуют надежной и производительной системы хранения и параллельной обработки данных», – подытожил Сергей Герасимов.
Программа Azure for Research реализуется с 2013 года. За это время облачные гранты получили 4 группы исследователей из России. Участниками конкурса могут стать ученые, которые работают над социально-значимыми проектами в информатике, физике, химии, медицине, геологии, экологии, геномике и других фундаментальных дисциплинах. Победители получают возможность бесплатно использовать возможности Windows Azure в течение года. Подробная информация о программе Windows Azure for Research представлена на сайте http://research.microsoft.com/en-us/projects/azure/. Отправить заявку можно на сайте http://www.windowsazurepass.com/research. Название файла с текстом заявки должно начинаться с букв RUS (чтобы проекты могли участвовать в конкурсе заявок из России). Вопросы по конкурсу Azure for Research можно направлять Елена Павловой v–elpavl@microsoft.com.