Джошуа Беньо об интеллекте
Разговор с пионером в сфере искусственного интеллекта
Когда в январе Microsoft приобрела стартап Maluuba, специализирующийся на глубинном обучении, признанный эксперт и консультант компании Maluuba, пионер в сфере глубинного обучения Джошуа Беньо согласился продолжать консультировать Microsoft по вопросам искусственного интеллекта. Беньо, глава Монреальского института алгоритмов обучения, недавно посетил комплекс Microsoft в Редмонде (штат Вашингтон) и согласился с нами пообщаться.
Начнем с основ: что такое глубинное обучение?
Глубинное обучение – один из подходов к машинному обучению, а машинное обучение – это способ создания искусственного интеллекта, когда компьютеры на примерах познают мир вокруг нас или некоторые его аспекты.
Глубинное обучение выделяется из всех других методов машинного обучения тем, что оно создано на основе некоторых наших знаний о мозге. С помощью него компьютеры обучаются нескольким уровням абстракции и представления, что, вероятно, и делает эти системы такими успешными.
Вы можете привести примеры того, как люди используют глубинное обучение?
Самый распространенный способ использования глубинного обучения называется «контролируемое обучение» – это когда мы даем компьютеру множество примеров того, что он должен делать, в различных контекстах. В частности, мы предлагаем миллионы примеров того, как разные люди произносят предложения, и также даем транскрипцию предложения, чтобы компьютер переходил от звуков к словам. Так что компьютер получает те же данные, что и в реальном мире, изучает то, что с ними делает человек, и имитирует действия человека, обучаясь на огромном количестве примеров выполнения одной и той же задачи.
Технология глубинного обучения существует на протяжении десятилетий. Можете рассказать, как шел процесс от ее зарождения до повсеместного использования сегодня?
По-настоящему задумываться об ИИ люди стали в конце 1950-х годов. Решили, что стоит посмотреть, что происходит в мозге, найти какие-то подсказки, чтобы создать более «умные» машины. Но потом все это сошло на нет. Следующая волна возникла в начале восьмидесятых и завершилась в начале девяностых, но и она закончилась ничем, потому что технологии не сработали так, как надеялись люди. И теперь наступила третья волна развития глубинного обучения. Примерно пять лет назад у нас началась пора удивительных достижений в работе над приложениями для распознавания речи и объектов, а теперь, совсем недавно, – и в использовании естественного языка, в частности, в приложениях для машинного перевода.
Для вас, как для эксперта в глубинном обучении, какая работа кажется сегодня самой значимой?
Сейчас больше всего меня радует прогресс, которого мы достигли в так называемом «контролируемом обучении». Пока что в этой области уровень машинного и глубинного обучения несколько ниже того, что могут люди. Двухлетний ребенок может учиться, просто наблюдая и взаимодействуя с миром. Например, он может понимать физику, не обучаясь ей, и на практике узнавать о законах гравитации, давлении и многих других, просто играя и наблюдая. Это неконтролируемое обучение. Мы пока далеки от таких возможностей, но, к счастью, мы достигли существенного прогресса в этом направлении. И это очень важно, потому что для того, чтобы машины выходили за рамки ограниченного набора задач, которые они сегодня могут решать, нам понадобятся возможности неконтролируемого обучения.
Мы в Microsoft много говорим о том, как искусственный интеллект может дополнять наш опыт и помогать в решении задач. Каковы самые многообещающие возможности, которые вы предвидите в будущем, какую работу ИИ сможет выполнять?
Самым полезным будет то, что с развитием ИИ компьютеры научатся общаться с нами на более естественном языке. Случается, что при работе за компьютером нам бывает сложно сообщить или найти необходимую информацию. Использование естественного языка поможет сделать компьютеры гораздо более доступными для множества людей, не разбирающихся в программировании. Кроме того, сама идея, что компьютер вообще-то понимает наши потребности и наши вопросы, может найти информацию, а также размышлять и помогать нам в работе, звучит многообещающе.
Я хочу вернуться к ранее сказанным вами словам о том, что в основе технологии глубинного обучения лежит знание закономерностей работы мозга. Почему технология построения глубоких нейронных сетей основывается на понимании работы мозга и как это влияет на их потенциал?
С самых первых дней существования глубоких нейронных сетей возникла идея, что вычисления, совершаемые в мозге, могут быть разложены на очень простые математические операции, выполняемые каждым мозговым нейроном в отдельности. И что нейронные сети объединяют все эти маленькие операции вместе, но каждое вычисление, совершаемое нейроном, может быть изменено или адаптировано. Мы обучаемся благодаря таким изменениям синапсов в нашем мозге. Оказалось, этот стиль машинного обучения, когда компьютер учится соединению множества элементов вместе, обладает огромным потенциалом.
Как далеко мы продвинулись в понимании принципов работы мозга?
Мозг по-прежнему является настоящей загадкой. Представьте, что это большой пазл. У нас есть множество отдельных элементов, и десятки тысяч ученых во всем мире изучают эти элементы, но целостной картины пока не сложилось.
Я, как и многие другие люди, верю и надеюсь, что прогресс, которого мы достигли в глубинном обучении, поможет нам открыть эту целостную картину. Конечно, мы этого не знаем наверняка, но сейчас в научном сообществе многие с энтузиазмом говорят об соединении математических познаний в машинном и глубинном обучении с данными нейробиологии для лучшего понимания работы мозга. И конечно, мы надеемся, что развитие пойдет также и в других направлениях, потому что сегодня глубинное обучение пока абсолютно не достигает уровня человеческого интеллекта. Человеческий мозг способен делать те вещи, которые не под силу машинам, но, возможно, нам удастся узнать, как мозг это делает, и, основываясь на этих знаниях, построить более совершенные системы глубинного обучения.
Мы слышим много рассуждений о том, что может делать искусственный интеллект. Скажите, насколько мы близки к созданию искусственного интеллекта или технологий глубинного обучения, которые могут имитировать то, как думают и действуют люди?
Мне часто задают такие вопросы, и я всегда отвечаю: «Я не знаю». И я думаю, что ни один серьезный ученый не должен давать на такой вопрос прямого ответа, ведь здесь слишком много неизвестных. В сущности, мы занимаемся исследованиями в этой области, потому что не понимаем, как решить целый ряд проблем. Мы видим определенный прогресс. Мы можем догадываться, что движемся в правильном направлении. Но сколько времени займет решение самых сложных проблем абстрактного понимания, например? На этот вопрос невозможно ответить. Понадобится пять лет? Пятнадцать? Пятьдесят? Прямо сейчас мы видим некоторые препятствия и думаем, что можем с ними справиться. Но, возможно, за этой горной цепью скрывается новая гора.
Вы могли бы рассказать о том, как глубинное обучение может использоваться там, где люди уже применяют искусственный интеллект?
Технология глубинного обучения меняет взгляд на ИИ, доминировавший в последние несколько десятилетий. Она берет отдельные идеи из более традиционных подходов к ИИ и интегрирует их, и в итоге получаются хорошие идеи. Возможно, самый известный пример – это сплав глубинного и стимулированного обучения.
Стимулированное обучение – это вид машинного обучения, при котором обучающийся не узнает, что человек сделал бы в этой ситуации. Обучающийся может видеть, хороши действия или плохи, только после завершения длительной последовательности. Эта технология в последнее время достаточно успешно применяется в играх. Кроме того, очень вероятно, что стимулированное обучение станет важным, например, для развития беспилотных автомобилей.