Мастер ИИ из Google представляет новый вираж нейронных сетей

ЕСЛИ ВЫ ХОТИТЕ обвинить кого-то в шумихе вокруг искусственного интеллекта, 69-летний исследователь Google Джефф Хинтон - хороший кандидат.

GeoffHinton-TA-h_14977198.jpg
© AARON VINCENT ELKAIM/REDUX

В октябре 2012 года веселый профессор университета Торонто "встряхнул" свое поприще новой "траекторией", сообщает wired. С двумя своими аспирантами Хинтон показал, что немодная технология, которую он отстаивал десятилетиями, и которая называлась искусственными нейронными сетями, позволила совершить огромный скачок в способности машин понимать изображения. Спустя шесть месяцев все три исследователя находились в платежной ведомости Google. Сегодня нейронные сети транскрибируют нашу речь, узнают наших питомцев и сражаются с нашими троллями.

Но Хинтон теперь преуменьшает технологию, которую он помог принести миру. “Я думаю способ, которым мы делаем машинное зрение, просто неправильный”, говорит он. “Он работает лучше, чем что-либо еще в настоящее время, но это не означает, что он верный”.

В этом месте Хинтон представил другую “старую” идею, которая может трансформировать компьютер и изменить ИИ. Это важно, потому что компьютерное зрение имеет решающее значение для таких идей, как автономные автомобили и наличие программного обеспечения, которое играет роль врача.

В конце прошлой недели Хинтон опубликовал две исследовательские статьи, доказывающие, по его словам, идею, которую он обдумывал почти 40 лет. "Это имело очень много интуитивного смысла для меня в течение очень долгого времени, но концепция просто не сработала", - говорит ученый. "У нас наконец-то есть нечто, что работает хорошо".

Новый подход Хинтона, известный как капсульные сети, представляет собой поворот в нейронных сетях, которые предназначены заставить машины лучше понимать мир через изображения или видео. В одной из статей, опубликованных на прошлой неделе, капсульные сети Хинтона показали соответствие точности лучших предыдущих методов программного обеспечения, на стандартном тесте распознавания рукописных цифр.

Во втором случае, капсульные сети почти вдвое сократили максимальную частоту ошибок при тестировании, бросая вызов программному обеспечению в распознавании игрушек, таких как грузовики и автомобили с разных сторон. Хинтон работает над своей новой техникой с двумя коллегами в офисе Google в Торонто.

Капсульные сети направлены на устранение слабости современных систем машинного обучения, которые ограничивают их эффективность. Программное обеспечение для распознавания изображений, которое сегодня используется Google и другими, требует большого количества примеров фотографий, чтобы научиться надежно распознавать объекты во всех ситуациях. Это связано с тем, что программное обеспечение не очень хорошо обобщает то, что изучает в новых сценариях, как например, понимание того, что объект является одним и тем же, если смотреть на него с новой точки зрения.

Например, чтобы научить компьютер распознавать кошку под разными углами, может потребоваться тысячи фотографий, охватывающих множество разных точек видения. Человеческие дети не нуждаются в такой явной и обширной подготовке, чтобы научиться распознавать домашнее животное.

Идея Хинтона уменьшить пропасть между лучшими системами ИИ и обычными малышами состоит в том, чтобы создать немного больше знаний о мире в программном обеспечении компьютерного зрения. Капсулы - небольшие группы "голых" виртуальных нейронов - предназначены для отслеживания различных частей объекта, таких как нос и уши кошки, и их относительного положения в пространстве. Сеть из многих капсул может использовать эту осведомленность, чтобы понять, когда новая сцена является на самом деле другой точкой зрения на то, что она видела раньше.

Хинтон сформировал свою интуитивную идею, что системы видения нуждаются в таком встроенном смысле геометрии в 1979 году, когда он пытался понять, как люди используют ментальные образы. Сначала он изложил предварительный проект для капсульных сетей в 2011 году. Более полную картину, опубликованную на прошлой неделе, долго ожидали исследователи в этой области. "Все ждали его и следили за следующим большим скачком от Джеффа", - говорит Кюнгюн Чо, профессор NYU, который работает над распознаванием образов.

Слишком рано говорить, насколько большой прыжок Хинтон сделал - и он это знает. Ветеран ИИ отчаянно отмечает, что его интуиция теперь подтверждается доказательствами, объясняя, что капсульные сети по-прежнему необходимо проверять на больших коллекциях изображений и что текущая реализация медленна по сравнению с существующим программным обеспечением для распознавания образов.

Хинтон с оптимизмом смотрит на эти недостатки. Другие в этой области также надеются на его долговременную идею.

Роланд Мемесивич, соучредитель стартапа распознавания образов «Двадцать миллиардов нейронов» и профессор Монреальского университета, говорит, что базовая конструкция Хинтона должна быть способной извлечь больше понимания из определенного объема данных, чем существующие системы. Если это будет доказано в масштабе, технология может быть полезной в таких областях, как здравоохранение, где данные об изображении для обучения систем искусственного интеллекта намного меньше, чем большой объем селфи, доступных в Интернете.

В некотором роде, капсульные сети - это отход от недавней тенденции в исследовании ИИ. Одна из интерпретаций недавних успехов нейронных сетей заключается в том, что люди должны кодировать как можно меньше объема знаний в программное обеспечение ИИ, а вместо этого заставлять их расчитывать на себя с нуля. Гэри Маркус, профессор психологии в Нью-Йоркском университете, который продал стартап ИИ в Uber в прошлом году, говорит, что последняя работа Хинтона представляет собой "желанный глоток свежего воздуха". Маркус утверждает, что исследователи ИИ должны делать больше, чтобы имитировать то, как мозг применяет встроенный, врожденный механизм для изучения важных навыков, таких как видение и язык. "Еще слишком рано говорить, как далеко продвинется эта конкретная архитектура, но здорово видеть, как Хинтон вырвался из колеи, в которой индустрия ИИ, похоже, застряла", - говорит Маркус.

новостинаукапрограммированиеапвот50-50технологииpskмысличеловекблоги
189
2.933 GOLOS
0
В избранное
vako
Однажды, в далекой-далекой галактике... мы наваливаем бас - копы так не любят нас )))
189
0
Комментарии (2)
Сортировать по:
Популярности
Зарегистрируйтесь, чтобы проголосовать за пост или написать комментарий
Авторы получают вознаграждение, когда пользователи голосуют за их посты. Голосующие читатели также получают вознаграждение за свои голоса.