Компьютерная программа узнает «обо всем», анализируя картинки | Наука 21 век

Наука 21 век » Компьютерная программа узнает «обо всем», анализируя картинки





Компьютерная программа узнает «обо всем», анализируя картинки

Июнь 16th, 2014

Компьютерная программа узнает «обо всем», анализируя картинкиКомпьютерная программа привносит новый оттенок в значение идиомы «лучше один раз увидеть, чем сто раз услышать», благодаря умению распознавать связь контекста с изображениями в Интернете. Программисты из Вашингтонского университета и Университета искусственного интеллекта имени Аллена (США) создали полностью автоматизированную компьютерную программу, которая, по их словам, «учит все обо всем». Это хвастливое заявление также служит названием для программы - англ. «learn everything about anything», или сокращенно «LEVAN». 

Компьютерная программа узнает «обо всем», анализируя картинки

Используя предварительно разработанное распознавание картинок, программа может провести тщательный анализ миллионов и миллионов изображений, найденных в Интернете, даже тех, которые не имеют четкой связи со словом или фразой. Затем она сужает отобранные изображения, разбивая их по категориям и соотнося с новыми словосочетаниями. 

«Это все посвящено выявлению связей между текстовыми и визуальными данными, - говорит Али Фархади (Ali Farhadi), ассистент профессора по вычислительным наукам и технике. – Программа учится тесно связывать большой набор фраз с пикселями изображений. Это означает, что она может распознавать варианты конкретных понятий, когда встречается с ними». 

В настоящее время в программе содержится 161 главных понятий, которые перечислены на официальном сайте, в том числе более 65 000 подкатегорий и около 50 миллионов обработанных картинок. 

И это еще начало. Программа обучается по сделанным поискам, соединяя понятия с новыми категориями и даже формулируя новые понятия, пока она «учится», согласно научной статье, которую разработчики представят на ежегодной конференции Computer Vision and Pattern Recognition в Колумбусе (США) в конце этого месяца. 

Однако, на самом деле, LEVAN не «учит все», как заявлено в ее названии. Видео (ниже), которое представляет программу LEVAN миру, кратко показывает, как она работает с использованным в качестве примера словом «танец» (англ. «dance»). Прямо как Google images (и без всяких сомнений, картинки были взяты именно из Google), LEVAN нашла огромное количество разных видов танцев, включая «вальс» (форма танца) и «последний танец» (известный концепт во многих культурах).

И именно здесь и возникают сложности. В ходе анализа фотографий, связанных с термином «вальс», программа быстро распознала похожие комбинации объектов и форму среди миллионов картинок, позволив сделать вывод о том, что вальс – это подкатегория танцев. Однако, при анализе более туманного концепта «последний танец» программа выдала значительно более разнообразный набор изображений. LEVAN отфильтрует этот концепт, так как для него нет единого значения, по крайней мере, визуального. 

Однако, то, что «последний танец» не является реальным понятием, потому что не может быть представлен визуально, может послужить отговоркой против нападок некоторых критиков. 

Вы можете сами попробовать поработать с программой LEVAN на официальном сайте и увидеть, чему она научилась. 

По материалам Nature World News.

Анастасия Полянская nauka21vek.ru







Повышение квалификации. Основы интеллектуальной собственности