Идея упростить систему поиска изображений и видеороликов всегда лежала на поверхности - кому не приходилось блуждать по Сети в попытке разыскать нужное и не находить его. Проблема кроется в принципе индексации ресурсов и материалов, которая понимает текстовое описание объектов, но не обладает способностью человека различать их визуально.
Если мы ищем "дом", то передаем именно это слово поисковому сервису. Он просматривает свои базы индексации и находит все изображения (или видео), которые или имеют это слово в заголовке, или же содержат метакомментарий с употреблением этого слова. На основании такого анализа сервер формирует ответ на запрос, куда не попадают многие результаты, не удовлетворяющие эти условиям. Фактически отсутствие названия и комментария делает объект невидимым для поисковиков.
За последние годы было предпринято множество попыток научить компьютер различать изображение и кадры видеоматериалов подобно тому, как это делает человеческий глаз. Но в силу ограничений машинной логики, эти проекты чаще всего заканчивались ничем и мало способствовали решению проблемы.
Для стимуляции разработки подобного алгоритма был организован международный конкурс, в котором приняли участие шестьдесят команд из разных стран. Одними из трех победителей стали исследователи из Университета Амстердама, которые предложили поисковую систему, которая сама может находить в картинках и видео так называемые "концепции".
К "концепциям" могут относиться изображения людей, домашних животных, технических средств, а также события - демонстрации, пожары, боевые действия. Написанная голландцами программа может различать эти образы на предоставленном для анализа материале, а также способна к обучению - она извлекает уроки из правильно и неправильно сделанных распознаний.
Став победителями, ученые из Нидерландов получили крупный грант на продолжение разработки. В ближайшее время они должны протестировать и подготовить к массовой эксплуатации свое детище.
Руководитель группы разработчиков Тео Жеверс уверяет, что они не только справятся с этой задачей, но и внесут в финальную версию несколько усовершенствований.
Подобные системы интеллектуального поиска - вовсе не излишество. По оценкам различных исследователей, объем изображений и видеоматериалов в интернете, выпадающих из поля зрения поисковых машин, составляет 40-60 процентов от общего объема.
Особенно остро эта проблема стоит в социальных сетях, где пользователи просто ленятся задать осмысленный заголовок или снабдить загружаемый файл развернутым метакомментарием, описывающим его содержимое.
Тео Жеверс считает, что будущее именно за такими системами, умеющими самостоятельно анализировать предметы поиска. С его слов, уже к 2012 году поиск видео и картинок перестанет быть таким бесплодным и начнет радовать пользователей своими результатами.