Новая программа оценит риск отравления в ресторане по твитам посетителей | Наука 21 век

Наука 21 век » Новая программа оценит риск отравления в ресторане по твитам посетителей





Новая программа оценит риск отравления в ресторане по твитам посетителей

Август 8th, 2013

Новая программа оценит риск отравления в ресторане по твитам посетителейНовая система оценит риск отравления в кафе или ресторане, куда вы хотите пойти – на основе анализа твитов других посетителей. По мнению разработчиков из Рочестерского университета (штат Нью-Йорк), система nEmesis дополнит традиционные методы оценки санитарно-гигиенических условий (а именно визиты саниспекторов).

Новая программа оценит риск отравления в ресторане по твитам посетителейС помощью машинного обучения и краудсорсинга nEmesis просматривает миллионы твитов на предмет симптомов пищевого отравления после посещения ресторана. Понятно, что такое количество данных невозможно проанализировать вручную. За четыре месяца работы система собрала 3,8 миллиона твитов 94000 уникальных пользователей (жителей Нью-Йорка), нашла 24000 посетителей ресторанов и в их твитах определила 480, говорящих об отравлениях. Полученные данные (об «опасных» ресторанах) неплохо коррелируют с теми, что представил Департамент здравоохранения Нью-Йорка.

Алгоритм работы nEmesis таков: система соотносит источник твита (откуда он был написан) со местоположением ресторанов. Если твит «пришел» с места, которое определено как ресторан (по списку из 24904 заведений, осмотренных нью-йоркскими санинспекторами), система будет следить за всеми твитами этого пользователя в течении 72 часов. Если он напишет в Twitter о том, что плохо себя чувствует, система «проведет расследование».

Но как научить систему понимать, что в твите говорится именно о пищевом отравлении? Адам Садилек (Adam Sadilek) и Генри Кауц, (Henry Kautz) авторы разработки, раньше уже использовали Twitter для анализа распространения эпидемии гриппа: программа GermTracker оценивала вероятность того, что человек заболеет, по различной информации из его твитов. Садилек разработал ядро системы: алгоритм, различающий, болен ли автор твита, или здоров. Система сама учится различать – работает машинное обучение. Как выразился Садилек, «это как учить ребенка говорить».

В nEmesis используется еще и краутсорсинг: сотни работников Mechanical Turk помогают компьютеру учиться распознаванию. Люди отбирали твиты, подходящие по содержанию – чтобы система поняла, что именно в твитах может указывать на пищевое отравление.

Конечно, пользователи Twitter – это ни в коем случае не репрезентативная выборка всего населения города, и даже всех посетителей ресторана. Но данные nEmesis могут дополнить другие – те же отчеты Департамента здравоохранения. Она дает дополнительный уровень очень дешевого «фонового» мониторинга в реальном времени (в отличие от инспекторов, которые приходят и уходят).

В команду разработчиков nEmesis также входят Шон Бреннан (аспирант университета) и Винсент Силенцио (адъюнкт-профессор психиатрии).

По материалам пресс-релиза университета.

Артём Космарский nauka21vek.ru