GermTracker: как предсказать болезнь по вашим твитам | Наука 21 век

Наука 21 век » GermTracker: как предсказать болезнь по вашим твитам





GermTracker: как предсказать болезнь по вашим твитам

Февраль 12th, 2013

GermTracker: как предсказать болезнь по вашим твитамНовая программа с вероятностью в 91% предскажет, заболеете ли вы на следующей неделе, анализируя исключительно ваши твиты. GermTracker находит корреляции между стилем жизни и личными качествами людей – и вероятностью заболеть. Пользователям не нужно заполнять никаких анкет, и даже знать, что они участвуют в исследовании, сообщает TechNewsDaily

GermTracker: как предсказать болезнь по вашим твитамПрограмму еще в прошлом году написали Адам Садилек (Adam Sadilek) и Генри Кауц (Henry Kautz), специалисты по информационным технологиям из Рочестерского университета (штат Нью-Йорк). С тех пор они добавили в систему новые параметры: популярность автора в Твиттере, качество жизни и социально-экономический статус места жительства. Ученые представили свои выкладки восьмого февраля на конференции Ассоциации вычислительной техники

«Если вы хотите узнать, сколько людей болеет в том или ином регионе, необходимо долгое и дорогостоящее обследование населения. Твиттер и наши разработки позволяют делать это быстро, недорого и без участия людей», - заявил Садилек. В будущем GermTracker может дополнить традиционные методы отслеживания эпидемий гриппа (например, подсчеты Центров по контролю и профилактики заболеваний США). Также программу можно будет перенастроить и использовать в коммерческих целях – для прогнозов предпочтений и поведения клиентов, говорится на сайте GermTracker.

В последние годы ученые поняли, что данные с личных медиа (блоги, Твитте и т.д.) очень много могут сказать о здоровье людей. Flu Trends от Google подсчитывает число заболевших по всей планете на основе поисковых запросов из слов, связанных с гриппом. Некоторые группы исследователей определяют вспышки и тенденции развития эпидемий с помощью Твиттера.

GermTracker уникален тем, насколько подробно он анализирует частную жизнь людей. Программа рассматривает 70 факторов (разные привычки и личные свойства), и смотрит, какие из них больше коррелируют со случаями заболевания. Было обследовано 6237 жителей Нью-Йорка. Чтобы понять, кто сейчас болен, программа автоматически читает твиты. Она не просто ищет ключевые слова: GermTracker способен отличить релевантные фразы (например, «Я заболел и всё время чихаю») от нерелевантных («Чихать я хотел на ваши претензии!»).

Данные о местоположении, имеющиеся в твитах, показывают, какие места люди посещали, когда они ездили в метро и насколько часто они встречали больных пользователей Твиттера. Оказалось, что поклонники фитнеса болеют чаще, а те, кто все время рассказывает, как они пойдут в спортзал, но никогда туда не доходят – еще чаще. Программа также соотнесла частоту заболеваний и популярность авторов твитов. Также Садилек и Кауц наложили карту твитов на карту загрязненности городской среды Нью-Йорка: как и ожидалось, те, кто живет рядом с источниками загрязнения, болеет чаще.

У программы есть существенные ограничения. Во-первых, пользователи Твиттера не дают репрезентативную выборку населения: молодежь и представители меньшинств более активно пользуются этой программой, так что модель распространения заболеваний, построенная на основе твитов, больше отражает происходящее с этими группами, чем со всем населением.

Во-вторых, одно дело – заболеть, и другое – написать в Твиттере, что заболел. Некоторые люди никогда не напишут, что они заболели, а другие, наоборот, преувеличивают свои заболевания. Тем не менее, GermTracker может стать важным дополнением к другим компьютерным моделям и исследованиям, которые ищут значимые факторы, влияющие на то, когда и почему люди болеют. Садилек и Кауц собираются изучать возможности Твиттера в изучении медицинских проблем совместно с университетским медцентром.

Артём Космарский nauka21vek.ru