Hedonometer - программа для измерения счастья населения по твитам
Возможно ли измерить, насколько человек счастлив, по данным, которые он вывешивает в Интернете? Да – уверены разработчики «Гедонометра», программы, измеряющей счастье в реальном времени. Пока программа работает только с твитами (Twitter) на английском языке, но Питер Доддс(Peter Dodds) и Крис Дэнфорт (Chris Danforth), сотрудники фирмы Computational Story Lab (штат Вермонт, США) в ближайшем будущем собираются добавить еще с десяток языков, возможность сбора данных с других социальных сетей, а также открытый API. В проекте также использована технология, разработанная Брайнаом Тивнэном (Brian Tivnan), Мэттом МакМахоном (Matt McMahon) и их коллегами из фирмы MITRE Corporation.
Чтобы представить в количественной форме выражение счастья в языке, «Гедонометр» обработал и ранжировал примерно 10,000 слов по шкале от «грустного» (1 балл) к «счастливому» (10 баллов). Это ранжирование было осуществлено благодаря сервису Mechanical Turk от Amazon – краудсорсинговой платформе, позволяющей привлечь людей для помощи программистам в решении задач, с которыми искусственный интеллект не справляется.
Сейчас «Гедонометр» работает с фидом Twitter под названием Gardenhose – случайной выборкой 50 миллионов твитов (это 10% от всего количество). В день это дает около ста гигабайт по стандарту JSON (текстовый формат обмена данными, основанный на JavaScript). Каждый день около 100 миллионов слов группируются «Гедонометром», который присваивает твитам балл по своей шкале «счастья».
«Гедонометр» использует технику, которая позволяет выяснить сравнительный «вес» наиболее эмоциональных слов: более нейтральные слова не учитываются при определении того, насколько «счастливым» для населения был тот или иной день. Программа также убирает слова, относительно ранга которых у людей из Mechanical Turk были сомнения, т.е. двусмысленные понятия.
Хотя такое «измерение счастья» может показаться чем-то пафосным, но тривиальным, Дэнфорт подчеркивает одну важную цель их проекта. «Мы стремились предоставить альтернативный способ измерять уровень благополучия населения, в дополнение к классическим индикаторам – ВВП и индекс потребительского доверия. Наша программа не стремится отразить эмоциональное состояние конкретных людей, а скорее стать термометром для настроения больших групп населения».
В посте на сайте OneHappyBird разработчики сообщили, что уровень нашего счастья взлетает утром (несомненно, под воздействием большого количества выпитого кофе), и по ходу дня снижается. Аналогично, к вечеру растет ворчливость и употребление бранных слов. Также средние показатели счастья вырастают, когда человек пишет твиты вдали от дома.
По материалам Gizmag.
Артём Космарский nauka21vek.ru