Разработан алгоритм автоматизированного анализа и оценки научных статей | Наука 21 век

Наука 21 век » Разработан алгоритм автоматизированного анализа и оценки научных статей





Разработан алгоритм автоматизированного анализа и оценки научных статей

Апрель 19th, 2013

Разработан алгоритм автоматизированного анализа и оценки научных статейУченые из Университета штата Северная Каролина разработали компьютерную программу, способную прочитывать и оценивать массив научной литературы по любому вопросу, сообщает UPI. Когда каждый день публикуется несколько сот или даже тысяч научных статей, следить за состоянием дел в любой области исследований становится всё сложнее. Новый алгоритм интеллектуального анализа текста позволил выделить наиболее важные публикации в массиве – для включения в базу данных научной литературы, посвященной влияние химикатов на генетику и здоровье человека.

Разработан алгоритм автоматизированного анализа и оценки научных статей«Только о токсичности тяжелых металлов написано более 33 тысяч статей, начиная с 1926 года. Мы просто не имеем возможности прочитать и прокодировать [по ключевым темам и понятиям] все из них. А с помощью нового алгоритма нам и не надо это делать», - рассказывает Аллен Питер Дэвис (Allan Peter Davis), руководитель проекта создания базы данных сравнительной токсикогеномики.

Сложный алгоритм оценивает текст работы и присваивает каждому документу свой показатель на шкале релевантности. «Эта шкала помогает, так сказать, отделить зерна от плевел», - рассказывает Томас Вигерс (Thomas Wiegers), специалист по биоинформатике. Ученые обработали таким образом 15000 статей, а затем сравнили выборку из них с теми статьями, которые «вручную» были прочтены и оценены.

«Результаты нас впечатлили. В 85% случаев оценка читателей совпала с оценкой программы. Теперь мы поможем более эффективно тратить наше время, читая только наиболее информативные работы», - говорит Дэвис. 

Артём Космарский nauka21vek.ru