Разработан алгоритм автоматизированного анализа и оценки научных статей
Ученые из Университета штата Северная Каролина разработали компьютерную программу, способную прочитывать и оценивать массив научной литературы по любому вопросу, сообщает UPI. Когда каждый день публикуется несколько сот или даже тысяч научных статей, следить за состоянием дел в любой области исследований становится всё сложнее. Новый алгоритм интеллектуального анализа текста позволил выделить наиболее важные публикации в массиве – для включения в базу данных научной литературы, посвященной влияние химикатов на генетику и здоровье человека.
«Только о токсичности тяжелых металлов написано более 33 тысяч статей, начиная с 1926 года. Мы просто не имеем возможности прочитать и прокодировать [по ключевым темам и понятиям] все из них. А с помощью нового алгоритма нам и не надо это делать», - рассказывает Аллен Питер Дэвис (Allan Peter Davis), руководитель проекта создания базы данных сравнительной токсикогеномики.
Сложный алгоритм оценивает текст работы и присваивает каждому документу свой показатель на шкале релевантности. «Эта шкала помогает, так сказать, отделить зерна от плевел», - рассказывает Томас Вигерс (Thomas Wiegers), специалист по биоинформатике. Ученые обработали таким образом 15000 статей, а затем сравнили выборку из них с теми статьями, которые «вручную» были прочтены и оценены.
«Результаты нас впечатлили. В 85% случаев оценка читателей совпала с оценкой программы. Теперь мы поможем более эффективно тратить наше время, читая только наиболее информативные работы», - говорит Дэвис.
Артём Космарский nauka21vek.ru