Группа ученых из научно-исследовательского центра Fujitsu в Китае создала программу для решения университетских тестовых заданий по мировой истории. Новое приложение сопоставляет тексты заданий и вариантов ответа с содержанием похожих статей на Википедии, после чего выдает наиболее совпадающий вариант. В качестве теста в реальном задании авторам удалось набрать 37% правильных ответов, что превышает 25% для «метода тыка», но все еще далеко от идеала. Препринт описанной работы выложен на сайте arxiv.org.
В качестве основного источника информации авторы использовали архив статей en.wikipedia.org. Задания, которые решались в этой работе, были построены по следующей схеме: целевой текст (Т) -> вопрос по нему (Q) -> варианты ответа (Ci, i=1,2,3,4). Для каждой тройки объектов {T,Q,C} составлялся полный список заголовков Википедии, входящих в текст каждого из них. Далее рассчитывалась степень совпадения заголовков в тексте (Т) и вопросе (Q) с каждым из вариантов ответа (Ci).
Чем больше совпадали заголовки, входящие в целевой текст и вопрос, с данным вариантом ответа, тем большая значимость ему присваивалась. Кроме того, учитывалось, насколько заголовки пересекались между собой, то есть количество ссылок друг на друга в текстах соответствующих статей Википедии.
Классификацию ответов проводили при помощи 11 стандартных обучающих алгоритмов (AdaBoost, Random Forest, Logistic Model Trees и другие), окончательное решение вычислялось как среднее по 11 алгоритмам.
В качестве тестового задания авторы взяли вступительный экзамен «B» по мировой истории, проводившийся в 2007 году в Японии. Программе удалось набрать 37 баллов из 100. Она относительно хорошо справилась с заданиями, где нужно было выбрать правильный ответ из четырех предложенных (результативность 45%), но провалила более сложные задания другого формата (в некоторых блоках результативность была нулевой).
В итоге авторы отмечают, что результат их программы оказался выше, чем случайный (37% против 25%), однако о широком использовании такого софта думать еще рано. Ученые называют ряд улучшений, которые они собираются внести в алгоритм в будущем, и планируют продолжать заниматься этой тематикой.
Об области применения подобных программ авторы не говорят напрямую, но отмечают, что «решение тестов из школьных экзаменов в реальной жизни — это важная и полезная область приложения QA-систем (систем, отвечающих на вопросы — прим. N + 1)».
Как развитие технологий позволило нащупать «топологическое решение» загадки шизофрении
Шизофрения — одна из самых загадочных и сложных болезней человека. Уже более ста лет ученые пытаются понять причины ее возникновения и найти ключ к терапии. Пока эти усилия не слишком успешны: до сих пор нет ни препаратов, которые могли ли бы ее по-настоящему лечить, ни даже твердого понимания того, какие молекулярные и клеточные механизмы ведут к ее развитию. О том, как ученые бьются с «загадкой шизофрении» мы уже неоднократно писали: сначала с точки зрения истории психиатрии, затем с позиции классической генетики (читателю, который действительно хочет вникнуть в суть проблемы, будет очень полезно сначала прочитать хотя бы последний текст). На этот раз наш рассказ будет посвящен новым молекулярно-биологическим методам исследования, которые появились в распоряжении ученых буквально в последние несколько лет. Несмотря на сырость методик и предварительность результатов, уже сейчас с их помощью получены важнейшие данные, впервые раскрывающие механизм шизофрении на молекулярном уровне.