Американские исследователи, работающие по заказу министерства обороны США, предложили использовать машинное обучение для выявления среди служащих Армии США потенциальных военных преступников. Полученная система была опробована на обычных административных данных. Результаты исследования опубликованы в журнале Psychological Medicine. Оказалось, что система способна с возрастающей точностью прогнозировать склонность бойцов к тяжким преступлениям.
Для машинного обучения исследователи сначала использовали административные данные о 975 тысячах 57 солдатах, проходивших службу в Армии США в 2004-2009 годах. Из них 5771 человек в этот же период совершил то или иное тяжкое преступление: убийство, убийство по неосторожности, похищение, поджог при отягчающих обстоятельствах, нападение с отягчающими обстоятельствами, ограбление. Анализ проводился по сотням параметров, включая социо-демографические, судимости, употребление наркотиков, медицинское освидетельствование.
Ученые выделили набор факторов, который, по их мнению, может влиять на склонность к совершению преступления. Например, некоторые отклонения в поведении и прочее. Чтобы определить значимость этих факторов ученые использовали стандартные методы машинного обучения (например, регрессионный анализ). В результате получилась система, способная на основании статистических данных выделять потенциальных преступников.
Анализ и обучение проводились отдельно для преступлений, совершенных мужчинами и женщинами. В результате анализа, проведенного при помощи машинного обучения, оказалось, что 36,2 процента всех зарегистрированных преступлений, совершенных мужчинами, и 33,1 процента — женщинами, были в действительности совершены пятью процентами солдат, для которых была спрогнозирована высокая вероятность насилия. Площадь под кривой ошибок для этого анализа составила 0,80-0,82.
Затем в систему ввели административные данные о солдатах Армии США, проходивших службу в 2011-2013 годах. Для этого периода пять процентов солдат, отмеченных алгоритмом в качестве потенциальных преступников, в действительности совершили 50,5 процента всех зарегистрированных за этот период преступлений. В этом случае площадь под кривой ошибок составила 0,77. По данным исследователей, дальнейшее использование машинного обучения позволит повысить точность прогнозирования.
Исследования, направленные на изучение поведенческих, социальных, демографических и множества других особенностей, американских солдат проводятся ежегодно. Полученные данные систематизируются, а на их основе исследователи пытаются разработать способы прогнозирования потенциальных военных преступников еще до совершения ими тяжкого преступления. При этом ученые формируют рекомендации по предотвращению подобных преступлений.