Европейские и бразильские ученые визуализировали данные связанных с коррупцией политических скандалов, произошедших в Бразилии за 27 лет. Авторам работы, препринт которой доступен на arXiv, удалось не только выявить паттерны подобных скандалов в стране, но и предложить метод прогнозирования дальнейших подобных случаев.
По данным Всемирного банка, общий объем денежных средств, фигурирующих в коррупционных скандалах каждый год, превышает пять процентов мирового ВВП, при этом два процента (около полутора триллиона долларов) ежегодно тратится на взятки. Коррупция считается одним из важнейших факторов, сдерживающих экономический рост государства, и встречается во всех официальных институтах: образовании, здравоохранении, науке и политике.
Расследования коррупционных скандалов в основном заключаются в поиске вовлеченных лиц, расчете стоимости ущерба и оценке последствий для конкретного института. При этом данных, собранных за несколько лет, может быть достаточно для того, чтобы не только исследовать конкретные случаи коррупции, но и для анализа вероятности подобных случаев в будущем — вплоть до предсказания вовлечения конкретных людей. В своей работе ученые при участии Харольдо Рибейро (Haroldo Ribeiro) из Марингского государственного университета (Бразилия) проанализировали историю политических скандалов, связанных с коррупцией, произошедших в Бразилии в период с 1987 по 2014 год.
Для этого они использовали публично доступные в Википедии данные о широко известных бразильских политических скандалах. Проанализировав около 300 энциклопедических заметок, ученые составили список из 404 людей, участвовавших хотя бы в одном из 65 крупных скандалов, произошедших за изучаемый период. Как отмечают сами авторы, к собранным для анализа данных следует относиться с осторожностью, так как вина не всех фигурирующих лиц официально доказана, а некоторые из них могли избежать наказания, несмотря на причастность к коррупционным схемам.
Визуализация коррупционных связей представлена в качестве графа, в котором каждая вершина обозначает человека, а ребро — вовлеченность двух людей в один скандал (то есть, имена людей связаны, если их имена фигурируют вместе хотя бы в одном скандале).
Авторы отметили несколько типичных факторов, характеризующих политические скандалы страны: например, скандалы, фигурантами которых выступают более десяти человек, довольно редки (17 процентов всех рассмотренных случаев), и, в основном, количество участников одного дела — восемь человек. Интересно, что количество людей, вовлеченных в скандал, коррелирует (p < 0,0049) с временем: число фигурантов возрастает на 1,2±0,4 человека в период, близкий к президентским и парламентским выборам.
С практической точки зрения, построение подобных графов может быть полезно в плане расчета вероятности того, что те или иные фигуры одного коррупционного скандала появятся в следующем. Ученые предположили, что предсказать вовлеченность человека в группу, фигурирующую в будущем коррупционном скандале, можно благодаря анализу соседних вершин (людей) в графе: если у двух людей наибольшее количество «соседей», то они будут связаны с большей вероятностью. Исследователи попробовали этот способ для предсказания скандалов, случившихся с 2005 по 2013 год; результаты показали, что с помощью этого метода можно правильно определить около четверти фигурантов будущих дел.
Авторы, таким образом, показали, что с помощью визуализации данных о случаях коррупции в государстве можно не только эффективно исследовать поле, но также и предсказать возможные механизмы развития последующих случаев.
Современные технологии могут помочь не только в расследовании коррупции, но и в борьбе с ней: например, с помощью твиттер-ботов.
Елизавета Ивтушок