Британские ученые выяснили, что динамика расположения команд в турнирных таблицах английских футбольных дивизионов подчиняется степенному закону. Для этого они использовали финальные и промежуточные результаты четырех высших лиг Англии за 1995–2017 года. По тому, какое место команда занимает после 10, 20 и 30 тура, можно с разной степенью уверенности предсказать, с какой вероятностью она станет победителем, пишут ученые в PLoS One.
Предсказание результатов футбольных матчей и турниров (и других спортивных состязаний) кажется не самой простой задачей: в основном потому, что существует очень много сторонних факторов, учесть реальную вероятность и вклад которых в качестве побочных переменных очень сложно. Такими факторами могут быть внезапные травмы, погода или непредсказуемые решения судей. Кроме того, сложно заранее предсказать стратегию игры, выбранную тренером и лидером команды, — она запросто может не соответствовать той, которая использовалась до этого.
Тем не менее, данных во время футбольных турниров собирают очень много — и используют их потом для предсказания результатов. Причем данные могут быть самыми разными: от результатов всех предыдущих матчей команды как в конкретном турнире, так и вне его, до индивидуальных показателей конкретных игроков.
Бен Джонс (Ben Jones) из Городского университета Лидса и его коллеги посчитали, что результаты футбольных турниров легче всего предсказывать тогда, когда они уже начались — например, по расположению команд в турнирной таблице в его начале или середине. В качестве примера они привели турнирную таблицу Чемпионата Англии по футболу за сезон 2016/2017: победившая тогда команда клуба «Челси» вышла на первое место в таблице уже к 10 туру из 36, а «Ливерпуль», занявший в итоге четвертое место, занимал его все последние 10 туров.
Примечание: в изначальной версии заметки было сказано, что «Ливерпуль» в Премьер-лиге сезона 2016/2017 занял второе место, когда на самом деле он занял четвертое. Приносим извинения за ошибку.
Всего ученые собрали данные по четырем дивизионам английского футбола: Премьер-лиге, Чемпионшипу, Лиге 1 и Лиге 2 (последние три входят в состав Английской футбольной лиги). В датасет попали таблицы с результатами по всем турам этих дивизионов за период с 1995 по 2017 год. Данные для каждого сезона каждого дивизиона проще всего представить в виде матриц m×n, где m — отдельная команда, n — отдельный тур, а элементы внутри — очки, набранные командой в этом туре.
На основе данных ученые рассчитали два коэффициента ранговой корреляции (коэффициент Спирмана и Кендалла), которые позволяют оценить связь между двумя отдельно взятыми показателями: в конкретном случае — между итоговым результатом состязаний и результатами после 10, 20 и 30 тура.
Независимо от дивизиона, года и того, какие команды принимали участие, расположение клубов в финальной турнирной таблице коррелировало с тем, как они располагались в ней по ходу сезона: показатели корреляции Спирмана и Кендалла равнялись 0,8 и 0,87 соответственно). Вероятность того, что место в турнирной таблице будет совпадать с итоговым, однако, повышалась от 10 тура к 30: например, в Премьер-лиге после 10 тура — 76,9 процента, после 20 — 87 процентов, а после 30 — 93,9 процента. Таким образом, по словам ученых, предсказать победителя дивизиона с довольно высокой точностью можно уже за несколько матчей до финального состязания: в случае Премьер-лиги — за шесть.
Полученный коэффициент Кендалла указывает на то, что турнирные таблицы в английском футболе подчиняются степенному закону, и изменение одной величины приводит к пропорциональному изменению другой. Другими словами, сильные команды в списке быстро идут на верхние строчки и остаются там к концу, а команды слабее — наоборот.
Вообще, одним из самых надежных способов предсказания результатов футбольных матчей считаются котировки букмекерских контор, но и у них нет стопроцентной эффективности. Например, австрийские математики, опираясь на данные букмекеров, пророчили победу в прошлогоднем Чемпионате мира по футболу Бразилии или Германии, а реальному победителю — Франции — в их таблице вероятностей досталось только четвертое место.
Елизавета Ивтушок