Математики из Германии и Великобритании выяснили, что скорость спортсменов-бегунов на разных дистанциях может быть описана одной формулой, общей для любителей и профессионалов. При этом показатели какого-то конкретного спортсмена определяются набором всего из трех коэффициентов. Новая формула, например, может предсказать результаты даже на «непривычных» для спортсмена дистанциях. Так, она позволяет оценить, с какой скоростью марафонец может пробежать стометровку, а спринтер — 42 километра. Препринт работы выложен на сайте arXiv.org.
В спортивной статистике давно известно, что рекордные значения времени для бегунов неплохо описываются степенной зависимостью. На основании этого факта предлагались некоторые модели, позволяющие предсказывать результаты спортсменов в будущем. Однако, ни одна из этих моделей до сих пор не претендовала на универсальность.
В новой работе авторы исследовали выборку из 164746 официальных результатов забегов. Она включала время, показанное спортсменами, на десяти разных дистанциях, от 100 метров до 42 километров (полный марафон), при этом в выборку входили как результаты профессиональных бегунов, так и любителей любого пола и возраста.
Авторы стремились получить универсальную формулу, одинаково хорошо описывающую результаты на больших и малых дистанциях. Проблема с такого рода задачами часто бывает связана с понятием «overfitting». То есть любую статистическую выборку можно описать формулой с идеальной точностью, если в ней использовать достаточное количество «подгоночных параметров». Но такое описание не будет обладать никакой предсказательной способностью, поэтому лишается всякого смысла.
Авторам же удалось создать такую модель, что результативность любого бегуна описывалась всего тремя параметрами. В итоге при помощи машинного обучения была получена следующая формула: log10t = L1f1(s) + L2f2(s) + L3f3(s), где t — это результат забега, s — дистанция. f1,2,3(s) — это функции, одинаковые для всех спортсменов, а коэффициенты L1,2,3 как раз отражают индивидуальные способности бегунов.
Функция f1(s) оказалась простым степенным законом, что хорошо соотносится с вышеупомянутой эмпирической зависимостью рекордов для разных дистанций. f2 и f3 представляли собой более сложные функции, которые нельзя выразить простым алгебраическим соотношением.
В итоге каждый из коэффициентов L имел определенный «смысловой подтекст». Так, L1 отражает общую результативность бегуна, он выше у профессионалов, но мало отличается для спринтеров и марафонцев. L2 показывает, какая из характеристик более развита у спортсмена: скорость (отрицательные значения) или выносливость (положительные). L3 отражает предпочтения спортсмена к коротким или средним и длинным дистанциям.
На основании новых результатов авторы делают ряд обобщающих выводов. Например, они предлагают новую версию в старом споре «что важнее для марафонца — скорость и выносливость?». Согласно их аргументу, выносливость оказывается куда важнее: если спортсмен не достигает мирового уровня в дистанции 10 километров (где спринтерские скорости уже недостижимы), ему нечего и думать о золоте в марафоне.
Из других интересных выводов стоит отметить еще один: «На какой дистанции можно устраивать соревнования между марафонцем и спринтером?» Один обладает огромной выносливостью, другой — большой скоростью. Так как в беге все равно все решает время финиша, должен существовать формат, где вклады от обоих качеств уравновесятся.
На основании индивидуальных коэффициентов L1,2,3 Усэйна Болта (спринтер-рекордсмен) и Мо Фараха (олимпийский чемпион на средних и длинных дистанциях) ученые выводят «честную» дистанцию, на которой результаты спортсменов должны быть сопоставимы: 492 метра.