Математики из Германии и Великобритании выяснили, что скорость спортсменов-бегунов на разных дистанциях может быть описана одной формулой, общей для любителей и профессионалов. При этом показатели какого-то конкретного спортсмена определяются набором всего из трех коэффициентов. Новая формула, например, может предсказать результаты даже на «непривычных» для спортсмена дистанциях. Так, она позволяет оценить, с какой скоростью марафонец может пробежать стометровку, а спринтер — 42 километра. Препринт работы выложен на сайте arXiv.org.
В спортивной статистике давно известно, что рекордные значения времени для бегунов неплохо описываются степенной зависимостью. На основании этого факта предлагались некоторые модели, позволяющие предсказывать результаты спортсменов в будущем. Однако, ни одна из этих моделей до сих пор не претендовала на универсальность.
В новой работе авторы исследовали выборку из 164746 официальных результатов забегов. Она включала время, показанное спортсменами, на десяти разных дистанциях, от 100 метров до 42 километров (полный марафон), при этом в выборку входили как результаты профессиональных бегунов, так и любителей любого пола и возраста.
Авторы стремились получить универсальную формулу, одинаково хорошо описывающую результаты на больших и малых дистанциях. Проблема с такого рода задачами часто бывает связана с понятием «overfitting». То есть любую статистическую выборку можно описать формулой с идеальной точностью, если в ней использовать достаточное количество «подгоночных параметров». Но такое описание не будет обладать никакой предсказательной способностью, поэтому лишается всякого смысла.
Авторам же удалось создать такую модель, что результативность любого бегуна описывалась всего тремя параметрами. В итоге при помощи машинного обучения была получена следующая формула: log10t = L1f1(s) + L2f2(s) + L3f3(s), где t — это результат забега, s — дистанция. f1,2,3(s) — это функции, одинаковые для всех спортсменов, а коэффициенты L1,2,3 как раз отражают индивидуальные способности бегунов.
Функция f1(s) оказалась простым степенным законом, что хорошо соотносится с вышеупомянутой эмпирической зависимостью рекордов для разных дистанций. f2 и f3 представляли собой более сложные функции, которые нельзя выразить простым алгебраическим соотношением.
В итоге каждый из коэффициентов L имел определенный «смысловой подтекст». Так, L1 отражает общую результативность бегуна, он выше у профессионалов, но мало отличается для спринтеров и марафонцев. L2 показывает, какая из характеристик более развита у спортсмена: скорость (отрицательные значения) или выносливость (положительные). L3 отражает предпочтения спортсмена к коротким или средним и длинным дистанциям.
На основании новых результатов авторы делают ряд обобщающих выводов. Например, они предлагают новую версию в старом споре «что важнее для марафонца — скорость и выносливость?». Согласно их аргументу, выносливость оказывается куда важнее: если спортсмен не достигает мирового уровня в дистанции 10 километров (где спринтерские скорости уже недостижимы), ему нечего и думать о золоте в марафоне.
Из других интересных выводов стоит отметить еще один: «На какой дистанции можно устраивать соревнования между марафонцем и спринтером?» Один обладает огромной выносливостью, другой — большой скоростью. Так как в беге все равно все решает время финиша, должен существовать формат, где вклады от обоих качеств уравновесятся.
На основании индивидуальных коэффициентов L1,2,3 Усэйна Болта (спринтер-рекордсмен) и Мо Фараха (олимпийский чемпион на средних и длинных дистанциях) ученые выводят «честную» дистанцию, на которой результаты спортсменов должны быть сопоставимы: 492 метра.
В чем особенность исследований Blue Sky
Бывает, что ученые не представляют, каким будет конечный результат их работы и найдет ли она в обозримом будущем практическое применение. Высокорисковые исследования принято называть Blue Sky Science, или «наукой голубого неба». В 2022 году в России прошел первый конкурс «Blue Sky Research — Искусственный интеллект в науке», в котором участвовали исключительно такие проекты. А до 27 февраля 2023 года идет прием заявок на участие в конкурсе 2023 года, посвященном исследованиям на стыке искусственного интеллекта и АПК, пищевых технологий. Ко Дню российской науки, который отмечается в России 8 февраля, мы поговорили с молодыми учеными — финалистами первого конкурса. Рассказываем про их проекты, интересы и науку уровня Blue Sky.