Алгоритмы машинного обучения предсказали зарплату

Black Books / Channel 4, 2000–2004

Американские психологи предложили эффективный способ автоматического предсказания заработной платы. Алгоритм, основанный на методах машинного обучения, анализирует влияние нескольких факторов на размер доходов и ранжирует их по значимости. В статье, опубликованной в журнале Frontiers in Psychology, сообщается, что такой метод указал, что на зарплату сильно влияет способность отказаться от немедленного вознаграждения в пользу больших выгод в будущем.

Заработная плата во многом определяет качество жизни человека. Исследования показывают, что низкий доход коррелирует с повышенным риском развития депрессии, а самые богатые люди живут в среднем на 15 лет дольше самых бедных. Зарплата, в свою очередь, зависит от множества различных факторов: социоэкономического статуса семьи человека, его образования, возраста, этнической принадлежности и даже пола. Один из таких факторов — стремление ребенка к максимизации прибыли путем отказа от немедленного вознаграждения в пользу чуть большего. Влияние этого фактора на успех человека в будущем не раз показывали с помощью знаменитого «зефирного эксперимента». Тем не менее, этот эксперимент обладает низкой внешней валидностью и из-за этого достаточно плохо реплицируется: к примеру, хуже предсказывает успехи детей женщин, не имеющих высшего образования.

В классических исследованиях поиска взаимосвязей используются либо коэффициенты корреляции, либо линейная регрессия. Ученые из Университета Темпл (Филадельфия, США) под руководством Уильяма Хэмптона (William Hampton) предложили использовать машинное обучение для определения факторов, влияющих на заработную плату. Для этого они собрали данные о 2564 людях: каждый из них представил информацию о зарплате, возрасте, поле, расе, почтовом индексе места проживания, образовании и области профессиональной деятельности. Также каждый из них прошел онлайн-опрос на способность к отказу от немедленного вознаграждения: в нем участникам предлагали сделать выбор между 500 долларами сразу же и 1000 долларами через определенное время (день, неделю, месяц, полгода и год).

Полученные данные разбили на тренировочную (90 процентов участников) и тестовую выборку (10 процентов). Для обучения алгоритма определения влияния различных факторов ученые использовали три метода, которые обычно применяют для решения задачи классификации: метод опорных векторов, классификатор на основе нейросети и метод random forest. Система, таким образом, была обучена предсказывать на тестовой выборке зарплату на основе наиболее релевантных факторов, которым научилась на выборке при обучении.

С помощью предложенного алгоритма ученые смогли ранжировать все изученные ими факторы. Так, помимо очевидных профессии и образования на зарплату также повлияло место проживания участников. Четвертым по значимости фактором оказалась способность к отказу от немедленного вознаграждения с промежутком в год: бóльшую зарплату получали те, кто отказывался от полусотни долларов сразу в пользу тысячи через год. Любопытно, что этот фактор оказался значимее этнической принадлежности, роста и даже пола участников.

Авторы отметили, что для построения модели были использованы данные об американцах: полученные результаты, таким образом, следует с осторожностью переносить на граждан других стран. Исследователи также добавили, что в будущем было бы интересно и полезно изучить закономерности между изученными факторами и заработной платой среди представителей других культур: результаты, по их мнению, могут отличаться.

В прошлом году ученые выяснили, что предрасположенность к немедленному вознаграждению во многом обусловлена генетически. Оказалось, что однонуклеотидный полиморфизм интрона гена GPM6B, который во многом отвечает за синтез нейромедиатора серотонина, не только заставляет людей отказываться от ожидания в пользу получения вознаграждения прямо сейчас, но также коррелирует с наличием СДВГ, депрессии и никотиновой зависимостью.

Елизавета Ивтушок


Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.