Наука о данных. Модуль 2

Как начать говорить с дата-сайентистом на одном языке

В этом модуле вы узнаете:
• какие знания из области математики нужны, чтобы понимать и принимать результат обучения моделей;
• как ваша поездка на такси становится частью выборки данных для обучения алгоритмов;
• что из информации о вашей поездке — целевая переменная, объект, веса́ и прецедент;
• и поймете, что алгоритмы тоже ошибаются, но это поправимо.

Во что превращаются данные: целевая переменная, объект, прецедент и другие термины

Мы уже говорили о том, что любое действие или событие можно записать в виде набора факторов: например, запись о вашей поездке на такси может включать данные о координатах подачи машины, координатах места высадки, расстоянии и длительности поездки, времени суток и так далее. Это сырые данные. Чтобы управлять процессом обучения, дата-сайентисту требуется правильно разметить и подготовить эти данные. Для этого он должен перевести вашу гипотезу на язык математики.

Надеемся, к этому моменту вы уже сформировали гипотезу: что и для чего вы хотите делать. Теперь вашу бизнес-цель нужно обозначить на манер, который поймет программа. Это формулируют так: «назначить целевую переменную и объект». Также дата-сайентисту потребуются «веса» — те самые факторы, которые влияют на показатели вашего продукта или бизнеса.

Чтобы вам было проще разобраться, Элен продемонстрирует, как это бывает, на примере с прогнозированием времени поездки на такси.

Проверьте, насколько хорошо вы усвоили информацию о целевой переменной:

Алгоритмы тоже учатся на ошибках.
Что такое функция потерь?

Вы уже знаете, что на результаты каких-то событий в вашем продукте влияют разные факторы, — это признаки. Каждый признак имеет свой вес — степень влияния на результат. Верно воссоздавать это влияние в математической модели иногда приходится буквально на глазок — и не всегда получается с первого раза. Чтобы специалист и вы понимали, насколько хорошо или плохо прогнозирует модель, а также могли четко понимать, когда и на чем она ошибается, и нужна функция потерь.

Именно для изучения функции потерь мы с вами вспоминали, как возводить отрицательные значения в квадрат. А остальное в видео вам расскажет Элен Теванян.

Узнайте, насколько хорошо вы усвоили материал модуля:

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.
Проверено временем

Расставьте изобретения человечества в хронологическом порядке