Как начать говорить с дата-сайентистом на одном языке
В этом модуле вы узнаете:
• какие знания из области математики нужны, чтобы понимать и принимать результат обучения моделей;
• как ваша поездка на такси становится частью выборки данных для обучения алгоритмов;
• что из информации о вашей поездке — целевая переменная, объект, веса́ и прецедент;
• и поймете, что алгоритмы тоже ошибаются, но это поправимо.
Оглавление
Мы уже говорили о том, что любое действие или событие можно записать в виде набора факторов: например, запись о вашей поездке на такси может включать данные о координатах подачи машины, координатах места высадки, расстоянии и длительности поездки, времени суток и так далее. Это сырые данные. Чтобы управлять процессом обучения, дата-сайентисту требуется правильно разметить и подготовить эти данные. Для этого он должен перевести вашу гипотезу на язык математики.
Надеемся, к этому моменту вы уже сформировали гипотезу: что и для чего вы хотите делать. Теперь вашу бизнес-цель нужно обозначить на манер, который поймет программа. Это формулируют так: «назначить целевую переменную и объект». Также дата-сайентисту потребуются «веса» — те самые факторы, которые влияют на показатели вашего продукта или бизнеса.
Чтобы вам было проще разобраться, Элен продемонстрирует, как это бывает, на примере с прогнозированием времени поездки на такси.
Проверьте, насколько хорошо вы усвоили информацию о целевой переменной:
Вы уже знаете, что на результаты каких-то событий в вашем продукте влияют разные факторы, — это признаки. Каждый признак имеет свой вес — степень влияния на результат. Верно воссоздавать это влияние в математической модели иногда приходится буквально на глазок — и не всегда получается с первого раза. Чтобы специалист и вы понимали, насколько хорошо или плохо прогнозирует модель, а также могли четко понимать, когда и на чем она ошибается, и нужна функция потерь.
Именно для изучения функции потерь мы с вами вспоминали, как возводить отрицательные значения в квадрат. А остальное в видео вам расскажет Элен Теванян.
Узнайте, насколько хорошо вы усвоили материал модуля:
Расставьте изобретения человечества в хронологическом порядке
Вопрос про курицу или яйцо не волнует никого, кроме философов. Согласитесь, гораздо интереснее узнать, что появилось раньше: пиво или мыло? Или, скажем, плавленый сыр или кредитная карта? Попробуйте расставить три десятка важнейших изобретений в порядке их появления, а мы заодно напомним, кто все это придумал.