В этом модуле вы узнаете:
• какие знания из области математики нужны, чтобы понимать и принимать результат обучения моделей;
• как ваша поездка на такси становится частью выборки данных для обучения алгоритмов;
• что из информации о вашей поездке — целевая переменная, объект, веса́ и прецедент;
• и поймете, что алгоритмы тоже ошибаются, но это поправимо.
Оглавление
Математический тест для подготовки ко второму модулю
Модуль 2. Переводим задачу машинного обучения на язык, понятный дата-сайентисту и «машине»
Проверочный тест
Модуль 3. Как обучаются алгоритмы и от чего это зависит
Проверочный тест
Модуль 4. Как алгоритмы решают вашу задачу
Проверочный тест
Модуль 5. Как готовят данные для задач машинного обучения
Проверочный тест
Модуль 6. Как проверить качество модели с помощью метрик
Модуль 7. Как понять, что модель готова к настоящей работе
Проверочный тест
Модуль 8. Как проверить модель «в бою»
Проверочный тест
Модуль 9. Как выглядит документация для ML-проекта
Промежуточный тест курса «Наука о данных»
Модуль 10. Заглянем в будущее
Финальное тестирование
Во что превращаются данные: целевая переменная, объект, прецедент и другие термины
Мы уже говорили о том, что любое действие или событие можно записать в виде набора факторов: например, запись о вашей поездке на такси может включать данные о координатах подачи машины, координатах места высадки, расстоянии и длительности поездки, времени суток и так далее. Это сырые данные. Чтобы управлять процессом обучения, дата-сайентисту требуется правильно разметить и подготовить эти данные. Для этого он должен перевести вашу гипотезу на язык математики.
Надеемся, к этому моменту вы уже сформировали гипотезу: что и для чего вы хотите делать. Теперь вашу бизнес-цель нужно обозначить на манер, который поймет программа. Это формулируют так: «назначить целевую переменную и объект». Также дата-сайентисту потребуются «веса» — те самые факторы, которые влияют на показатели вашего продукта или бизнеса.
Чтобы вам было проще разобраться, Элен продемонстрирует, как это бывает, на примере с прогнозированием времени поездки на такси.
Проверьте, насколько хорошо вы усвоили информацию о целевой переменной:
ПРОВЕРИТЬ СЕБЯ
Алгоритмы тоже учатся на ошибках.
Что такое функция потерь?
Вы уже знаете, что на результаты каких-то событий в вашем продукте влияют разные факторы, — это признаки. Каждый признак имеет свой вес — степень влияния на результат. Верно воссоздавать это влияние в математической модели иногда приходится буквально на глазок — и не всегда получается с первого раза. Чтобы специалист и вы понимали, насколько хорошо или плохо прогнозирует модель, а также могли четко понимать, когда и на чем она ошибается, и нужна функция потерь.
Именно для изучения функции потерь мы с вами вспоминали, как возводить отрицательные значения в квадрат. А остальное в видео вам расскажет Элен Теванян.
Узнайте, насколько хорошо вы усвоили материал модуля: