В этом модуле вы узнаете:
• почему машинное обучение будет влиять на вашу жизнь, даже если вы никак с ним не связаны;
• что смотреть и читать, если вы хотите лучше понять, как данные используются в новых отраслях экономики;
• в каком направлении развиваться, если вы хотите больше заниматься работой с данными и вопросами data governance, data engineering и проектами машинного обучения.
Оглавление
Математический тест для подготовки ко второму модулю
Модуль 2. Переводим задачу машинного обучения на язык, понятный дата-сайентисту и «машине»
Проверочный тест
Модуль 3. Как обучаются алгоритмы и от чего это зависит
Проверочный тест
Модуль 4. Как алгоритмы решают вашу задачу
Проверочный тест
Модуль 5. Как готовят данные для задач машинного обучения
Проверочный тест
Модуль 6. Как проверить качество модели с помощью метрик
Модуль 7. Как понять, что модель готова к настоящей работе
Проверочный тест
Модуль 8. Как проверить модель «в бою»
Проверочный тест
Модуль 9. Как выглядит документация для ML-проекта
Промежуточный тест курса «Наука о данных»
Модуль 10. Заглянем в будущее
Финальное тестирование
Человечество уже сгенерировало
33 000 000 000 000 000 000 000 байт данных
За ближайшие годы эта цифра вырастет в 5 раз.
Вы уже могли слышать фразу «данные — новая нефть». Многие трактуют ее так: сегодня каждый человек владеет собственной «скважиной», которая генерирует данные. Это верно, но лишь отчасти — сырая нефть не стоит очень дорого и мало для чего годится. Гораздо больше ценится результат ее переработки: продукты на основе нефти имеют понятную добавленную стоимость и проникли буквально всюду — от топлива для многих видов транспорта и пластика в любых приборах до полиэстровых нитей в нашей одежде и полиэтиленовой упаковки, в которой мы храним пищу.
Сырые данные тоже не стоят очень много. Благодаря компьютерам, программам и интернету человечество построило инфраструктуру для их «добычи» и продолжает накапливать информацию в геометрической прогрессии. Осталось сделать следующий шаг. Чтобы эти массивы начали приносить реальную пользу, людям нужно научиться их правильно хранить (за это отвечает область data governance), а затем — правильно перерабатывать: это сферы интересов дата-инженеров и дата-сайентистов.
Пока правильно выстраивать эти процессы учится лишь узкий круг ИТ и около ИТ-гигантов и стартапов. Но еще при нашей жизни машинное обучение и работа с данными придут в каждую отрасль, где используются компьютеры, а цифровые продукты и сервисы на их основе станут столь же привычными, как электричество, обычные приложения или магазинный пакет, который сделан из отходов производства нефти.
Хочу работать с данными. Куда развиваться дальше?
Здорово, если наш курс подтолкнул вас развиваться в этой новой области — здесь свой потенциал смогут реализовать как люди с математическим и техническим опытом, так и те, кто обладает сильными аналитическими способностями и не боится простых формул. Элен Теванян расскажет, каких специалистов сейчас не хватает на рынке в целом, а Сергей Носов — о том, как присоединиться к командам, работающим с данными внутри «Ростелекома».
Курс «Наука о данных» подошел к концу. Настало время пройти финальное тестирование и узнать, насколько хорошо вы усвоили материал: