Функционирует при финансовой поддержке Федерального агентства по печати и массовым коммуникациям (Роспечать)

Промежуточный тест курса «Наука о данных»

Проверьте, хорошо ли вы усвоили материал

Курс близится к концу — впереди всего один модуль. После него вас ожидает финальное тестирование. Так как модулей было много и они вышли объемными, мы создали этот промежуточный тест, чтобы вы могли быстро освежить в памяти главное из курса.

1. Как работают алгоритмы машинного обучения, которые вы изучали в этом курсе?
2. Какая из этих задач относится к обучению без учителя (то есть нам неизвестна целевая переменная)?
3. Таксопарк хочет найти закономерности в движении людей по городу, чтобы понимать, в какие точки и в какое время выпускать больше машин. У таксопарка есть приложение и накопленная статистика с координатами и временем заказов. Это задача:
4. В чем разница между логистической регрессией и простым линейным классификатором?
5. Что такое выброс в данных?
6. Метрика полноты считается по следующей формуле:

TP/(TP+FP) =

Эта метрика:
7. Для одной модели получили вот такие данные:

MAE — 15, MSE — 225, R^2 — 0.7

Нет ли тут ошибки?
8. Какой из алгоритмов скорее всего переобученный?
9. Мы воспользуемся k-блочной валидацией, k равно 5. Что это значит?

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.