Математика Data Science с нуля: Множественная Регрессия в Python

- Уроков: 46
- Сложность: easy
- Аудитория: Курс рассчитан на тех, кто хочет с полного нуля получить глубокое понимание всей математики для машинного обучения которая используется в реализации классических алгоритмов машинного обучения и в дальнейшем применять эти знания в Python коде.
10 примеров сфер применения множественной линейной регрессии:
1.🏠 Прогнозирование цен
-
Цена дома в зависимости от площади, количества комнат и удалённости от центра.
- Стоимость автомобиля в зависимости от возраста, пробега и марки.
2.📈 Анализ продаж
- Объём продаж товара в зависимости от рекламного бюджета, количества торговых точек и цен конкурентов.
- Доход магазина в зависимости от количества посетителей, средней покупки и дней скидок.
3.💰 Экономика и финансы
- Прогноз инфляции на основе процентной ставки, денежной массы и уровня безработицы.
- Рост ВВП в зависимости от инвестиций, экспорта и потребления домохозяйств.
4.🏥 Медицина
- Масса тела пациента в зависимости от роста, возраста и уровня физической активности.
- Уровень холестерина в зависимости от диеты, возраста и индекса массы тела (ИМТ).
5.🎓 Образование
- Балл за экзамен в зависимости от количества часов подготовки, посещаемости занятий и уровня тревожности.
- Средний балл по предмету в зависимости от предыдущих оценок, уровня участия и качества преподавания.
6.🏃♂️ Спорт
- Время пробега дистанции в зависимости от числа тренировок, сна и питания.
- Результаты соревнований в зависимости от возраста, тренировочного опыта и физиологических параметров.
7.🛠️ Производство
- Время изготовления детали в зависимости от сложности, количества операций и опыта оператора.
- Стоимость продукта в зависимости от сырья, времени производства и энергозатрат.
8.🌾 Агрономия
- Урожайность в зависимости от количества удобрений, полива и типа почвы.
- Рост растений в зависимости от света, температуры и влажности.
9.🌍 Экология
- Уровень загрязнения воздуха в зависимости от числа автомобилей, ветра и температуры.
- Качество воды в зависимости от отходов, глубины и pH.
10.⚡ Энергетика
- Потребление электроэнергии в зависимости от температуры, времени суток и количества жителей.
- Загрузка электросети в зависимости от типа оборудования, числа подключений и времени года
ОСОБЕННОСТИ КУРСА:
- Разбор коммерческого кода действующих проектов по Data Science с сайта https://kaggle.com
- Способность понимать "нормальное уравнение" в учебнике от Школы Анализа Данных(ШАД) Яндекс https://education.yandex.ru/handbook/ml/article/linear-models
- Применения знаний на новейших моделях машинного обучения и нейросетей на сайте архив: https://arxiv.org/list/stat.ML/recent
- Способность понимать лекции от Воронцова К.В. http://machinelearning.ru/wiki/index.php?title=Участник:Vokov
- Глубокое понимание раздела "Регрессионный анализ": http://www.machinelearning.ru/wiki/index.php?title=Регрессия
- Адаптация полученных знаний по математике и программированию под специфику бизнеса вашего работодателя или вашего стартапа.
- Навык выведения математических формул с нуля
- Имплементация математических формул в Python
- Глубокое понимание математики которая используется в Python
- Фундаментальное понимание алгоритма Множественной линейной регрессии (Нормальное уравнение) на Python
- Фундаментальные знания для подготовки к собеседованию в Data Science
Этот курс - лучший способ начать с нуля и стать специалистом по Машинному Обучению в Python и МАТЕМАТИКЕ!
Курс разработан с акцентом на простой и понятный вход в машинное обучение — без необходимости сразу углубляться в сложную математику. Теоретическая база вводится постепенно, по мере необходимости, что делает обучение комфортным даже для тех, кто не имеет технического образования. Многие участники с гуманитарным бэкграундом успешно проходят курс и отмечают это в своих отзывах.
Если в процессе обучения у вас возникнут вопросы, вы можете задать их в комментариях к урокам — я, как автор курса, регулярно просматриваю комментарии и с радостью помогу вам разобраться
В этом курсе Вы изучите следующие темы:
- Сравнение простой и множественной регрессии
- Реверс-инжиниринг кода (Python+sklearn)
- Параметры метода, Фильтрация данных
- z-score: масштабирование признаков
- train_test_split:Тестовая, обучающая выборка.
- Математическое обоснование метода "insert"
- Формы записи уравнения линейной регресии
- Нормальное уравнение
- Обратная матрица.
- Определитель.
- Миноры.
- Дополнения
- Правило саррюса.
- Правило треугольников.
- Ранг матрицы.
- Линейная независимость.
- Вырожденная матрица
- Линейная комбинация.
- Коллинеарность и мультиколлинеарность,
- Матрица корреляции
- Регуляризация
- L1 vs L2 норма
- Матричное диффенцирование
- Система Линейных Алгебраических Уравнений
- Метод Гаусса
- Геометрическая интерпретация метода наименьших квадратов
- Ортогональная проекция на столбцовое пространство матрицы
- Коэффициент детерминации R2(SSR/SST)
- Корреляционно-регрессионный анализ
и много другое!
Курс сопровождается набором Jupyter Notebook — с примерами кода и подробными пояснениями. Для каждой лекции подготовлен отдельный блокнот, структурированный по разделам курса. Это позволяет не только смотреть видео, но и быстро находить нужную информацию в текстовом виде — удобно для повторения и навигации по материалу.
Курс доступен без ограничений по времени: вы можете проходить его в удобном для себя темпе.
Присоединяйтесь к обучению и развивайте свои навыки — добро пожаловать на курс!
Аналитическое решение с помощью метода наименьших квадратов (МНК)
- Никаких знаний по математике предварительно не требуется, вся математика будет дана с полного нуля.
- Рекомендуются базовые знания Python (на уровне функций).
-
Либо опыт работы с другими языками программирования и готовность изучать Python в процессе курса.