🎓

PySpark + Python Engineer с нуля до junior

Информационные технологии
Обложка курса Купить за 7990 ₽
  • Уроков: 1
  • Сложность: easy
  • Аудитория: Курс будет полезен всем людям, будь то школьники, студенты, взрослые, пенсионеры, люди, желающие освоить новое направление, желающие поменять род деятельности.
Информационные технологии Платный
Если Вы изучаете тему больших данных, то знание Python и PySpark из данного набора будет для Вас обязательным. На курсе по Python глубоко рассматривается и прорабатывается весь инструментарий стека (нейросети, pandas, чат-боты, алгоритмы и сортировки, PyQt5), когда на курсе PySpark Вы изучите основы распределённых вычислений с Apache Spark, научитесь работать с RDD и DataFrame, познакомитесь с Spark SQL, оптимизацией запросов, потоковой обработкой и библиотекой машинного обучения MLlib.

Основная цель набора курсов – приобретение знаний для начинающих специалистов в области обработки больших данных с нуля, без каких-либо начальных знаний. Вы изучите основы распределённых вычислений с Apache Spark, научитесь работать с RDD и DataFrame, познакомитесь с Spark SQL, оптимизацией запросов, потоковой обработкой и библиотекой машинного обучения MLlib.  На курсе по Python глубоко рассматривается и прорабатывается весь инструментарий стека (нейросети, pandas, чат-боты, алгоритмы и сортировки, PyQt5). Данные курсы помогут вам получить необходимые знания для углубления в сфере больших данных, либо трудоустройства на позицию Junior Python Engineer.

Общее содержание курса Python Engineer:

  1. Общая информация
  2. Введение
  3. Начало Python
  4. Условные операторы, циклы и try/except
  5. Строки
  6. Списки и кортежи
  7. Словари и множества
  8. Функции
  9. Модули и пакеты
  10. Random и time
  11. Decimal / Fractions / Complex
  12. IterTools
  13. Введение в PyQt5
  14. Асинхронность и многопоточность
  15. Алгоритмы и сортировки
  16. MatPlotLib
  17. Что такое матрицы и NumPy?
  18. Файлы
  19. ООП
  20. Машинное обучение
  21. NLP
  22. OpenCV
  23. Чат-боты
  24. Что такое SQLAlchemy и Django
  25. Итоговый проект

Общее содержание курса PySpark: 

  1. Введение в Spark и основы распределённых вычислений
  2. Работа с данными в PySpark: RDD
  3. Работа с данными в PySpark: DataFrame и Spark SQL
  4. Оптимизация производительности PySpark-приложений
  5. Потоковая обработка с PySpark Structured Streaming
  6. Машинное обучение с PySpark MLlib
  7. Интеграция PySpark с внешними системами
  8. Отладка и профилирование PySpark-приложений
  9. Чеклисты и шпаргалки по PySpark
  10. Продвинутые темы PySpark
  11. Финальные проекты

Желаю удачи в освоении нового, но очень интересного материала!

О новостях курса, важных обновлениях и прочих интересных вещах можно узнавать из группы в телеграмме  - https://t.me/data_stepic

Требования:

Необходим компьютер.

Необходимо уметь включать компьютер :)