🎓

PySpark + SQL + Python Engineer с нуля до junior

Информационные технологии
Обложка курса Купить за 9990 ₽
  • Уроков: 1
  • Сложность: easy
  • Аудитория: Курс будет полезен всем людям, будь то школьники, студенты, взрослые, пенсионеры, люди, желающие освоить новое направление, желающие поменять род деятельности.
Информационные технологии Платный
Если Вы изучаете тему больших данных, то знание SQL, Python и PySpark из данного набора будет для Вас обязательным. На курсе по Python глубоко рассматривается весь инструментарий стека (нейросети, pandas, чат-боты, алгоритмы и сортировки, PyQt5). На курсе PySpark Вы изучите основы распределённых вычислений с Apache Spark, научитесь работать с RDD и DataFrame. На курсе SQL даст такие ключевые навыки как написание сложных SQL-запросов, оптимизацию запросов, администрирование БД и изучите с PostgreSQL.

Основная цель набора курсов – приобретение знаний для начинающих специалистов в области обработки больших данных с нуля, без каких-либо начальных знаний. Вы изучите основы распределённых вычислений с Apache Spark, научитесь работать с RDD и DataFrame, познакомитесь с Spark SQL, оптимизацией запросов, потоковой обработкой и библиотекой машинного обучения MLlib.  В курсе SQL рассматривается и прорабатывается весь инструментарий, необходимый для работы с базами данных (PostgreSQL, написание сложных SQL запросов, оптимизация запросов, администрирование). В свою очередь на курсе по Python глубоко рассматривается и прорабатывается весь инструментарий стека (нейросети, pandas, чат-боты, алгоритмы и сортировки, PyQt5). Данные курсы помогут вам получить необходимые знания для углубления в сфере больших данных, либо трудоустройства на такие позиции как Junior SQL Developer или Junior Python Engineer.

Общее содержание курса Python Engineer:

  1. Общая информация
  2. Введение
  3. Начало Python
  4. Условные операторы, циклы и try/except
  5. Строки
  6. Списки и кортежи
  7. Словари и множества
  8. Функции
  9. Модули и пакеты
  10. Random и time
  11. Decimal / Fractions / Complex
  12. IterTools
  13. Введение в PyQt5
  14. Асинхронность и многопоточность
  15. Алгоритмы и сортировки
  16. MatPlotLib
  17. Что такое матрицы и NumPy?
  18. Файлы
  19. ООП
  20. Машинное обучение
  21. NLP
  22. OpenCV
  23. Чат-боты
  24. Что такое SQLAlchemy и Django
  25. Итоговый проект

Общее содержание курса PySpark: 

  1. Введение в Spark и основы распределённых вычислений
  2. Работа с данными в PySpark: RDD
  3. Работа с данными в PySpark: DataFrame и Spark SQL
  4. Оптимизация производительности PySpark-приложений
  5. Потоковая обработка с PySpark Structured Streaming
  6. Машинное обучение с PySpark MLlib
  7. Интеграция PySpark с внешними системами
  8. Отладка и профилирование PySpark-приложений
  9. Чеклисты и шпаргалки по PySpark
  10. Продвинутые темы PySpark
  11. Финальные проекты

Общее содержание курса SQL:

  1. Знакомство с платформой и сдача практических работ
  2. Что такое базы данных?
  3. Проектирование базы данных
  4. Введение в PostgreSQL
  5. Структура SQL запросов
  6. Команды DML
  7. Запросы на выборку данных
  8. Агрегация и группировка данных
  9. Работа с несколькими таблицами
  10. Работа с NULL значениями
  11. Индексы и их использование
  12. Работа с представлениями (Views)
  13. Управление доступом и безопасностью
  14. Хранимые процедуры и функции
  15. Триггеры и их использование
  16. Работа с JSON и XML данными
  17. SQL для аналитики данных
  18. NoSQL и SQL
  19. Безопасность данных и шифрование
  20. Введение в Clickhouse
  21. Разбор основных вопросов на собеседованиях
  22. Итоговое задание

Желаю удачи в освоении нового, но очень интересного материала!

О новостях курса, важных обновлениях и прочих интересных вещах можно узнавать из группы в телеграмме  - https://t.me/data_stepic

Требования:

Необходим компьютер.

Необходимо уметь включать компьютер :)