Big Data. Часть 2. Spark: from zero to hero

0/5 ·
Создан: 5 мая 2023 г. Обновлён: 23 марта 2026 г.

Вам нужно обрабатывать терабайты данных за считанные минуты, но стандартные инструменты перестали справляться. Здесь разбирают Spark не на уровне теории, а через призму реальных задач по высокопроизводительным вычислениям.

Внутри фокус на ключевых инженерных аспектах: как устроены графы вычислений, зачем разделять задачи на job, stage и task, и как управлять памятью через настройку Garbage Collection. Вы научитесь осознанно выбирать между RDD и DataFrames, а также глубоко проработаете болезненную тему оптимизации операций shuffle.

Курс рассчитан на инженеров данных, которые уже работают с Hadoop/HDFS и хотят перейти к профессиональной эксплуатации Spark в кластерах с YARN. В итоге вы перестанете гадать, почему «зависает» job, и научитесь тюнить Spark так, чтобы он утилизировал ресурсы железа максимально эффективно.

Автор

Другие материалы школы

П
Можно купить
752 ₽ 17 500 ₽ −96%

Практический курс по Big Data. Часть 1. HDFS, Map Reduce, Hive

bigdata team
0 · 0 отзывов

Отзывов пока нет. Будьте первым!

Ещё интересные курсы

ElasticSearch, LogStash, Kibana ELK. Learn Kibana Можно купить
204 ₽ 670 ₽ −70%

ElasticSearch, LogStash, Kibana ELK. Learn Kibana

A
Можно купить
218 ₽ 670 ₽ −67%

All NoSQL (HBase + Cassandra + MongoDB + Redis) for Big Data

Udemy
С
Можно купить
302 ₽ 750 ₽ −60%

Создание мощного API с Django Rest Framework на Heroku

Udemy
T
Можно купить
200 ₽ 959 ₽ −79%

Top Python and Django Web Development Bundle

John Elder
П
Можно купить
172 ₽ 999 ₽ −83%

Полный курс сетевого программирования на Python

Martin Yanev
Podlodka Python. Асинхронность Можно купить
376 ₽ 3 000 ₽ −87%

Podlodka Python. Асинхронность

Podlodka Crew