Big Data: Hadoop и экосистема больших данных

0/5 ·
Создан: 18 мая 2023 г. Обновлён: 23 марта 2026 г.

Анализ данных объемом в терабайты требует понимания не одной программы, а целой экосистемы распределенных систем. Здесь показывают, как объединить Hadoop, Spark, Kafka и NoSQL-базы в единую рабочую архитектуру, чтобы решать реальные бизнес-задачи.

Внутри разбирается установка и настройка Hadoop через Hortonworks/Ambari, написание сценариев обработки через Pig и Spark, а также интеграция потоковых данных с помощью Flink и Storm. Вы научитесь выбирать подходящую технологию хранения под конкретную задачу: от реляционных данных в Hive до неструктурированных в Cassandra или MongoDB.

Курс рассчитан на специалистов с базовым опытом программирования (Python или Scala) и пониманием командной строки Linux. Вы освоите проектирование распределенных систем и сможете управлять кластерами с помощью YARN, Mesos и Zookeeper.

Автор
0 · 0 отзывов

Отзывов пока нет. Будьте первым!

Ещё интересные курсы

А
Можно купить
108 ₽ 700 ₽ −85%

Анализ данных с помощью Python и Pandas

П
Можно купить
138 ₽ 880 ₽ −84%

Продвинутые модели прогнозирования с Python

Аналитика и аналитическое мышление для начинающих Можно купить
126 ₽ 3 000 ₽ −96%

Аналитика и аналитическое мышление для начинающих

Алексей Кузьмин
А
Можно купить
140 ₽

Анализ данных в IBM SPSS для начинающих

Daniil Lobov
У
Можно купить
88 ₽ 999 ₽ −91%

Управление финансовыми данными с помощью Python & Pandas

Alexander Hagmann
Первичный анализ данных в Python. Часть 2 Можно купить
574 ₽ 22 750 ₽ −97%

Первичный анализ данных в Python. Часть 2

МФТИ
Master Data Analysis with Python Можно купить
258 ₽ 7 640 ₽ −97%

Master Data Analysis with Python

Тед Петроу
О
Можно купить
192 ₽ 4 782 ₽ −96%

Обработка и анализ данных на Python

WebForMySelf
Python Data Analysis & Visualization Bootcamp Можно купить
400 ₽ 1 000 ₽ −60%

Python Data Analysis & Visualization Bootcamp

Siranjeevi