194 ₽ 950 ₽ −80%
Вам больше не придется ограничиваться локальными объемами данных: этот курс учит переносить задачи анализа на распределенные системы Hadoop и Spark. Здесь разбирают, как эффективно обрабатывать терабайты информации, настраивать ETL-процессы и строить архитектуру хранилищ, когда возможностей стандартного Pandas становится недостаточно. Внутри — работа с NoSQL-базами (HBase, Cassandra, ClickHouse), управление задачами через Apache Airflow и внедрение машинного обучения в инфраструктуру Big Data с помощью Spark ML. В результате вы научитесь готовить данные для DS-моделей в масштабах больших компаний и визуализировать результаты в Apache Superset.
Отзывов пока нет. Будьте первым!