Скачать Практический курс по Big Data. Часть 1. HDFS, Map Reduce, Hive [bigdata team]

  • Автор темы Автор темы admin
  • Дата начала Дата начала
  • Приглашаем разместиться на бесплатной основе в разделе Маркет -> услуг. Наш ТГ: @ble_lol
    Для просмотра КУРСОВ надо статус VIP, КУПИТЬ МОЖНО ТУТ: https://ble.lol/account/upgrades

    Запрещенно работать RU и СНГ! Блок навечно!

admin

Команда форума
Баба Яга
9 Ноя 2024
26,451
269
BCoin
184,247
DEP
41,637р
ЧАСТЬ 1 - HDFS (ВЫ ТУТ) ||
ЧАСТЬ 2 - Spark
||
ЧАСТЬ 3 - Kafka, RT, NoSQL, Data layout
Вы научитесь работать с распределенными файловыми системами, познакомитесь с экосистемой Hadoop, разберетесь с оптимизацией MapReduce вычислений и работой с Hive.
Часть 1.
HDFS, Map Reduce, Hive
В этом модуле вы изучите:
▶ вводная часть: знакомство (задачи, оценки, дедлайны), подробности курса;
▶ распределенные файловые системы (GFS, HDFS). Их составляющие, достоинства, недостатки и сфера применения;
▶ чтение и запись в HDFS. HDFS APIs: Web, shell.
▶ Hadoop Streaming;
▶ элементы Hadoop-задачи (Mapper, reducer, combiner, partitioner, comparator).
▶ приложения с несколькими Hadoop-задачами;
▶ тюнинг Hadoop-job (настройка партиционирования, сложные ключи, uber jobs);
▶ задачи с несколькими входами. Joins в Hadoop.
▶ архитектура Hive, виды таблиц, форматы хранения данных;
▶ трансляция Hive-запросов в MapReduce-задачи;
▶ сериализация и десериализация;
▶ тюнинг Join'ов в Hive;
▶ партиционирование, бакетирование, семплирование;
▶ User defined functions, Hive Streaming.

Скрытое содержимое могут видеть только пользователи групп(ы): VIP