Обработка больших данных (Джейд Картер)

Жанр: словари, справочники программирование самоучители технические науки информатика и вычислительная техника знания и навыки

Тэги: самоучитель обучение программированию

Язык: Русский

Размер: 975025 Кб

Издательство: SelfPub

Год издания: 2024

Бесплатный фрагмент: fb2.zip txt txt.zip rtf.zip a4.pdf a6.pdf epub fb3

Читать онлайн

Полная версия:

Описание книги:

Книга является пособием для изучения технологий больших данных, охватывая основные и продвинутые аспекты работы с данными в распределенных системах. Начав с основ, она объясняет значение БД, их эволюцию и экосистему Hadoop, включая компоненты и инструменты: HDFS, MapReduce, Hive, Pig, HBase, Sqoop и Flume. Автор раскрывает архитектуру и принципы работы Apache Hadoop, а также примеры использования MapReduce и работу с данными в HDFS, Apache Spark, описывая его основные компоненты, такие как RDD, DataFrames, Spark SQL, Spark Streaming, MLLib и GraphX, и предоставляет практические примеры установки и настройки. Раздел, посвященный Apache Kafka, рассматривает основы архитектуры, проектирование и настройка кластеров, а также интеграция с другими системами. Практические примеры и проекты предлагают возможность применить полученные знания, анализируя данные, разрабатывая потоковые приложения и интегрируя технологии Hadoop, Spark и Kafka в единую систему.

Обработка больших данных