Аннотация
Обработка больших данных с каждым днем приобретает все большее значение. В этой книге подробно рассматривается организация обработки больших данных с использованием аналитической операционной системы Apache Spark. Тщательно описываются процессы потребления, преобразования и публикации результатов обработки данных; продемонстрированы возможности Apache Spark при работе с разнообразными форматами исходных данных (текст, JSON, XML, СУРБД и многими другими) и при публикации результатов в разнообразных форматах. Особое внимание уделяется обработке потоковых данных, что весьма важно в современных условиях. Подробно рассмотрены организация и архитектура кластера Spark. В приложениях представлена обширная справочная информация, необходимая каждому разработчику, использующему Spark.
Книга содержит множество иллюстраций и примеров исходного кода на языке Java с подробными комментариями.
Издание предназначено для разработчиков, начинающих осваивать систему Spark.





![Наш телефон знает о нас больше, чем мы думаем. Он умеет собирать и анализировать информацию о том, как мы передвигаемся по городу, какие посты лайкаем и какими... Big data простым языком [litres]](https://www.rulit.me/data/programs/images/big-data-prostym-yazykom-litres_571089.jpg)
![Для каждого предпринимателя одним из ключевых вопросов является постановка и организация бухгалтерского учета. Это неудивительно: без отлаженной бухгалтерии в... Компьютер для индивидуального предпринимателя [Как вести учет быстро, легко и безошибочно]](https://www.rulit.me/data/programs/images/kompyuter-dlya-individualnogo-predprinimatelya-kak-vesti-uch_473032.jpg)
Комментарии к книге "Spark в действии"