Аннотация
Обработка больших данных с каждым днем приобретает все большее значение. В этой книге подробно рассматривается организация обработки больших данных с использованием аналитической операционной системы Apache Spark. Тщательно описываются процессы потребления, преобразования и публикации результатов обработки данных; продемонстрированы возможности Apache Spark при работе с разнообразными форматами исходных данных (текст, JSON, XML, СУРБД и многими другими) и при публикации результатов в разнообразных форматах. Особое внимание уделяется обработке потоковых данных, что весьма важно в современных условиях. Подробно рассмотрены организация и архитектура кластера Spark. В приложениях представлена обширная справочная информация, необходимая каждому разработчику, использующему Spark.
Книга содержит множество иллюстраций и примеров исходного кода на языке Java с подробными комментариями.
Издание предназначено для разработчиков, начинающих осваивать систему Spark.



![Пятое издание одного из лучших российских учебников по сетевым технологиям, переведенного на английский, испанский, португальский и китайский языки, отражает те... Компьютерные сети [Принципы, технологии, протоколы. 5-е издание]](https://www.rulit.me/data/programs/images/kompyuternye-seti-principy-tehnologii-protokoly-5-e-izdanie_475363.jpg)

![Всякому, кто зарабатывает на жизнь разработкой программного обеспечения, крайне важно добиваться лучшего результата быстрее и с меньшими усилиями.
Правильный... Продуктивный программист [Как сделать сложное простым, а невозможное – возможным]](https://www.rulit.me/data/programs/images/produktivnyj-programmist-kak-sdelat-slozhnoe-prostym-a-nevoz_606093.jpg)
Комментарии к книге "Spark в действии"