Аннотация
Обработка больших данных с каждым днем приобретает все большее значение. В этой книге подробно рассматривается организация обработки больших данных с использованием аналитической операционной системы Apache Spark. Тщательно описываются процессы потребления, преобразования и публикации результатов обработки данных; продемонстрированы возможности Apache Spark при работе с разнообразными форматами исходных данных (текст, JSON, XML, СУРБД и многими другими) и при публикации результатов в разнообразных форматах. Особое внимание уделяется обработке потоковых данных, что весьма важно в современных условиях. Подробно рассмотрены организация и архитектура кластера Spark. В приложениях представлена обширная справочная информация, необходимая каждому разработчику, использующему Spark.
Книга содержит множество иллюстраций и примеров исходного кода на языке Java с подробными комментариями.
Издание предназначено для разработчиков, начинающих осваивать систему Spark.


![Такие известные компании, как Google и Intel, Cisco и Hewlett-Packard, используют язык Python, выбрав его за гибкость, простоту использования и обеспечиваемую им высокую скорость... Изучаем Python [4-е издание]](https://www.rulit.me/data/programs/images/izuchaem-python-4-e-izdanie_309792.jpg)



![Twisted is a powerful, well-tested, and mature concurrent networking library and framework. As we’ll see in this book, many projects and individuals have used it to great effect for more than a decade.
At the same time, Twisted is large, complicated, and old. Its lexicon teems with strange names,... Expert Twisted [Event-Driven and Asynchronous Programming with Python]](https://www.rulit.me/data/programs/images/expert-twisted-event-driven-and-asynchronous-programming-wit_606923.jpg)
Комментарии к книге "Spark в действии"