Аннотация
Обработка больших данных с каждым днем приобретает все большее значение. В этой книге подробно рассматривается организация обработки больших данных с использованием аналитической операционной системы Apache Spark. Тщательно описываются процессы потребления, преобразования и публикации результатов обработки данных; продемонстрированы возможности Apache Spark при работе с разнообразными форматами исходных данных (текст, JSON, XML, СУРБД и многими другими) и при публикации результатов в разнообразных форматах. Особое внимание уделяется обработке потоковых данных, что весьма важно в современных условиях. Подробно рассмотрены организация и архитектура кластера Spark. В приложениях представлена обширная справочная информация, необходимая каждому разработчику, использующему Spark.
Книга содержит множество иллюстраций и примеров исходного кода на языке Java с подробными комментариями.
Издание предназначено для разработчиков, начинающих осваивать систему Spark.

![This book is not just another book on discrete-event simulation. It emphasizes modeling and programming without sacrificing mathematical rigor. The book will be of great interest to senior undergraduate and starting graduate students in the fields of computer science and engineering and industrial... Computer Simulation [A Foundational Approach Using Python]](https://www.rulit.me/kotha/images/nocover.jpg)


![Эта книга для тех, кто давно связан с разработкой программного обеспечения. Или для тех, кто еще думает выбрать программирование своей профессией. Или для тех, кто... Дефрагментация мозга [Софтостроение изнутри]](https://www.rulit.me/data/programs/images/defragmentaciya-mozga-softostroenie-iznutri_567023.jpg)




Комментарии к книге "Spark в действии"