Аннотация
Обработка больших данных с каждым днем приобретает все большее значение. В этой книге подробно рассматривается организация обработки больших данных с использованием аналитической операционной системы Apache Spark. Тщательно описываются процессы потребления, преобразования и публикации результатов обработки данных; продемонстрированы возможности Apache Spark при работе с разнообразными форматами исходных данных (текст, JSON, XML, СУРБД и многими другими) и при публикации результатов в разнообразных форматах. Особое внимание уделяется обработке потоковых данных, что весьма важно в современных условиях. Подробно рассмотрены организация и архитектура кластера Spark. В приложениях представлена обширная справочная информация, необходимая каждому разработчику, использующему Spark.
Книга содержит множество иллюстраций и примеров исходного кода на языке Java с подробными комментариями.
Издание предназначено для разработчиков, начинающих осваивать систему Spark.
![Cегодня Big Data – это большой бизнес.
Нашей жизнью управляет информация, и извлечение выгоды из нее становится центральным моментом в работе современных... Теоретический минимум по Big Data [Всё что нужно знать о больших данных]](https://www.rulit.me/data/programs/images/teoreticheskij-minimum-po-big-data-vsyo-chto-nuzhno-znat-o-b_590848.jpg)


![Книга Тома Демарко и Тимоти Листера «Человеческий фактор: успешные проекты и команды» – перевод 2-го издания всемирно известного бестселлера об управлении... Человеческий фактор [Успешные проекты и команды]](https://www.rulit.me/data/programs/images/chelovecheskij-faktor-uspeshnye-proekty-i-komandy_561222.jpg)



![Изучение всех возможностей Python — сложная задача, а с этой книгой вы сможете сосредоточиться на практических навыках, которые действительно важны. Раскопайте... Чистый Python [Тонкости программирования для профи]](https://www.rulit.me/data/programs/images/chistyj-python-tonkosti-programmirovaniya-dlya-profi_554913.jpg)
Комментарии к книге "Spark в действии"