Аннотация
Apache Spark is written in Scala programming language. To support Python with Spark, Apache Spark community released a tool, PySpark. Using PySpark, you can work with RDDs in Python programming language also. It is because of a library called Py4j that they are able to achieve this.
This is an introductory tutorial, which covers the basics of Data-Driven Documents and explains how to deal with its various components and sub-components.
Audience This tutorial is prepared for those professionals who are aspiring to make a career in programming language and real-time processing framework. This tutorial is intended to make the readers comfortable in getting started with PySpark along with its various modules and submodules.



![Эта книга для тех, кто давно связан с разработкой программного обеспечения. Или для тех, кто еще думает выбрать программирование своей профессией. Или для тех, кто... Дефрагментация мозга [Софтостроение изнутри]](https://www.rulit.me/data/programs/images/defragmentaciya-mozga-softostroenie-iznutri_567023.jpg)

![Эта книга представляет собой рецепты программирования на языке Java, описывающие нововведения версий 8 и 9. В книге вы найдете массу примеров кода, демонстрирующих... Современный Java [Рецепты программирования]](https://www.rulit.me/data/programs/images/sovremennyj-java-recepty-programmirovaniya_606104.jpg)
Комментарии к книге "PySpark"