Аннотация
Apache Spark is written in Scala programming language. To support Python with Spark, Apache Spark community released a tool, PySpark. Using PySpark, you can work with RDDs in Python programming language also. It is because of a library called Py4j that they are able to achieve this.
This is an introductory tutorial, which covers the basics of Data-Driven Documents and explains how to deal with its various components and sub-components.
Audience This tutorial is prepared for those professionals who are aspiring to make a career in programming language and real-time processing framework. This tutorial is intended to make the readers comfortable in getting started with PySpark along with its various modules and submodules.

![В этой книге Том ДеМарко и Тимоти Листер, авторы бестселлера Peopleware, рассказывают, как идентифицировать риски, управлять ими и извлекать выгоду из рисков.
... Вальсируя с медведями [Управление рисками в проектах по разработке программного обеспечения]](https://www.rulit.me/data/programs/images/valsiruya-s-medvedyami-upravlenie-riskami-v-proektah-po-razr_561573.jpg)
![Находясь на переднем крае программирования, книга «Программист-прагматик. Путь от подмастерья к мастеру» абстрагируется от всевозрастающей специализации и... Программист-прагматик [Путь от подмастерья к мастеру]](https://www.rulit.me/data/programs/images/programmist-pragmatik-put-ot-podmasterya-k-masteru_563230.jpg)




![Изучение всех возможностей Python — сложная задача, а с этой книгой вы сможете сосредоточиться на практических навыках, которые действительно важны. Раскопайте... Чистый Python [Тонкости программирования для профи]](https://www.rulit.me/data/programs/images/chistyj-python-tonkosti-programmirovaniya-dlya-profi_554913.jpg)
Комментарии к книге "PySpark"