Аннотация
Учебно-методическое пособие содержит теоретический материал и примеры выполнения задач для курса «Введение в технологии обработки больших данных». Пособие составлено с учётом проведения лабораторных работ с помощью фреймворка Apache Spark. Содержание дисциплины охватывает круг вопросов, связанных с организацией построения ETL-конвейеров на основе Spark SQL и DataFrame API для распределенного выполнения на кластерных вычислительных система, включая использование итеративных вычислений, важных для машинного обучения, рассмотрения shuffle механизмов и принципов организации управлением памятью в Spark.
В результате освоения дисциплины студенты приобретают способности разработки программ и построения конвейеров обработки различных данных, навыки по работе с распределенными кластерными системами, а также способности к применению машинного обучения на распределенных наборах данных.



![СОДЕРЖАНИЕ НОМЕРА:
В Новый год — в новых форматах. Автор: Сергей Вильянов.
Железо-2009: победы и достижения. Автор: Алексей Стародымов.
BrowserLinux: проще некуда.... Цифровой журнал «Компьютерра» № 1 [25.12.2009 — 1.1.2010]](https://www.rulit.me/data/programs/images/cifrovoj-zhurnal-kompyuterra-1-25-12-2009-1-1-2010_169876.jpg)


Комментарии к книге "Обработка больших данных с Apache Spark"