Аннотация
Учебно-методическое пособие содержит теоретический материал и примеры выполнения задач для курса «Введение в технологии обработки больших данных». Пособие составлено с учётом проведения лабораторных работ с помощью фреймворка Apache Spark. Содержание дисциплины охватывает круг вопросов, связанных с организацией построения ETL-конвейеров на основе Spark SQL и DataFrame API для распределенного выполнения на кластерных вычислительных система, включая использование итеративных вычислений, важных для машинного обучения, рассмотрения shuffle механизмов и принципов организации управлением памятью в Spark.
В результате освоения дисциплины студенты приобретают способности разработки программ и построения конвейеров обработки различных данных, навыки по работе с распределенными кластерными системами, а также способности к применению машинного обучения на распределенных наборах данных.
![Сборник самых разных java-исходников для начинающих разработчиков, пишущих под android или создающих десктопные java-приложения. Сборник ориентирован именно на... Java Code [Сборник исходников]](https://www.rulit.me/data/programs/images/java-code-sbornik-ishodnikov_606111.jpg)




![Новая дополненная версия 3.0 руководства по созданию книг формата Fb2 в FictionBook Editor V 2.66. Обложка сделана... FictionBook Editor V 2.66 [Руководство по созданию книг]](https://www.rulit.me/data/programs/images/fictionbook-editor-v-2-66-rukovodstvo-po-sozdaniyu-knig_563954.jpg)

Комментарии к книге "Обработка больших данных с Apache Spark"