Обработка больших данных с Apache Spark

Описание книги

Учебно-методическое пособие содержит теоретический материал и примеры выполнения задач для курса «Введение в технологии обработки больших данных». Пособие составлено с учётом проведения лабораторных работ с помощью фреймворка Apache Spark. Содержание дисциплины охватывает круг вопросов, связанных с организацией построения ETL-конвейеров на основе Spark SQL и DataFrame API для распределенного выполнения на кластерных вычислительных система, включая использование итеративных вычислений, важных для машинного обучения, рассмотрения shuffle механизмов и принципов организации управлением памятью в Spark. В результате освоения дисциплины студенты приобретают способности разработки программ и построения конвейеров обработки различных данных, навыки по работе с распределенными кластерными системами, а также способности к применению машинного обучения на распределенных наборах данных.
читать полностью

Подробная информация

  • Год издания: 2019
  • Язык: Русский
  • Количество страниц: 52
  • Дата поступления: 24.05.2020
Обработка больших данных с Apache Spark
  • 0.00
  • Количество оценок: 0
  • Просмотров: 29
Оцените книгу