Издательство ДМК Пресс
Официальный сайт издательства ДМК Пресс

Издание книг dmkpress@gmail.com

Оптовая продажа books@alians-kniga.ru

Моя корзина
В корзине нет ни одного товара

Изучаем Spark

Изучаем Spark
Автор: Захария М., Венделл П., Конвински Э., Карау Х.
Дата выхода: 30 июня 2015 года
Формат: 148 * 210 мм
Бумага: офсетная
Обложка: Мягкая обложка
Объем, стр.: 400
ISBN: 978-5-97060-323-9
Вес, гр.: 700

Оглавление и отрывки из глав

Аннотация к книге

«Книга «Изучаем Spark» занимает первые позиции в моем списке рекомендаций для тех, кто желает познакомиться с этим популярным фреймворком с целью создания приложений для обработки огромных объемов данных.» – Бен Лорика (Ben Lorica), ведущий специалист по работе с данными, O’Reilly Media

Объем обрабатываемых данных во всех областях человеческой деятельности продолжает расти быстрыми темпами. Существуют ли эффективные приемы работы с ним? В этой книге рассказывается об Apache Spark, открытой системе кластерных вычислений, которая позволяет быстро создавать высокопроизводительные программы анализа данных. C помощью Spark вы сможете манипулировать огромными объемами данных посредством простого API на Python, Java и Scala.

Написанная разработчиками Spark, эта книга поможет исследователям данных и программистам быстро включиться в работу. Она расскажет, как организовать параллельное выполнение заданий всего несколькими строчками кода, и охватывает примеры от простых пакетных приложений до программ, осуществляющих обработку потоковых данных и использующих алгоритмы машинного обучения.

С помощью этой книги вы:

  • познакомитесь с особенностями Spark, такими как распределенные наборы данных, кэширование в памяти и интерактивные оболочки;
  • изучите мощные встроенные библиотеки Spark, включая Spark SQL, Spark Streaming и MLlib;
  • научитесь пользоваться единой парадигмой программирования вместо смеси инструментов, таких как Hive, Hadoop, Mahout и Storm;
  • узнаете, как развертывать интерактивные, пакетные и потоковые приложения;
  • исследуете возможности использования разных источников данных, включая HDFS, Hive, JSON и S3;
  • овладеете продвинутыми приемами программирования на основе Spark, такими как разделение данных на разделы и применение совместно используемых переменных.

Рецензия на книгу опубликована в блоге Александра Крота http://mlclass.ru/kniga-learning-spark/