Datenanalyse und Daten-Management mit Apache Spark

Cover Image

Apache Spark ist ein Open-Source-Framework, das seit 2014 als Top-Level-Projekt der Apache Software Foundation eingestuft ist. Spark soll einige Mängel von Hadoop MapReduce ausgleichen. Zudem hat das Framework den Ruf einer Allzwecktechnologie, die für maschinelles Lernen, Data Streaming, Graphenverarbeitung und SQL-Abfragen geeignet ist.

Dieses E-Handbook soll den Stärken und Schwächen von Spark auf den Grund gehen. Der erste Artikel bietet einen Einblick in die Entwicklung von Apache Spark. Im zweiten Artikel widmet sich der Experte den Datenanalysefähigkeiten des Frameworks. Der dritte Beitrag benennt die fünf Komponenten von Spark: Spark Core, Spark SQL, Spark Streaming, Mlib Machine Learning Library und GraphX. Im vierten und fünften Artikel diskutieren unsere Autoren die Unterschiede zwischen Spark und Hadoop und in welchen Einsatzszenarien sich beide ergänzen.

Anbieter:
TechTarget ComputerWeekly.de
Veröffentlicht am:
08.02.2021
Verfasst am:
04.03.2016
Format:
PDF
Typ:
E-Book
Bereits Bitpipe.com-Mitglied? Anmeldung

Laden Sie dieses E-Book herunter!