Apache Hadoop ist ein Framework für den Betrieb von Computerclustern. Er ermöglicht die Speicherung verteilter Daten (ein verteiltes Dateisystem) und die parallele Datenverarbeitung über die Knoten eines Clusters hinweg. Sie können...