Open Source Big Data Tool

Hadoop Bezplatný nástroj Big Data

Analyzujte složité soubory dat pomocí softwaru Big Data Analytics

Rychlejší zpracování složitých dat s volnými a open sourcemi velkými datovými nástroji. Řešit obrovský objem, rozmanitost datových souborů a zlepšení obchodního rozhodování.

Přehled

Hadoop je bezplatný a otevřený zdrojový nástroj Big Data. Je robustní, spolehlivý a škálovatelný software pro analýzu velkých dat. HDFS (vysoko distribuovaný systém souborů), MapReduce a příze jsou tři klíčové komponenty Hadoop. HDFS je úložná vrstva, která se skládá ze dvou druhů uzlů: Namenodes a Datanodes. Metadata o umístění bloku jsou uložena v Namenode. V předem stanoveném období DataNodes uloží blok a odesílá zprávy o blocích do NameNode. Vrstva zpracování MapReduce je rozdělena do dvou fází: fáze mapy a fáze redukce. Je určen pro souběžné zpracování dat, které je distribuováno v několika uzlech. V Hadoop Big Data je YARN plánování úloh a vrstva správy zdrojů. Hadoop je jedním z nejlepších velkých datových softwaru pro zpracování velkých dat. HADOOP Cluster je vysoce škálovatelný, takže umožňuje horizontální a vertikální škálování na rámec Hadoop. Má funkci tolerance poruch, která se spoléhá na replikační mechanismus, aby byla zajištěna tolerance poruch. Hadoop zajišťuje, že data jsou stále k dispozici, i když se věci nedaří dobře. Pokud jeden z DataNodes selže, může uživatel přistupovat k datům z jiných Datanodů, které mají kopii stejných dat. Hadoop je distribuovaný systém ukládání dat, který umožňuje zpracování dat prostřednictvím shluku uzlů. Výsledkem je, že poskytuje rámec Hadoop Lightning-rychlé zpracování.

Požadavky na systém

Chcete -li nainstalovat Hadoop, musíte mít následující software:

  • Java
  • Uživatel s oprávněními sudo

Funkce

Následující jsou klíčové rysy Hadoopu:

  • Zdarma a open source
  • rychlejší zpracování dat
  • Distribuované zpracování
  • Odolnost proti chybám
  • Spolehlivé a škálovatelné
  • Snadno použitelné a nákladově efektivní
  • Datová lokalita
  • Vysoká dostupnost dat

Instalace

Nainstalujte hadoop na ubuntu

Nejprve spusťte pod příkazem nainstalovat server OpenSSH a klienta.

sudo apt install openssh-server openssh-client -y

Spusťte příkaz ke stažení Hadoop.

wget https://downloads.apache.org/hadoop/common/hadoop-3.2.1/hadoop-3.2.1.tar.gz

Extrahujte soubory pro zahájení instalace Hadoop.

tar xzf hadoop-3.2.1.tar.gz

Prozkoumejte

Následující odkazy můžete považovat za relevantní:

 Čeština