Hadoop Δωρεάν εργαλείο μεγάλων δεδομένων
Αναλύστε σύνθετα σύνολα δεδομένων με λογισμικό μεγάλης ανάλυσης δεδομένων
Ταχύτερη επεξεργασία σύνθετων δεδομένων με ελεύθερα και ανοιχτά εργαλεία μεγάλων δεδομένων. Αντιμετωπίστε τον τεράστιο όγκο, την ποικιλία των συνόλων δεδομένων και τη βελτίωση της λήψης αποφάσεων επιχειρήσεων.
ΣΦΑΙΡΙΚΗ ΕΙΚΟΝΑ
Το Hadoop είναι ένα ελεύθερο και ανοιχτό εργαλείο μεγάλων δεδομένων. Είναι εύρωστο, αξιόπιστο και κλιμακωτό λογισμικό μεγάλων αναλύσεων δεδομένων. HDFS (υψηλό κατανεμημένο σύστημα αρχείων), MapReduce και νήματα είναι τα τρία βασικά συστατικά του Hadoop. Το HDFS είναι ένα στρώμα αποθήκευσης που αποτελείται από δύο είδη κόμβων: ονόματα και datanodes. Τα μεταδεδομένα σχετικά με την τοποθεσία ενός μπλοκ αποθηκεύονται στο Namenode. Σε μια προκαθορισμένη περίοδο, το DataNodes αποθηκεύει το μπλοκ και στέλνει αναφορές μπλοκ στο NameNode. Το στρώμα επεξεργασίας MapReduce χωρίζεται σε δύο φάσεις: τη φάση του χάρτη και τη φάση μείωσης. Προορίζεται για ταυτόχρονη επεξεργασία δεδομένων που διανέμονται σε διάφορους κόμβους. Στο Hadoop Big Data, το YARN είναι το επίπεδο προγραμματισμού εργασίας και διαχείρισης πόρων. Το Hadoop είναι ένα από τα καλύτερα μεγάλα λογισμικά δεδομένων για την επεξεργασία μεγάλων δεδομένων. Το Hadoop cluster είναι εξαιρετικά κλιμακωτό, οπότε επιτρέπει την οριζόντια και κατακόρυφη κλιμάκωση στο πλαίσιο Hadoop. Έχει μια συνάρτηση ανοχής σφάλματος που βασίζεται σε έναν μηχανισμό αναπαραγωγής για να εξασφαλίσει την ανοχή σφάλματος. Ο Hadoop εξασφαλίζει ότι τα δεδομένα είναι ακόμα διαθέσιμα, ακόμη και όταν τα πράγματα δεν πάνε καλά. Εάν ένα από τα datanodes αποτύχει, ο χρήστης μπορεί να έχει πρόσβαση σε δεδομένα από άλλα datanodes που έχουν αντίγραφο των ίδιων δεδομένων. Το Hadoop είναι ένα κατανεμημένο σύστημα αποθήκευσης δεδομένων που επιτρέπει την επεξεργασία δεδομένων μέσω ενός συστάδων κόμβων. Ως αποτέλεσμα, δίνει στο Hadoop Framework Lightning-Fast δυνατότητες επεξεργασίας.
Απαιτήσεις συστήματος
Για να εγκαταστήσετε το Hadoop, πρέπει να έχετε τα ακόλουθα λογισμικά:
- Java
- Χρήστης με προνόμια sudo
Χαρακτηριστικά
Ακολουθούν τα βασικά χαρακτηριστικά του Hadoop:
- Δωρεάν και ανοιχτή πηγή
- ταχύτερη επεξεργασία δεδομένων
- Κατανεμημένη επεξεργασία
- Ανοχή σε σφάλματα
- αξιόπιστο και κλιμακωτό
- Εύκολο στη χρήση και οικονομικά αποδοτική
- Τοποθεσία δεδομένων
- Υψηλή διαθεσιμότητα δεδομένων
Εγκατάσταση
Εγκατάσταση Hadoop στο Ubuntu
Πρώτον, εκτελέστε κάτω από την εντολή για να εγκαταστήσετε τον διακομιστή OpenSSH και τον πελάτη.
sudo apt install openssh-server openssh-client -y
Εκτέλεση εντολής για λήψη του Hadoop.
wget https://downloads.apache.org/hadoop/common/hadoop-3.2.1/hadoop-3.2.1.tar.gz
Εξαγάγετε τα αρχεία για να ξεκινήσετε την εγκατάσταση Hadoop.
tar xzf hadoop-3.2.1.tar.gz