منبع باز منبع بزرگ

Hadoop ابزار داده بزرگ رایگان

مجموعه داده های پیچیده را با نرم افزار Big Data Analytics تجزیه و تحلیل کنید

پردازش سریعتر داده های پیچیده با ابزارهای داده بزرگ منبع آزاد و منبع باز. با حجم گسترده ، مجموعه داده های مختلف و بهبود تصمیم گیری در تجارت مقابله کنید.

بررسی اجمالی

Hadoop یک ابزار بزرگ داده آزاد و منبع باز است. این نرم افزار قوی ، قابل اعتماد و مقیاس پذیر است. HDFS (سیستم فایل توزیع بالا) ، MapReduce و نخ سه مؤلفه اصلی Hadoop هستند. HDFS یک لایه ذخیره سازی است که از دو نوع گره تشکیل شده است: Namenodes و DataNodes. ابرداده در مورد محل بلوک در Namenode ذخیره می شود. در یک دوره از پیش تعیین شده ، DataNodes بلوک را ذخیره می کند و گزارش های بلوک را به Namenode ارسال می کند. لایه پردازش MapReduce به دو مرحله تقسیم می شود: مرحله نقشه و مرحله کاهش. این برای پردازش همزمان داده هایی که در چندین گره توزیع می شود در نظر گرفته شده است. در Hadoop Big Data ، نخ ، برنامه ریزی شغلی و لایه مدیریت منابع است. Hadoop یکی از بهترین نرم افزار داده های بزرگ برای پردازش داده های بزرگ است. خوشه Hadoop بسیار مقیاس پذیر است ، بنابراین امکان مقیاس افقی و عمودی به چارچوب Hadoop را فراهم می کند. این یک تابع تحمل خطا دارد که برای اطمینان از تحمل گسل به یک مکانیسم تکثیر متکی است. Hadoop تضمین می کند که داده ها هنوز در دسترس هستند ، حتی اگر اوضاع خوب پیش نرود. در صورت عدم موفقیت یکی از DataNodes ، کاربر می تواند به داده های دیگر داده های دیگر که دارای یک کپی از همان داده ها هستند ، دسترسی پیدا کند. Hadoop یک سیستم ذخیره سازی داده توزیع شده است که امکان پردازش داده ها از طریق یک خوشه از گره ها را فراهم می کند. در نتیجه ، این قابلیت پردازش سریع چارچوب Hadoop را می دهد.

الزامات سیستم

برای نصب Hadoop ، باید نرم افزارهای زیر را داشته باشید:

  • جاوا
  • کاربر با امتیازات سودو

امکانات

در زیر ویژگی های اصلی Hadoop:

  • منبع آزاد و آزاد
  • پردازش سریعتر داده ها
  • پردازش توزیع شده
  • تحمل خطا
  • قابل اعتماد و مقیاس پذیر
  • استفاده آسان و مقرون به صرفه
  • محل داده
  • در دسترس بودن بالای داده ها

نصب و راه اندازی

Hadoop را روی اوبونتو نصب کنید

ابتدا برای نصب سرور OpenSSH و مشتری ، زیر دستور را اجرا کنید.

sudo apt install openssh-server openssh-client -y

دستور اجرای Hadoop را اجرا کنید.

wget https://downloads.apache.org/hadoop/common/hadoop-3.2.1/hadoop-3.2.1.tar.gz

برای شروع نصب Hadoop پرونده ها را استخراج کنید.

tar xzf hadoop-3.2.1.tar.gz

کاوش

ممکن است پیوندهای زیر را پیدا کنید:

 فارسی