منبع باز منبع بزرگ

OpenRefine منبع باز منبع بزرگ

راه حل داده بزرگ رایگان برای رسیدگی به داده های پیچیده در مقیاس بزرگ

پلتفرم بزرگ داده بزرگ قدرتمند برای کاوش ، تغییر و آشتی داده های کثیف در مقیاس بزرگ. آن را با خدمات وب و مجموعه داده های خارجی گسترش دهید.

بررسی اجمالی

OpenRefine (که قبلاً Google Refine بود) ابزاری برای منبع باز منبع باز برای کار با مجموعه داده های پیچیده است. این یک بستر داده بزرگ رایگان برای دستکاری داده ها است. این به کاربران کمک می کند تا داده های آشفته را تمیز کرده و آن را به قالب دیگری تبدیل کنند. علاوه بر این ، OpenRefine اجازه می دهد تا مجموعه داده ها با خدمات مختلف وب گسترش یابد. OpenRefine دارای API است که ممکن است برای ادغام با خدمات شخص ثالث و اتوماسیون عملیات استفاده شود. از پسوندها می توان برای گسترش این راه حل داده بزرگ استفاده کرد. کاربران می توانند به راحتی برای بهبود عملکرد برنامه ، برنامه های افزودنی را بارگیری و نصب کنند. کاوش ، جنبه ها ، تبدیل ، آشتی ، صادرات و بسیاری از ویژگی های دیگر در OpenRefine برای کار با مجموعه داده ها در دسترس است. FaceTing به کاربران امکان می دهد ستون را برای الگوهای ، روندها و تغییر داده ها جستجو کنند. ویژگی بیان در OpenRefine به کاربران اجازه می دهد تا داده ها را تمیز و دگرگون کنند. Wikidata یک منبع دانش آزاد و آزاد است که هم انسان و هم ماشین ها می توانند بخوانند و ویرایش کنند. OpenRefine دارای یک ویژگی است که به کاربران امکان می دهد داده ها را به ویکیداتا واکشی و اضافه کنند. این یک ابزار قوی برای صادرات داده ها به انواع مختلف و منابع خارجی است. کاربران می توانند داده ها را در برگه های Google بارگذاری کرده و آن را به Wikidata نیز اضافه کنند. این ابزار بزرگ منبع باز برای سیستم عامل های ویندوز ، مک و لینوکس در دسترس است. کاربران می توانند کتابخانه های شخص ثالث را برای زبانهای مختلف برنامه نویسی مانند PHP ، Java ، Python ، Ruby و بسیاری دیگر برای خودکار سازی عملیات پیدا کنند. OpenRefine در جاوا نوشته شده است و مجوز این راه حل بزرگ BSD-3 است.

الزامات سیستم

برای نصب OpenRefine ، باید نرم افزارهای زیر را داشته باشید:

  • جاوا 8
  • آپاچی مون

امکانات

در زیر ویژگی های اصلی OpenRefine وجود دارد:

  • منبع آزاد و آزاد
  • تمیز کردن و فیلتر داده ها
  • داده ها را از قالب های مختلف وارد کنید
  • آشتی داده ها و تطبیق
  • زبان پرس و جو سفارشی با پشتیبانی گرل و پایتون
  • داده ها را از طریق API غنی کنید
  • تحول داده ها
  • پیوند داده ها
  • عملیات داده های پیشرفته

نصب و راه اندازی

نصب در لینوکس

برای بارگیری OpenRefine در زیر دستور اجرا کنید.

$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz

فایل بارگیری شده را با اجرای دستور زیر استخراج کنید.

$ tar -xzf openrefine-linux-3.4.1.tar.gz

OpenRefine را شروع کنید.

$ ./refine

سپس پالایش در مرورگر وب شما باز خواهد شد. اگر به طور خودکار شروع نشود ، برای دسترسی به آن ، http: // localhost: 3333 را تایپ کنید.

نصب در مک

کیت MAC را از httpsopenrefineorgdownloadhtml بارگیری کنید. نماد را به پوشه برنامه ها باز و بکشید. بر روی نماد دوبار کلیک کنید و پالایش در مرورگر وب باز خواهد شد.

نصب در ویندوز

کیت ویندوز را از httpsopenrefineorgdownloadhtml بارگیری کنید. فایل بارگیری شده را از حالت فشرده خارج کرده و روی پرونده refin.bat دو بار کلیک کنید. سپس پالایش در مرورگر وب شما باز خواهد شد. اگر به طور خودکار شروع نشود ، برای دسترسی به آن ، http: // localhost: 3333 را تایپ کنید.

کاوش

ممکن است پیوندهای زیر را پیدا کنید:

 فارسی