ओपन सोर्स बिग डेटा टूल

OpenRefine ओपन सोर्स बिग डेटा टूल

बड़े पैमाने पर जटिल डेटा को संभालने के लिए मुफ्त बड़ा डेटा समाधान

बड़े पैमाने पर गन्दा डेटा की खोज, रूपांतरण और सामंजस्य स्थापित करने के लिए शक्तिशाली मुक्त बिग डेटा प्लेटफॉर्म। इसे वेब सेवाओं और बाहरी डेटासेट के साथ विस्तारित करें।

अवलोकन

OpenRefine (पहले Google रिफाइन) जटिल डेटासेट के साथ काम करने के लिए एक खुला स्रोत बड़ा डेटा टूल है। यह डेटा में हेरफेर करने के लिए एक मुफ्त बड़ा डेटा प्लेटफ़ॉर्म है। यह उपयोगकर्ताओं को गड़बड़-अप डेटा को साफ करने और इसे एक अलग प्रारूप में बदलने में मदद करता है। इसके अलावा, OpenRefine विभिन्न वेब सेवाओं के साथ डेटासेट का विस्तार करने की अनुमति देता है। OpenRefine में एक API है जिसका उपयोग तृतीय-पक्ष सेवाओं और स्वचालित संचालन के साथ एकीकृत करने के लिए किया जा सकता है। इस बड़े डेटा समाधान का विस्तार करने के लिए एक्सटेंशन का उपयोग किया जा सकता है। उपयोगकर्ता कार्यक्रम की कार्यक्षमता को बेहतर बनाने के लिए आसानी से एक्सटेंशन डाउनलोड और इंस्टॉल कर सकते हैं। डेटासेट के साथ काम करने के लिए OpenRefine में खोज, पहलू, रूपांतरण, सामंजस्य, निर्यात, और कई और सुविधाएँ उपलब्ध हैं। FACETING उपयोगकर्ताओं को पैटर्न, रुझान और डेटा भिन्नता के लिए एक कॉलम खोजने की अनुमति देता है। OpenRefine में अभिव्यक्ति सुविधा उपयोगकर्ताओं को डेटा को साफ करने और बदलने की अनुमति देती है। विकिदाटा एक स्वतंत्र और खुला ज्ञान स्रोत है जिसे दोनों मनुष्य और मशीनें पढ़ सकते हैं और संपादित कर सकते हैं। OpenRefine में एक सुविधा होती है जो उपयोगकर्ताओं को विकीडाटा में डेटा लाने और जोड़ने की अनुमति देती है। इसमें विभिन्न प्रकार के प्रारूपों और बाहरी स्रोतों में डेटा निर्यात करने के लिए एक मजबूत उपकरण है। उपयोगकर्ता Google शीट पर डेटा अपलोड कर सकते हैं और इसे विकिदाटा में भी जोड़ सकते हैं। यह ओपन सोर्स बिग डेटा टूल विंडोज, मैक और लिनक्स ऑपरेटिंग सिस्टम के लिए उपलब्ध है। उपयोगकर्ता विभिन्न प्रोग्रामिंग भाषाओं जैसे कि PHP, Java, Python, Ruby, और कई और अधिक संचालन को स्वचालित करने के लिए तृतीय-पक्ष पुस्तकालय पा सकते हैं। OpenRefine जावा में लिखा गया है और इस बड़े समाधान के लिए लाइसेंस BSD-3 है।

सिस्टम आवश्यकताएं

OpenRefine स्थापित करने के लिए, आपके पास निम्नलिखित सॉफ्टवेयर्स होने चाहिए:

  • जावा 8
  • अपाचे मावेन

विशेषताएँ

निम्नलिखित OpenRefine की प्रमुख विशेषताएं हैं:

  • मुक्त और खुला स्रोत
  • डेटा सफाई और फ़िल्टरिंग
  • विभिन्न प्रारूपों से डेटा आयात करें
  • डेटा सामंजस्य और मिलान
  • ग्रेल और पायथन समर्थन के साथ कस्टम क्वेरी भाषा
  • एपीआई के माध्यम से डेटा को समृद्ध करें
  • डेटा में परिवर्तन
  • डेटा लिंकिंग
  • उन्नत डेटा संचालन

स्थापना

लिनक्स पर स्थापित करना

OpenRefine डाउनलोड करने के लिए कमांड के नीचे चलाएं।

$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz

नीचे कमांड चलाकर डाउनलोड की गई फ़ाइल को निकालें।

$ tar -xzf openrefine-linux-3.4.1.tar.gz

OpenRefine शुरू करें।

$ ./refine

फिर रिफाइन आपके वेब ब्राउज़र में खुलेगा। यदि यह स्वचालित रूप से शुरू नहीं होता है, तो इसे एक्सेस करने के लिए http: // localhost: 3333 टाइप करें।

मैक पर स्थापित करना

httpsopenrefineorgdownodehtml से मैक किट डाउनलोड करें। एप्लिकेशन फ़ोल्डर में आइकन खोलें और खींचें। आइकन पर डबल क्लिक करें और रिफाइन वेब ब्राउज़र में खुलेगा।

विंडोज पर स्थापित करना

httpsopenrefineorgdownodehtml से विंडोज किट डाउनलोड करें। डाउनलोड की गई फ़ाइल को अनज़िप करें और Refine.bat फ़ाइल पर डबल-क्लिक करें। फिर रिफाइन आपके वेब ब्राउज़र में खुलेगा। यदि यह स्वचालित रूप से शुरू नहीं होता है, तो इसे एक्सेस करने के लिए http: // localhost: 3333 टाइप करें।

अन्वेषण करना

आपको निम्नलिखित लिंक प्रासंगिक मिल सकते हैं:

 हिन्दी