Open Source Big Data Tool

OpenRefine Open Source Big Data Tool

Kostenlose Big Data -Lösung für die Behandlung von Komplexdaten in großem Maßstab

Leistungsstarke kostenlose Big-Data-Plattform zum Erforschen, Transformieren und Umzugsumzug großer unordentlicher Daten. Erweitern Sie es mit Webdiensten und externen Datensätzen.

Überblick

OpenRefine (zuvor Google Refine) ist ein Open -Source -Big -Data -Tool für die Arbeit mit komplexen Datensätzen. Es ist eine kostenlose Big -Data -Plattform zum Manipulieren von Daten. Es hilft Benutzern, durcheinandergebrachte Daten aufzuräumen und sie in ein anderes Format zu konvertieren. Darüber hinaus ermöglicht OpenRefine die Erweiterung von Datensätzen mit verschiedenen Webdiensten. OpenRefine verfügt über eine API, die verwendet werden kann, um in Dienste von Drittanbietern integriert zu werden und den Betrieb zu automatisieren. Die Erweiterungen können verwendet werden, um diese Big -Data -Lösung zu erweitern. Benutzer können Erweiterungen problemlos herunterladen und installieren, um die Funktionalität des Programms zu verbessern. Erkunden, Facetten, Transformieren, Versöhnung, Exportieren und viele weitere Funktionen sind in OpenRefine für die Arbeit mit Datensätzen erhältlich. Mit Faceting können Benutzer eine Spalte nach Mustern, Trends und Datenschwankungen durchsuchen. Die Expressionsfunktion in OpenRefine ermöglicht es Benutzern, Daten zu reinigen und zu transformieren. Wikidata ist eine kostenlose und offene Wissensquelle, die sowohl Menschen als auch Maschinen lesen und bearbeiten können. OpenRefine verfügt über eine Funktion, mit der Benutzer Daten abrufen und zu Wikidata hinzufügen können. Es verfügt über ein robustes Instrument zum Exportieren von Daten in eine Vielzahl von Formaten und externen Quellen. Benutzer können Daten in Google Sheets hochladen und sie auch zu Wikidata hinzufügen. Dieses Open -Source -Big -Data -Tool ist für Windows-, Mac- und Linux -Betriebssysteme verfügbar. Benutzer finden Drittanbieter Bibliotheken für verschiedene Programmiersprachen wie PHP, Java, Python, Ruby und vieles mehr für die Automatisierung der Vorgänge. OpenRefine ist in Java geschrieben und die Lizenz für diese große Lösung ist BSD-3.

System Anforderungen

Um OpenRefine zu installieren, müssen Sie die folgenden Software haben:

  • Java 8
  • Apache Maven

Merkmale

Im Folgenden finden Sie die wichtigsten Merkmale von OpenRefine:

  • Frei und Open Source
  • Datenreinigung und Filterung
  • Daten aus verschiedenen Formaten importieren
  • Datenabstimmung und Übereinstimmung
  • Benutzerdefinierte Abfragesprache mit Grel und Python -Unterstützung
  • Daten über APIs bereichern
  • Transformation von Daten
  • Verknüpfung von Daten
  • Fortgeschrittene Datenoperationen

Installation

Installieren auf Linux

Führen Sie den Befehl unten aus, um das OpenRefine herunterzuladen.

$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz

Extrahieren Sie die heruntergeladene Datei, indem Sie den Befehl unten ausführen.

$ tar -xzf openrefine-linux-3.4.1.tar.gz

Starten Sie das OpenRefine.

$ ./refine

Refine wird dann in Ihrem Webbrowser geöffnet. Wenn es nicht automatisch beginnt, geben Sie http: // localhost: 3333 ein, um darauf zuzugreifen.

Installieren auf dem Mac

Laden Sie das Mac -Kit von httpsopenRefineOrgdownloadhtml herunter. Öffnen und ziehen Sie das Symbol in den Anwendungsordner. Doppelklicken Sie auf das Symbol und die Refine wird im Webbrowser geöffnet.

Installieren unter Windows

Laden Sie Windows Kit von httpsopenRefineOrgdownloadhtml herunter. Entpacken Sie die heruntergeladene Datei und doppelklicken Sie auf die Datei refine.bat. Refine wird dann in Ihrem Webbrowser geöffnet. Wenn es nicht automatisch beginnt, geben Sie http: // localhost: 3333 ein, um darauf zuzugreifen.

Erkunden

Möglicherweise finden Sie die folgenden Links relevant:

 Deutsch