Narzędzie Big Data Open Source

OpenRefine Narzędzie Big Data Open Source

Bezpłatne rozwiązanie dużych zbiorów danych do obsługi złożonych danych na dużą skalę

Potężna bezpłatna platforma dużych zbiorów danych do eksploracji, transformacji i pogodzenia na dużą skalę niechlujnych danych. Rozszerz go o usługi internetowe i zewnętrzne zestawy danych.

Przegląd

OpenRefine (wcześniej Google Refine) jest narzędziem dużych zbiorów danych typu open source do pracy ze złożonymi zestawami danych. Jest to bezpłatna platforma dużych zbiorów danych do manipulowania danymi. Pomaga użytkownikom oczyścić pomieszane dane i przekonwertować je na inny format. Ponadto OpenRefine umożliwia rozszerzenie zestawów danych o różne usługi internetowe. OpenRefine ma interfejs API, który może być wykorzystany do integracji z usługami stron trzecich i automatyzacji operacji. Rozszerzenia można wykorzystać do rozszerzenia tego rozwiązania Big Data. Użytkownicy mogą łatwo pobrać i zainstalować rozszerzenia, aby poprawić funkcjonalność programu. Badanie, aspekty, transformacja, uzgadnianie, eksportowanie i wiele innych funkcji jest dostępnych w OpenRefine do pracy z zestawami danych. FACETING umożliwia użytkownikom wyszukiwanie kolumny w poszukiwaniu wzorów, trendów i zmienności danych. Funkcja ekspresji w OpenRefine pozwala użytkownikom czyścić i przekształcić dane. Wikidata to bezpłatne i otwarte źródło wiedzy, które zarówno ludzie, jak i maszyny mogą czytać i edytować. OpenRefine ma funkcję, która pozwala użytkownikom pobierać i dodawać dane do Wikidata. Ma solidne narzędzie do eksportowania danych do różnych formatów i źródeł zewnętrznych. Użytkownicy mogą przesyłać dane do arkuszy Google i dodawać je również do Wikidata. To narzędzie Big Data Open Source jest dostępne dla systemów operacyjnych Windows, Mac i Linux. Użytkownicy mogą znaleźć biblioteki innych firm dla różnych języków programowania, takich jak PHP, Java, Python, Ruby i wiele innych do automatyzacji operacji. OpenRefine jest napisane w Javie, a licencją na to duże rozwiązanie to BSD-3.

Wymagania systemowe

Aby zainstalować OpenRefine, musisz mieć następujące oprogramowanie:

  • Java 8
  • Apache Maven

Cechy

Poniżej znajdują się kluczowe cechy OpenRefine:

  • Bezpłatne i open source
  • Czyszczenie i filtrowanie danych
  • Importuj dane z różnych formatów
  • uzgadnianie danych i dopasowanie
  • Niestandardowy język zapytania z wsparciem Grel i Python
  • Wzbogacaj dane za pośrednictwem interfejsów API
  • Transformacja danych
  • Łączenie danych
  • Zaawansowane operacje danych

Instalacja

Instalowanie w Linux

Uruchom poniżej polecenie, aby pobrać OpenRefine.

$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz

Wyodrębnij pobrany plik, uruchamiając poniżej polecenie.

$ tar -xzf openrefine-linux-3.4.1.tar.gz

Rozpocznij OpenRefine.

$ ./refine

Rafinu otworzy się w przeglądarce internetowej. Jeśli nie uruchomi się automatycznie, wpisz http: // localhost: 3333, aby uzyskać do niego dostęp.

Instalowanie na Mac

Pobierz zestaw Mac z httpsopenrefineorgdownloadhtml. Otwórz i przeciągnij ikonę do folderu aplikacji. Dwukrotnie kliknij ikonę, a dopracowanie otworzy się w przeglądarce internetowej.

Instalowanie w systemie Windows

Pobierz zestaw Windows z httpsopenrefineorgdownloadhtml. Rozpruj pobrany plik i kliknij dwukrotnie plik refine.bat. Rafinu otworzy się w przeglądarce internetowej. Jeśli nie uruchomi się automatycznie, wpisz http: // localhost: 3333, aby uzyskać do niego dostęp.

Badać

Możesz znaleźć istotne następujące linki:

 Polski