Strumento di big data open source

OpenRefine Strumento di big data open source

Soluzione gratuita di big data per gestire dati complessi su larga scala

Potente piattaforma di big data gratuita per esplorare, trasformare e riconciliazione di dati disordinati su larga scala. Estenderlo con servizi Web e set di dati esterni.

Panoramica ### ** ** OpenRefine (precedentemente Refine Google) è uno strumento Big Data open source per lavorare con set di dati complessi. È una piattaforma di big data gratuita per manipolare i dati. Aiuta gli utenti a ripulire i dati incasinati e convertirli in un formato diverso. Inoltre, OpenRefine consente di estendere i set di dati con vari servizi Web. OpenRefine ha un’API che può essere utilizzata per integrarsi con servizi di terze parti e automatizzare le operazioni. Le estensioni possono essere utilizzate per espandere questa soluzione di big data. Gli utenti possono facilmente scaricare e installare estensioni per migliorare la funzionalità del programma. Esplorare, sfaccettature, trasformazione, riconciliazione, esportazione e molte altre funzionalità sono disponibili in OpenRefine per lavorare con set di dati. La sfaccettatura consente agli utenti di cercare una colonna per modelli, tendenze e variazioni di dati. La funzione di espressione in OpenRefine consente agli utenti di pulire e trasformare i dati. Wikidata è una fonte di conoscenza libera e aperta che sia l’uomo che le macchine possono leggere e modificare. OpenRefine ha una funzione che consente agli utenti di recuperare e aggiungere dati a Wikidata. Ha uno strumento robusto per esportare dati in una varietà di formati e fonti esterne. Gli utenti possono caricare dati su fogli di Google e aggiungerli anche a Wikidata. Questo strumento Big Data open source è disponibile per i sistemi operativi Windows, Mac e Linux. Gli utenti possono trovare librerie di terze parti per vari linguaggi di programmazione come PHP, Java, Python, Ruby e molti altri per automatizzare le operazioni. OpenRefine è scritto in Java e la licenza per questa grande soluzione è BSD-3.

Requisiti di sistema

Per installare OpenRefine, è necessario disporre dei seguenti software:

  • Java 8
  • Apache Maven

Caratteristiche

Di seguito sono riportate le caratteristiche chiave di OpenRefine:

  • gratuito e open source
  • Pulizia e filtraggio dei dati
  • Importa dati da vari formati
  • Riconciliazione e corrispondenza dei dati
  • linguaggio di query personalizzato con supporto Grel e Python
  • Arricchisci dati tramite API
  • trasformazione dei dati
  • Collegamento dei dati
  • Operazioni di dati avanzate

Installazione

Installazione su Linux

Esegui il comando sotto per scaricare OpenRefine.

$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz

Estrai il file scaricato eseguendo il comando sotto.

$ tar -xzf openrefine-linux-3.4.1.tar.gz

Avvia OpenRefine.

$ ./refine

Refine si aprirà quindi nel tuo browser web. Se non si avvia automaticamente, digitare http: // localhost: 3333 per accedervi.

Installazione su Mac

Scarica il kit Mac da httpsopenrefineorgdownloadhtml. Apri e trascina icona nella cartella Applicazioni. Fare doppio clic sull’icona e il perfezionamento si aprirà nel browser Web.

Installazione su Windows

Scarica Windows Kit da httpsopenrefineorgdownloadhtml. Decomprimi il file scaricato e fai doppio clic sul file Refine.bat. Refine si aprirà quindi nel tuo browser web. Se non si avvia automaticamente, digitare http: // localhost: 3333 per accedervi.

Esplorare

Potresti trovare i seguenti collegamenti pertinenti:

 Italiano