OpenRefine Strumento di big data open source
Soluzione gratuita di big data per gestire dati complessi su larga scala
Potente piattaforma di big data gratuita per esplorare, trasformare e riconciliazione di dati disordinati su larga scala. Estenderlo con servizi Web e set di dati esterni.
Panoramica ### ** ** OpenRefine (precedentemente Refine Google) è uno strumento Big Data open source per lavorare con set di dati complessi. È una piattaforma di big data gratuita per manipolare i dati. Aiuta gli utenti a ripulire i dati incasinati e convertirli in un formato diverso. Inoltre, OpenRefine consente di estendere i set di dati con vari servizi Web. OpenRefine ha un’API che può essere utilizzata per integrarsi con servizi di terze parti e automatizzare le operazioni. Le estensioni possono essere utilizzate per espandere questa soluzione di big data. Gli utenti possono facilmente scaricare e installare estensioni per migliorare la funzionalità del programma. Esplorare, sfaccettature, trasformazione, riconciliazione, esportazione e molte altre funzionalità sono disponibili in OpenRefine per lavorare con set di dati. La sfaccettatura consente agli utenti di cercare una colonna per modelli, tendenze e variazioni di dati. La funzione di espressione in OpenRefine consente agli utenti di pulire e trasformare i dati. Wikidata è una fonte di conoscenza libera e aperta che sia l’uomo che le macchine possono leggere e modificare. OpenRefine ha una funzione che consente agli utenti di recuperare e aggiungere dati a Wikidata. Ha uno strumento robusto per esportare dati in una varietà di formati e fonti esterne. Gli utenti possono caricare dati su fogli di Google e aggiungerli anche a Wikidata. Questo strumento Big Data open source è disponibile per i sistemi operativi Windows, Mac e Linux. Gli utenti possono trovare librerie di terze parti per vari linguaggi di programmazione come PHP, Java, Python, Ruby e molti altri per automatizzare le operazioni. OpenRefine è scritto in Java e la licenza per questa grande soluzione è BSD-3.
Requisiti di sistema
Per installare OpenRefine, è necessario disporre dei seguenti software:
- Java 8
- Apache Maven
Caratteristiche
Di seguito sono riportate le caratteristiche chiave di OpenRefine:
- gratuito e open source
- Pulizia e filtraggio dei dati
- Importa dati da vari formati
- Riconciliazione e corrispondenza dei dati
- linguaggio di query personalizzato con supporto Grel e Python
- Arricchisci dati tramite API
- trasformazione dei dati
- Collegamento dei dati
- Operazioni di dati avanzate
Installazione
Installazione su Linux
Esegui il comando sotto per scaricare OpenRefine.
$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz
Estrai il file scaricato eseguendo il comando sotto.
$ tar -xzf openrefine-linux-3.4.1.tar.gz
Avvia OpenRefine.
$ ./refine
Refine si aprirà quindi nel tuo browser web. Se non si avvia automaticamente, digitare http: // localhost: 3333 per accedervi.
Installazione su Mac
Scarica il kit Mac da httpsopenrefineorgdownloadhtml. Apri e trascina icona nella cartella Applicazioni. Fare doppio clic sull’icona e il perfezionamento si aprirà nel browser Web.
Installazione su Windows
Scarica Windows Kit da httpsopenrefineorgdownloadhtml. Decomprimi il file scaricato e fai doppio clic sul file Refine.bat. Refine si aprirà quindi nel tuo browser web. Se non si avvia automaticamente, digitare http: // localhost: 3333 per accedervi.