Herramienta de big data de código abierto

OpenRefine Herramienta de big data de código abierto

Solución gratuita de big data para manejar datos complejos a gran escala

Potente plataforma gratuita de big data para explorar, transformar y conciliar datos desordenados a gran escala. Exténtelo con servicios web y conjuntos de datos externos.

Descripción general

Openrefine (anteriormente Google Refine) es una herramienta de big data de código abierto para trabajar con conjuntos de datos complejos. Es una plataforma gratuita de Big Data para manipular datos. Ayuda a los usuarios a limpiar los datos desordenados y convertirlos en un formato diferente. Además, OpenRefine permite extender conjuntos de datos con varios servicios web. Openrefine tiene una API que puede usarse para integrarse con servicios de terceros y automatizar las operaciones. Las extensiones se pueden usar para expandir esta solución de big data. Los usuarios pueden descargar e instalar extensiones fácilmente para mejorar la funcionalidad del programa. Explorando, facetas, transformación, reconciliación, exportación y muchas más características están disponibles en Openrefine para trabajar con conjuntos de datos. Faceting permite a los usuarios buscar en una columna patrones, tendencias y variación de datos. La función de expresión en OpenRefine permite a los usuarios limpiar y transformar datos. Wikidata es una fuente de conocimiento gratuita y abierta que tanto los humanos como las máquinas pueden leer y editar. Openrefine tiene una característica que permite a los usuarios obtener y agregar datos a Wikidata. Tiene una herramienta robusta para exportar datos a una variedad de formatos y fuentes externas. Los usuarios pueden cargar datos en las hojas de Google y agregarlos a Wikidata también. Esta herramienta de big data de código abierto está disponible para sistemas operativos Windows, Mac y Linux. Los usuarios pueden encontrar bibliotecas de terceros para varios lenguajes de programación como PHP, Java, Python, Ruby y muchas más para automatizar las operaciones. Openrefine está escrita en Java y la licencia para esta gran solución es BSD-3.

Requisitos del sistema

Para instalar OpenRefine, debe tener los siguientes software:

  • Java 8
  • Apache Maven

Características

Las siguientes son las características clave de Openrefine:

  • código abierto y abierto
  • Limpieza y filtrado de datos
  • Importar datos de varios formatos
  • Reconciliación de datos y coincidencia
  • Lenguaje de consulta personalizado con soporte de grel y python
  • Enriquecer los datos a través de API
  • Transformación de datos
  • Vinculación de datos
  • Operaciones de datos avanzadas

Instalación

Instalación en Linux

Ejecute el siguiente comando para descargar OpenRefine.

$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz

Extraiga el archivo descargado ejecutando el siguiente comando.

$ tar -xzf openrefine-linux-3.4.1.tar.gz

Comience la freenrefine.

$ ./refine

Refine se abrirá en su navegador web. Si no se inicia automáticamente, escriba http: // localhost: 3333 para acceder a él.

Instalación en Mac

Descargue Mac Kit de httpsopenrefineorgdownloadhtml. Abra y arrastre el icono a la carpeta de aplicaciones. Haga doble clic en el icono y refinar se abrirá en el navegador web.

Instalación en Windows

Descargue el kit de Windows de httpsopenrefineorgdownloadhtml. Descomprima el archivo descargado y haga doble clic en el archivo refine.bat. Refine se abrirá en su navegador web. Si no se inicia automáticamente, escriba http: // localhost: 3333 para acceder a él.

Explorar

Puede encontrar los siguientes enlaces relevantes:

 Español