OpenRefine 开源大数据工具
免费处理大型复杂数据的大数据解决方案
强大的免费大数据平台,用于探索,转换和调解大规模凌乱的数据。使用Web服务和外部数据集扩展它。
概述
OpenRefine(以前是Google Refine)是用于使用复杂数据集的开源大数据工具。这是一个免费的大数据平台,用于操纵数据。它可以帮助用户清理混乱的数据并将其转换为其他格式。此外,OpenRefine允许使用各种Web服务扩展数据集。 OpenRefine具有可用于与第三方服务和自动化操作集成的API。扩展名可用于扩展此大数据解决方案。用户可以轻松下载和安装扩展名来改善程序的功能。 探索,方面,转换,核对,导出和更多功能可在OpenRefine中用于使用数据集。 FaceTing允许用户搜索列以获取模式,趋势和数据变化。 OpenRefine中的表达功能使用户可以清洁和转换数据。 Wikidata是人类和机器都可以阅读和编辑的免费开放知识来源。 OpenRefine具有允许用户获取并将数据添加到Wikidata的功能。它具有可靠的工具,可将数据导出到各种格式和外部来源。用户可以将数据上传到Google表格,并将其添加到Wikidata。 此开源大数据工具可用于Windows,Mac和Linux操作系统。用户可以找到用于各种编程语言的第三方库,例如PHP,Java,Python,Ruby等,以自动化操作。 OpenRefine用Java编写,该大解决方案的许可是BSD-3。
安装
在Linux上安装
在下面运行命令以下载OpenRefine。
$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz
通过在下面的命令下运行下载的文件。
$ tar -xzf openrefine-linux-3.4.1.tar.gz
启动OpenRefine。
$ ./refine
然后,精炼将在您的Web浏览器中打开。如果没有自动启动,请键入http:// localhost:3333访问它。
在Mac上安装
从httpsopenrefineorgdownloadhtml下载Mac套件。 打开并将图标拖到应用程序文件夹中。 双击图标,精炼将在Web浏览器中打开。
在窗户上安装
从httpsopenrefineorgdownloadhtml下载Windows套件。 解压缩下载的文件,然后双击Preatine.bat文件。 然后,精炼将在您的Web浏览器中打开。如果没有自动启动,请键入http:// localhost:3333访问它。