Açık Kaynak Büyük Veri Aracı

OpenRefine Açık Kaynak Büyük Veri Aracı

Büyük ölçekli karmaşık verilerin işlenmesi için ücretsiz büyük veri çözümü

Büyük ölçekli dağınık verileri keşfetmek, dönüştürmek ve uzlaştırmak için güçlü ücretsiz büyük veri platformu. Web hizmetleri ve harici veri kümeleri ile genişletin.

Genel Bakış

OpenRefine (daha önce Google Refine), karmaşık veri kümeleriyle çalışmak için açık kaynaklı bir büyük veri aracıdır. Verileri manipüle etmek için ücretsiz büyük bir veri platformudur. Kullanıcıların dağınık verileri temizlemelerine ve farklı bir formata dönüştürmelerine yardımcı olur. Ayrıca, OpenRefine, çeşitli web hizmetleriyle veri kümelerinin genişletilmesine izin verir. OpenRefine, üçüncü taraf hizmetlerle entegre etmek ve işlemleri otomatikleştirmek için kullanılabilecek bir API’ya sahiptir. Uzantılar bu büyük veri çözümünü genişletmek için kullanılabilir. Kullanıcılar, programın işlevselliğini geliştirmek için uzantıları kolayca indirip yükleyebilir. Veri kümeleriyle çalışmak için OpenRefine’de keşfetmek, fasetleri, dönüştürmek, uzlaşma, ihraç etmek ve daha birçok özellik mevcuttur. Faceting, kullanıcıların desenler, eğilimler ve veri değişimi için bir sütun aramalarına olanak tanır. OpenRefine’deki ifade özelliği, kullanıcıların verileri temizlemesine ve dönüştürmesine olanak tanır. Wikidata, hem insanların hem de makinelerin okuyabileceği ve düzenleyebileceği ücretsiz ve açık bir bilgi kaynağıdır. OpenRefine, kullanıcıların Wikidata’ya veri getirmesini ve veri eklemesini sağlayan bir özelliğe sahiptir. Verileri çeşitli formatlara ve harici kaynaklara dışa aktarmak için sağlam bir araca sahiptir. Kullanıcılar Google sayfalarına veri yükleyebilir ve Wikidata’ya da ekleyebilir. Bu açık kaynaklı büyük veri aracı Windows, Mac ve Linux işletim sistemleri için kullanılabilir. Kullanıcılar, işlemleri otomatikleştirmek için PHP, Java, Python, Ruby ve daha fazlası gibi çeşitli programlama dilleri için üçüncü taraf kütüphaneleri bulabilirler. OpenRefine Java ile yazılmıştır ve bu büyük çözümün lisansı BSD-3’tür.

Sistem gereksinimleri

OpenRefine’yi kurmak için aşağıdaki yazılımlara sahip olmanız gerekir:

  • Java 8
  • Apache Maven

Özellikler

OpenRefine’nin temel özellikleri aşağıdadır:

  • Ücretsiz ve açık kaynak
  • Veri temizleme ve filtreleme
  • Çeşitli biçimlerden verileri içe aktarın
  • Veri mutabakatı ve eşleştirme
  • Grel ve Python desteği ile özel sorgu dili
  • API’ler aracılığıyla verileri zenginleştirin
  • Verilerin dönüşümü
  • Verileri bağlama
  • Gelişmiş Veri İşlemleri

Kurulum

Linux’a yükleme

OpenRefine’yi indirmek için aşağıdaki komutu çalıştırın.

$ wget https://github.com/OpenRefine/OpenRefine/releases/download/3.4.1/openrefine-linux-3.4.1.tar.gz

Aşağıdaki komutu çalıştırarak indirilen dosyayı çıkarın.

$ tar -xzf openrefine-linux-3.4.1.tar.gz

OpenRefine’yi başlatın.

$ ./refine

Rafine daha sonra web tarayıcınızda açılacaktır. Otomatik olarak başlamazsa, erişmek için http: // localhost: 3333 yazın.

Mac üzerine yükleme

Mac kitini httpsopenrefineStownloadhtml‘dan indirin. Uygulamalar klasörüne açın ve simgesini sürükleyin. Simgeye çift tıklayın ve Web tarayıcısında rafine açılacaktır.

Pencerelere Yükleme

httpsopenrefineStownloadhtml‘dan Windows kitini indirin. İndirilen dosyayı açın ve rafine.bat dosyasına çift tıklayın. Rafine daha sonra web tarayıcınızda açılacaktır. Otomatik olarak başlamazsa, erişmek için http: // localhost: 3333 yazın.

Keşfetmek

Aşağıdaki bağlantıları alakalı bulabilirsiniz:

 Türkçe