Training

Follow Us at ...

         

Slide Presentasi

Kettle

Kettle
adalah aplikasi ETL (Extract, Transformation and Load) open source yang sangat populer dan merupakan salah satu yang terbaik di pasar BI dunia saat ini. 

Kettle merupakan bagian dari aplikasi Pentaho. Proyek ini berdiri sendiri sebelum diakuisisi oleh Pentaho pada tahun 2006. 

Sejak diakuisisi Kettle berubah nama menjadi Pentaho Data Integration (PDI).

Kettle / Pentaho Data Integration merupakan inisiatif dari Matt Casters yang sampai saat ini tetap aktif sebagai project leader dari Kettle.

Komponen Kettle

Kettle terdiri dari 4 aplikasi, yaitu :
  • Spoon, yaitu aplikasi grafis berbasis swing yang digunakan untuk merancang file skema job dan transformation
  • Pan, yaitu script yang digunakan untuk menjalankan file skema transformation melalui terminal / command line
  • Kitchen, yaitu script yang digunakan untuk menjalankan file skema job melalui terminal / command line
  • Carte, yaitu temporary web server yang digunakan untuk mengeksekusi job/transformation secara cluster atau parallel
Kesemua aplikasi tersebut di atas dijalankan melalui shell atau batch script yang berkaitan.

Fitur-fitur Kettle

  1. Memiliki utilitas grafik yang dapat digunakan merancang  control flow umum maupun data flow (aliran data).
  2. Multi platform - karena dikembangkan di atas Java yang notabene berjalan di banyak platform sistem operasi.
  3. Bersifat concurrent, dalam arti row-row data diambil oleh suatu step dan diserahkan ke step lain secara parallel.
  4. Scalable - dapat beradaptasi dengan penambahan kapasitas memori RAM atau pun storage (scale up) dan dapat node komputer / cluster (scale out).
  5. Koleksi step transformation dan job yang cukup banyak
  6. Extensible, kita dapat membuat step transformation dan job baru dengan sistem plugin.
  7. Dukungan luas berbagai produk database yang terkenal di pasaran baik itu proprietary maupun free open source seperti Oracle, SQL Server, MySQL, PostgreSQL dan lain sebagainya.









  1. Instalasi 
  2. Utilitas command line Job/Transformation
  3. Job Control
  4. Data Transformation
  5. Kettle Files
  6. Data Warehouse
  7. Data Quality
  8. Screencast
  9. Benchmarking

Referensi Luar



Wiki ini ditulis dan didukung oleh :