Membaca File Excel dengan Pola Nama Tertentu (Regex)


Pendahuluan

Kettle / Pentaho Data Integration menggunakan regular expression (regex) secara intensif baik pada bagian konfigurasi maupun modul transformasi pengolahan datanya.

Salah satu yang sering digunakan adalah pengambilan file-file dengan pola nama tertentu sebagai sumber input datanya. Pada artikel kali ini akan ditunjukkan penggunaannya pada pembacaan file-file Excel yang memiliki pola nama tertentu.

Pola Nama Regex pada Excel Input

  1. Sebagai contoh, saya memiliki 4 file Excel yang terletak pada folder "C:\filename_regex" dengan nama file berturut sebagai berikut :
    • cabang_A_oktober_2011.xls
    • cabang_B_oktober_2011.xls
    • cabang_C_oktober_2011.xls
    • rekap.xls


  2. Screenshot isi dari keempat file tersebut tampak pada gambar berikut.



  3. Terlihat pada isi file di atas hanya file Rekap.xls yang memiliki struktur yang berbeda. Untuk selanjutnya kita hanya ingin baca file yang memiliki awalan nama "cabang". 
  4. Jalankan Spoon, buat suatu file transfomation dan masukan step "Excel Input".
  5. Buka dialog dari step tersebut, dan masukkan input nama file/folder tempat file tersebut berada dan pola regex "cabang.+xls" (lihat gambar).


  6. Pastikan hanya 3 nama file berawalan "cabang" yang dibaca - dan bukannya 4 file - dengan cara mengklik tombol "Show filename(s)...". yang akan memunculkan dialog dengan daftar nama file.


  7. Setelah konfigurasi tersebut di atas selesai, lakukan konfigurasi berikutnya seperti biasa untuk membaca nama sheet dan fields yang akan dibaca. Buang field-field yang tidak diperlukan.


    Catatan : jika kita membaca lebih dari satu file, maka akan terjadi banyak field yang berulang seperti terlihat pada gambar, untuk menghindari hal ini sebelum melakukan langkah nomor 5 di atas. Baca dulu satu file sebagai model untuk sheet dan field, setelah itu baru diganti dengan pola untuk beberapa nama file.


  8. Lakukan data preview jika diperlukan untuk memastikan bahwa data dari ketiga file tersebut terbaca semua dengan baik. 


  9. Anda dapat mendownload contoh file Excel dan file transformation (PDI versi 4 ke atas) pada bagian attachment artikel ini.
  10. Selesai.

Download File Contoh

Ĉ
Rekap.xls
(17k)
Feris Thia,
Nov 6, 2011, 6:16 PM
ċ
baca_daftar_file_excel.ktr
(10k)
Feris Thia,
Nov 6, 2011, 6:16 PM
Ĉ
Feris Thia,
Nov 6, 2011, 6:16 PM
Ĉ
Feris Thia,
Nov 6, 2011, 6:16 PM
Ĉ
Feris Thia,
Nov 6, 2011, 6:16 PM
Comments