Normalisasi Data Dokumen Excel

Pendahuluan

Data-data target/budget - seperti target penjualan - di perusahan sering sekali ditulis dalam bentuk Excel. Selain tidak rumit, fluktuasi target biasanya tidaklah begitu besar sehingga user sering sekali melakukan copy / paste dari data sebelumnya.  Untu melakukan entri juga lebih mudah dilakukan daripada input satu per satu pada sistem ERP yang ada.

Namun format data dari spreadsheet biasanya datang dalam bentuk tidak normal. Dan Kettle memiliki step yang sangat baik untuk me-normalisasi format data seperti ini.

Versi Kettle yang digunakan : 3.1

Contoh Data : Target Penjualan PHI-Minimart

Sebagai contoh penulis menggunakan data Excel yang biasa disertakan dalam training data warehouse PHI-Integration : data target penjualan PHI-Minimart. Dokumen ini dapat di-download di attachment pada bagian akhir artikel.

Gambar berikut adalah tampilan data tersebut pada MS Excel 2007. 


Terlihat pada gambar bahwa data target bulanan disusun memanjang dalam format kolom dari bulan Januari sampai dengan Desember. 

Hasil Yang Diharapkan

Kita akan melakukan normalisasi sehingga kolom-kolom bulan tersebut di-"sederhanakan" menjadi pasangan kolom "Bulan" / "Target". 

Hasil akhir yang diharapkan adalah seperti gambar berikut. Terlihat pemetaan kolom dimana :
  • Pemetaan "Jan" menjadi nilai "1" pada kolom Bulan, "Feb" menjadi nilai "2" pada kolom Bulan, dan seterusnya
  • Nilai 32637383 pada kolom "Jan" (sebelumnya) kini ditempatkan di bawah kolom "Target" berdampingan dengan nilai "1" pada kolom Bulan. Demikian juga dengan nilai-nilai lain, ditempatkan sesuai dengan pemetaan nilai yang tepat untuk Bulan.


Penyelesaian

  1. Tambahkan step "Excel Input" dan baca file "Target Penjualan.xls". Bagi yang belum jelas untuk membaca file Excel dapat melihat artikel ini.
  2. Hubungkan step "Excel Input" dengan tambahan step "Row Normaliser"


  3. Buka dialog step "Row Normaliser"
  4. Masukkan "Bulan" pada entry "Type field". Kemudian klik tombol "Get Fields" untuk mendapatkan semua field yang ada di file Excel sebelumnya.


  5. Hapus field "Kode Cabang", "Kode Produk" dan "Tahun" dengan cara klik pada nomor urut field tersebut dan kemudian tekan tombol Delete. Ketiga field ini dihilangkan karena ini merupakan grouping field dari proses normalisasi ini.
  6. Masukkan nilai "1" pada kolom "Type" untuk fieldname "Jan", "2" untuk "Feb", "3" untuk "Mar", dstnya.
  7. Masukkan nama "Target" pada semua baris data dari kolom "new field"


  8. Klik "OK"
  9. Lakukan preview pada step tersebut


  10. Selesai
Jika perlu tambahkan step lain untuk memformat data lebih lanjut dan menghasilkan output misalkan ke file Excel yang lain.



Ĉ
Unknown user,
Jul 31, 2009, 8:30 AM
ċ
baca_target_excel.ktr
(19k)
Unknown user,
Jul 31, 2009, 11:40 AM
Comments