Nine Steps design methodology for developing Data warehouse

Data warehouse sebagai kumpulan data yang diekstrak dari database operasional, historis, dan eksternal, yang dibersihkan, diubah, dan dikelompokkan guna identifikasi dan analisis untuk pengambilan keputusan bisnis. Ada banyak metodologi dalam membangun sebuah data warehouse. Salah satunya adalah metode Kimball.  Kimball & Ross (2010) mengatakan terdapat 9 langkah dalam membangun sebuah data warehouse, yang dikenal dengan nine-step design methodology, jika langkah-langkah dalam nine-step design methodology dilakukan secara sistematis, maka dapat membangun sebuah data warehouse yang baik. Kita ambil sebuah kasus pada sebuah perusahaan sederhana penjualan untuk menggambarkan kesembilan langkah tersebut.

  1. Choose the Process

Memilih proses berarti menentukan subjek utama. Subjek utama merujuk pada suatu kegiatan bisnis perusahaan yang dapat menjawab semua pertanyaan bisnis yang penting serta memiliki ciri-ciri tertentu. Misalnya adalah proses penjualan

  1. Choose the Grain

Memilih grain berarti menentukan apa yang akan diwakili atau dipresentasikan oleh sebuah tabel fakta. Setelah menentukan grain dari tabel fakta, selanjutnya dapat ditentukan tabel-tabel dimensi yang berhubungan dengan tabel fakta tersebut. Grain pada tabel fakta juga menentukan grain tabel dimensi. Pada kasus ini grain bisa diperoleh dari invoice yang dikeluarkan kepada pembeli.

  1. Identify and Conform the Dimensions

Mengidentifikasi dan menghubungkan tabel dimensi dengan tabel fakta. Dimensi merupakan kumpulan sudut pandang yang penting untuk menggambarkan fakta-fakta yang terdapat pada tabel fakta. Sebagai contoh adalah dimensi customer, waktu, dan jenis produk.

  1. Choose the Facts

Grain dari suatu tabel fakta menentukan fakta-fakta yang bisa digunakan. Pada tahap ini, tentukan measure yang dibutuhkan pada tabel fakta. Informasi apa saja yang ingin dibutuhkan.

  1. Store Precalculations in the Fact Table

Pada tahap ini, hasil perhitungan pada suatu atribut perlu dipertimbangkan untuk disimpan di database. Hal ini untuk mengurangi risiko kesalahan pada program setiap kali melakukan perhitungan pada atribut-atribut tersebut.

Gambar Ilustrasi Perhitungan Awal pada Tabel Fakta

(Kimball & Ross, 2010)

  1. Round Out the Dimension Tables

Dari dimensi-dimensi yang telah diidentifikasi, dibuat deskripsi yang memuat informasi terstruktur mengenai atribut-atribut pada tabel dimensi. Tabel dimensi tersebut harus diberi keterangan secara lengkap dan mudah dipahami oleh pengguna.

  1. Choose the Durations of the Database

Durasi waktu dari data-data yang akan dimasukkan ke dalam data warehouse akan ditentukan pada tahap ini. Misalnya, data perusahaan dua tahun lalu atau lebih diambil dan dimasukkan ke dalam tabel fakta.

  1. Determine the Need to Track Slowly Changing Dimensions

Dimensi dapat berubah dengan lambat dan menjadi sebuah masalah. Terdapat tiga tipe dasar dari perubahan dimensi yang lambat, yaitu:

  • Menulis ulang atribut yang berubah
  • Membuat record baru pada dimensi
  • Membuat suatu atribut alternatif untuk menampung nilai yang baru.
  1. Decide the Physical Design

Pada tahap ini, dilakukan perancangan fisik dari data warehouse. Selain itu, penentuan masalah-masalah yang mungkin ada pada perancangan fisik.

 

Sumber :

Candrauji Wira Prakoso (2017), Pengembangan Data Warehouse Untuk Mengetahui Tren Akses Pelanggan Layanan Wifi Di Perusahaan Pt. XYZ (Case Study), Tesis.

Kimball, R., & Ross, M. (2010), The Kimball Group Reader: Rentlessly Practical Tools for Data Warehousing and Business Intelligence. Indianapolis: Wiley Publishing, Inc.

Abba Suganda Girsang