Data Warehouse Modernization
Mengapa data warehouse Modernization menjadi masalah penting?
The modernization of business, banyak perusahaan termotivasi untuk memanfaatkan data driven sehingga mereka memiliki fakta yang terukur dan dapat dipandu oleh analitik. Kemampuan ini memberikan kontribusi besar untuk mencapai tujuan bisnis yang inovatif, seperti perusahaan digital dan transformasi bisnis. Untuk membuat semua itu berfungsi membutuhkan gudang data yang sepenuhnya dimodernisasi.
Inovasi bisnis membutuhkan data yang lebih besar dan lebih baik, ini terutama terlihat dalam praktik seperti advanced analytics (mining, clustering, statistics, machine learning, dll.) dan self-service data access (data discovery, prep, visualization, dll.). Kebutuhan bisnis akan analitik inilah yang akan pendorong terkuat untuk modernisasi gudang data.
Design warehouse perlu diperbarui, data warehouse rata-rata saat ini dirancang oleh pengguna teknis untuk menyediakan data untuk pelaporan, dasbor, dan online analytic processing (OLAP). Desain warehouse seperti ini masih relevan karena use case tersebut masih dibutuhkan oleh sebagian besar perusahaan. Namun, traditional report-oriented warehouse tidak cocok untuk advanced analytics, self-service, dan data soure baru yang diminta oleh praktik bisnis saat ini. Oleh karena itu, banyak desain warehouse yang ada perlu dimodernisasi, ditambah, dan dioptimalkan untuk memenuhi kebutuhan.
Platform pilihan technical user, pengguna yang memilih on-premises relational database management system (RDBMS) sebagai platform data utama atau satu-satunya untuk warehouse, memiliki keterbatasan dalam kecepatan, scale, agility, penanganan unstructured data, dan analytics workload support, ditambah lagi membawa biaya tinggi saat digunakan sebagai konfigurasi massively parallel processing (MPP). Untuk mencapai tujuan teknis dari data warehouse modern, banyak pengguna telah memutuskan untuk melakukan “replatform” dengan memigrasi data warehouse (seluruhnya atau sebagian) ke platform data baru (seperti yang didasarkan pada Hadoop), columns, clouds, and new relational databases. Replatforming biasanya menukar platform yang lebih lama dengan yang lebih baru. Namun, strategi modernisasi terkait adalah mempertahankan platform warehouse lama (sebagian besar dioptimalkan untuk laporan) sambil menambahkannya dengan yang baru (sebagian besar dioptimalkan untuk analitik) dalam arsitektur di mana semua platform terintegrasi erat.
Karakteristik modern data warehouse
1. Data warehouse modern harus memungkinkan praktik bisnis baru berbasis data, terutama untuk advanced analytics, self-service, dan data sharing di seluruh area bisnis fungsional.
2. Untuk mencapai persyaratan pertama, data warehouse modern harus menggabungkan platform data baru (misalnya, database berbasis cloud, Hadoop, atau NoSQL), platform komputasi baru (cloud dan cluster), dan struktur data baru dari sumber baru (web, media sosial, dan Internet of Things (IoT)).
3. Tool yang menyertai warehouser (untuk analitik, pelaporan, dan integrasi) harus sama modernnya,
Manfaat Modern Data Warehouse
1. Data Warehouse yang Modern harus menawarkan kecepatan, sehingga memungkinkan pada saat pengambilan dan analisa data yang cepat, dan pasti memungkinkan bisnis dengan cepat memberikan keputusan yang paling paling baik.
2. Data Warehouse yang Modern harus dapat membersihkan dan mengubah informasi dari berbagai sumber tersebut untuk meningkatkan kualitas dan konsistensi dari sebuah data, serta data tersedia untuk semua jenis laporan yang akan dibuat.
3. Data Warehouse yang Modern juga dapat membuat keputusan strategis sehingga membantu dalam menentukan keputusan kepentingan bisnis.
4. Data Warehouse yang Modern dapat mengalami peningkatan pendapatan dan juga hemat biaya.
5. Data Warehouse yang Modern juga dapat membuat prediksi pasar untuk kepentingan mendatang Berdasarkan data bisnis.
Perbedaan Modern Data Warehouse dan Traditional Data Warehouse:
• Tidak membutuhkan physical hardware, karena Modern Data Warehouse menggunakan cloud
• Lebih mudah untuk memulai atau set up, dibandingkan dengan yang tradisional
• Lebih mudah untuk membuat prototype dan memberikan nilai bisnis
• Biaya operasional yang murah
• Lebih cepat dari pada tradisional data warehouse
• Dapat melakukan query yang lebih kompleks, karena Modern Data Warehouse menggunakan Massively Parallel Processing.
Berikut pilihan yang dapat digunakan dalam mengimplementasikan Modern Data Warehouse:
1. Traditional Data Warehouse deployed on (IaaS), dimana user harus memasang tradisional Data Warehouse Software pada komputer yang diberikan oleh cloud provider, seperti Azure, AWS, Google dan yang lainnya
2. Platform as a Service (PaaS), disini penyedia cloud dapat mengelola deployment hardware, instalasi perangkat lunak, dan konfigurasi perangkat lunak. Sedangkan, user bertanggung jawab untuk mengelola environment, query, dan mengoptimalkan perangkat lunak data warehouse
3. A True SaaS data warehouse (SaaS), disini user mengurus semuanya, seperti software dan hardware upgrades, security, availability, data protection, dan optimisasi. Cloud hanya memberikan hardware dan software sebagai bagian dari service, serta pengelolaannya
Anggota Kelompok:
• Ardivo Virsa Siswanto – 2201802405
• Darwin Samalo – 2201793691
• Joshua La’La – 2201771236
• Rizky Martin – 2201789675
• William Setta Suryawidjaja – 2201820156
Referensi
Russom, P., (2019). The Modernization of the Data Warehouse Tackling New Technical Architectures for Today’s Business Analytics and Operations Use Cases. TDWI Transforming Data With Intelligence.
https://www.cloudera.com/content/dam/www/marketing/resources/analyst-reports/tdwi-pulse-report-modernization-of-the-data-warehouse.pdf.landing.html?cid=7012H000001OOoK
https://aptitive.com/blog/comparing-modern-data-warehouse-options/