Manajemen Penyimpanan Big Data di Cloud Computing
Saat ini data merupakan suatu asset yang berharga. Perkembangan pesat penggunaan data dalam kehidupan sehari-hari menimbulkan kebutuhan akan manajemen penyimpanan data menjadi hal yang sangat penting. Basis data tradisional yang umum digunakan saat ini memiliki keterbatasan dalam penyimpanan data. Teknologi big data merupakan suatu solusi yang saat ini menjadi jawaban atas keterbatasan basis data tradisional dalam mengelola data yang sangat besar baik dari sisi metode penyimpanan ataupun kecepatan akses (Storey & Song, 2017).
Pada era penggunaan data secara besar dalam melakukan analisa ataupun menentukan keputusan, big data merupakan suatu teknologi yang umum untuk digunakan perusahaan ataupun organisasi dalam mengelola data, baik yang terstruktur ataupun tidak (Ji, Li, Qiu, Awada, & Li, 2012). Dengan pengelolaan data yang tepat, perusahaan dapat melakukan analisa terhadap data yang dimiliki untuk menentukan keputusan yang tepat untuk diambil berdasarkan data historis yang dimiliki. Oleh karena itu, manajemen penyimpanan data merupakan suatu tantangan saat ini dimana memiliki standar terhadap kapasitas media penyimpanan, kinerja media penyimpanan, fungsionalitas dan fleksibilitas dari media penyimpanan tersebut.
Dengan menerapkan big data sebagai media penyimpanan, organisasi ataupun perusahaan terkait memerlukan ruang secara fisik dengan ukuran yang cukup besar, selain itu dana dalam pemeliharaan server pun menjadi suatu kendala dalam penerapan big data. Cloud computing merupakan sarana yang dapat dimanfaatkan sebagai media penyimpanan big data. Cloud computing memungkinkan pengguna melakukan penyimpanan data dalam skala yang besar dengan memanfaatkan komputasi yang baik juga arsitektur yang kuat untuk. Selain itu, penggunaan cloud server dapat disesuaikan dengan kebutuhan pengguna sehingga akan meminimalisir biaya penggunaan dan pemeliharaan (Hashem, et al., 2015).
Big data
Big data merupakan serangkaian teknik dan teknologi yang memerlukan integrasi untuk mendapatkan nilai yang tersembunyi dari sekumpulan data (Hashem, et al., 2015). Menurut Storey dan Song, big data memiliki 5V yang merupakan indicator keberhasilan penerapan big data yaitu volume, velocity, variety, veracity dan value (Storey & Song, 2017). Sedangkan Hashem menuturkan apabila big data dapat dikategorisasi menjadi 5 bagian berdasarkan aspek-aspeknya yaitu sumber data, format konten, penyimpanan data, pemrosesan data dan staging data (Hashem, et al., 2015). Klasifikasi tersebut digunakan untuk membantu memahami karakteristik dari big data. Klasifikasi big data dapat dilihat dari gambar 1.
Gambar 1. Klasifikasi big data berdasarkan karakteristik
Cloud Computing
NIST mendefinisikan bahwa cloud computing merupakan suatu model yang memungkinkan pengguna untuk berbagi sumber daya dengan upaya minimal dengan atau tanpa bantuan dari penyedia layanan (Mell & Grance, 2011). Cloud computing memiliki 3 model layanan : Software as a Service (SaaS), Platform as a Service (Paas), dan Infrastructure as a Service (IaaS). Terdapat 5 karakteristik penting dari cloud computing berdasarkan NIST : layanan mandiri sesuai dengan kebutuhan pengguna, akses jaringan yang luas, elastisitas yang cepat, layanan yang terukur dan penggabungan sumber daya (Mell & Grance, 2011). Arsitektur model dari cloud computing dapat kita lihat pada gambar 2.
Gambar 2. Arsitektur model cloud computing
Relasi antara Big Data dan Cloud Computing
Big data memungkinkan pengguna dalam menjalankan query dalam kumpulan data yang besar dengan hasil yang ditampilkan dalam jangka waktu yang singkat dan cloud computing membantu proses tersebut melalui teknologi Hadoop (Hashem, et al., 2015). Gambar 3 akan menjelaskan arsitektur model dalam penerapan big data pada cloud computing.
Gambar 3. Arsitektur model penerapan big data pada cloud computing
Hadoop merupakan suatu framework yang memungkinkan dalam pemrosesan kumpulan data yang sangat besar dengan komputasi yang terdistribusi. Dengan menggunakan teknologi Hadoop, kumpulan data yang besar akan diproses dengan menggunakan sekumpulan server dan sistem file terdistribusi yang telah disediakan oleh Hadoop sehingga dapat membantu dalam kecepatan transfer data (Venkatesh, Perur, & Jalihal, 2015). Cloud computing pun menawarkan skalabilitas untuk penggunaan sumber daya, biaya administrasi yang rendah, fleksibilitas dalam pengelolaan biaya, dan mobilitas untuk pengguna. Selain itu, terdapat komponen dari big data yang terkait dengan cloud computing seperti sistem file untuk penyimpanan data besar yang diimplementasikan dalam layer IaaS, DBMS untuk mengatur data yang dapat dilihat antara layer IaaS dan layer PaaS, suatu perangkat untuk mendistribusikan beban komputasi yang terkait dengan layer PaaS dan sistem query untuk menghasilkan informasi yang berlokasi di antara layer PaaS dan layer SaaS (Fernández, et al., 2014).
Referensi
Fernández, A., del Río, S., López, V., Bawakid, A., del Jesus, M. J., Benítez, J. M., & Herrera, F. (2014). Big Data with Cloud Computing: an insight on the computing environment, MapReduce, and programming frameworks. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 380-409.
Hashem, I. A., Yaqoob, I., Anuar, N. B., Mokhtar, S., Gani, A., & Khan, S. U. (2015). The rise of “big data” on cloud computing: Review and open research issues. Information Systems, 98-115.
Ji, C., Li, Y., Qiu, W., Awada, U., & Li, K. (2012). Big data processing in cloud computing environments. Pervasive Systems, Algorithms and Networks (ISPAN), 17-23.
Mell, P., & Grance, T. (2011). The NIST definition of cloud computing.
Storey, V. C., & Song, I. Y. (2017). Big data technologies and Management: What conceptual modeling can do. Data & Knowledge Engineering, 108, 50-67.
Venkatesh, H., Perur, S. D., & Jalihal, N. (2015). A study on use of big data in cloud computing environment. Int. J. Comput. Sci. Inf. Technol. (IJCSIT), 2076-2078.
Disajikan:
Yoel Frans Alfredo