Paper Review: Blending Big Data Analytics: Review on Challenges and a Recent Study

oleh Riskie Annisa, Ayu Artaparamita R., dan Intan Paramita

Editor: Amalia Zahra, S.Kom., Ph.D.

Perkembangan teknologi saat ini memperbesar ketergantungan pengguna pada perangkat digital yang berkontribusi pada munculnya big data dan proses analisis data yang dilakukan, baik untuk data terstruktur, semi terstruktur dan tidak terstruktur. Studi literatur oleh Amalina et al. (2020) dilakukan untuk mengidentifikasi dan mengeksplorasi teknik big data analytics yang digunakan oleh industri dengan berfokus pada studi kasus tertentu pada berbagai domain teknik analitis big data. Pemaduan analitis big data (blending data analytics) dilakukan untuk menemukan struktur pada data berdimensi tinggi, sehingga dapat digunakan dalam berbagai domain ilmu pengetahuan, bisnis, dan pemerintahan.

 Tantangan Penerapan Big Data Analytics

Dalam big data, terkandung karakteristik kompleksitas dan konsep enam V yaitu volume, velocity, variety, variability, veracity, dan value. Pada penelitian tersebut, karakteristik enam V dan faktor kompleksitas tersebut dipandang sebagai tantangan tidak langsung pada penerapan big data analytics. Tantangan pada big data analytics juga muncul antara lain dalam mencari model penyimpanan yang menjawab tantangan kecepatan migrasi data dan komputasi, mengamankan data dan menjaga privasi, mencari metode analisis yang sesuai, serta memilih aplikasi yang sesuai dengan tujuan analisis.

Big Data Analytics Use Case pada Berbagai Modalitas Sumber Data

Gambar 1 merupakan klasifikasi sumber big data untuk diproses melalui berbagai teknik analitis 

Tabel 1 merupakan beberapa kajian yang dilakukan oleh penelitian sebelumnya mengenai studi kasus big data analytics berdasarkan taksonomi di atas, antara lain:

Tabel 1. Ringkasan tema penelitian bidang big data analytics berdasarkan sumber data

Teks Visual Suara Jaringan Geospasial
tinjauan kualitas produk berdasarkan teks media sosial deteksi otomatis pengendara roda dua tanpa helm aasesmen kolaborasi siswa otomatis melalui pengenalan suara layanan analitik berbasis awan analisis crowdsourcing geospasial
penemuan konsep baru yang diungkapkan pada kumpulan makalah akademis pengenalan emosi pelanggan berbasis data audio-visual CCTV evaluasi kinerja call center model sensor wireless IoT pada pertanian pintar penentuan kedalaman pada pemantauan infrastruktur jaringan pipa
pemantauan kesehatan berdasarkan analisa pada teks media sosial kompresi prediktif pada model untuk analisis video drone pengenalan gangguan depresi melalui suara analisa pengaruh lalu lintas jaringan pada kinerja jaringan penentuan lokasi yang berpotensi menjadi sumber air
deteksi fraud pada klaim asuransi pelacakan kendaraan menggunakan multikamera penerjemahan dialog multibahasa otomatis analitik jaringan multilayer dengan pemantauan berbasis software define networking (SDN) visualisasi lokasi geotagging pada microblog

 

Tantangan dalam Pemilihan Tools untuk Big Data Analytics

Beberapa penelitian terkait big data analytics menghadapi tantangan pada pemilihan tools yang sesuai untuk pemrosesan dataset. Penelitian ini juga meringkas platform big data yang dapat digunakan untuk membantu analisa dan pengolahan big data disertai dengan kelebihan dan kekurangannya pada Tabel 2, yaitu:

Tools Data Mining Scalability Flexibility Fault-Tolerant Keterangan
Hadoop ü ü ü ü Hemat biaya, namun tidak sesuai untuk komputasi real-time
Spark û ü ü ü Pemrosesan data cepat, namun nilai latensi cukup tinggi
RapidMiner ü ü ü ü Pemrosesan data cepat namun use case yang tersedia terbatas
SAS û ü ü ü Mudah digunakan namun mahal
Knime ü ü ü ü Instalasi mudah namun kurang sesuai untuk workflow yang besar dan kompleks
Orange ü ü ü ü User-friendly namun memiliki masalah kompatibilitas
Weka ü ü ü ü Mudah digunakan namun tidak efisien dalam penggunaan memori
Cassandra ü ü ü ü Memiliki arsitektur di mana setiap node independen, namun dukungan untuk agregasi terbatas
Talend ü ü ü û Mudah digunakan namun berbasis Java sehingga kurang stabil
NodeXL û ü û û Mudah digunakan untuk menganalisa data media sosial namun kurang user-friendly
Gephi û ü ü û Visualisasi sangat bagus namun data tidak dapat diekspor secara langsung dari platform media sosial

Masa Depan Big Data Analytics

Teknik deep learning, pertumbuhan media sosial online, serta pertumbuhan pengaplikasian moble sensing membuka peluang besar bagi perkembangan big data analytics di masa depan. Namun, keberadaan big data pada jaringan juga dapat menimbulkan bottleneck pada data yang bersifat realtime seperti video pengawasan, peta visual, video game, dan lainnya yang terintegrasi dengan mobile sensor. Tantangan ini dicoba dijawab melalui pengusulan standar jaringan 5G yang 10 kali lebih cepat dibanding teknologi sebelumnya. Sementara itu, big data analytics telah mendorong perubahan pada proses pengambilan keputusan berdasarkan analisis deskriptif, prediktif dan preskriptif melalui proses sebagaimana ditunjukkan oleh Gambar 2.

Gambar 2. Proses pengambilan keputusan dengan big data analytics

Referensi: Amalina, F., Targio Hashem, I. A., Azizul, Z. H., Fong, A. T., Firdaus, A., Imran, M., & Anuar, N. B. (2020). Blending Big Data Analytics: Review on Challenges and a Recent Study. In IEEE Access (Vol. 8, pp. 3629–3645). Institute of Electrical and Electronics Engineers Inc. https://doi.org/10.1109/ACCESS.2019.2923270


(2022). Paper Review: Blending Big Data Analytics: Review on Challenges and a Recent Study. Journal of Information Technology,
Journal
290
Author(s)