Review State of The Art for Clustering in Industries
Abstract
Computational Intelligence (CI) saat ini sedang berkembang dengan sangat pesat. Hal tersebut berdampak pada metode clustering. Studi ini dilakukan untuk melihat berbagai industri saat ini yang mengimplementasi clustering untuk menyelesaikan masalah kompleks di zaman sekarang. Studi ini dilakukan untuk melihat bagaimana metode clustering pada Computational Intelligence diaplikasikan pada industri saat ini.
Introduction
Computational Intelligence merupakan sebuah teori, design, pengaplikasian, dan pengembangan yang terinspirasi dari sistem biologis dan linguistik pada manusia. Terdapat 3 pilar penting pada Computational Intelligence yaitu Neural Network, Fuzzy Systems, dan Evolutionary Computation. Data Clustering atau disebut Fuzzy Clustering and Classification termasuk dalam salah satu teknik yang terdapat di kelompok Fuzzy Systems. Data Clustering adalah proses mengidentifikasi pengelompokan atau klaster alami dalam data multidimensi berdasarkan beberapa ukuran kesamaan.
Problem Background
Tujuan dari Algoritma clustering adalah untuk menggunakan data yang tidak berlabel untuk membuat model yang menghasilkan keluaran tertentu berdasarkan masukan atau transformasi input, yang berguna dalam mengelompokkan masalah atau dalam pengurangan dimensi, yang berguna dalam mengelompokkan masalah atau dalam pengurangan dimensi (Guerra-Montenegro et al., 2021). Meskipun penggunaan clustering ini terlihat sederhana, banyak industri dan organisasi sekarang menggunakan algoritma ini dalam menyelesaikan masalah lebih rumit dari sekedar pengelompokkan. Tentu saja masalah tersebut memerlukan lebih dari clustering agar dapat terselesaikan jadi kebanyakan dari solusi yang diusulkan bercampur antara clustering dan metode CI lainnya. Di dalam paper ini, kami akan menjelaskan cara implementasi clustering di berbagai industri baru-baru ini.
Approaches in the Industry
- Computational Intelligence in the hospitality industry: A systematic literature review and a prospect of challenges
Berdasarkan Guerra-Montenegro et al. (2021), metode clustering yang digunakan dalam hospitality industry. Minat industri perhotelan dalam data science tumbuh secara eksponensial karena margin pertumbuhan laba sangat signifikan. K-means digunakan untuk mendemonstrasikan perbedaan yang signifikan antara kebutuhan klien dan dengan demikian menunjukkan bahwa teknik ini berguna untuk presisi deskripsi kebutuhan informasi klien yang menggunakan web perusahaan pariwisata. Selain itu algoritma clustering juga dikembangkan menggunakan self-organizing map untuk menemukan informasi yang terdapat dalam big data dari suatu toko menggunakan teknik ANN clustering, decision trees dan K-Means untuk mengelompokkan data sebagai bahan pertimbangan bagi tim marketing. Selain itu clustering juga berguna untuk menentukan behaviors dari turis dengan memproses tag geo dari foto, dalam paper ini hal metode clustering yang digunakan adalah Markov chain-based clustering.
An improved collaborative movie recommendation system using computational intelligence
- Menurut Wang, Z., Yu, X., Feng, N., & Wang, Z. (2014) Sistem Rekomendasi atau Recommendation System (RS) merupakan salah satu filtering sistem yang paling efisien. Paper ini melakukan penelitian untuk membuat sebuah sistem hybrid model-based yang dapat memberikan rekomendasi film dengan menggunakan metode K-Means Clustering yang telah ditingkatkan dan digabungkan dengan genetic algorithm (GA). Metode tersebut dilaksanakan berdasarkan prinsip komponen analisis atau dapat disebut juga Principal Component Analysis (PCA) yang bertujuan untuk meringankan kompleksitas pada komputasi untuk memberikan hasil rekomendasi.
- Anomaly Detection System in Cloud Environment Using Fuzzy Clustering Based ANN
Sudah banyak organisasi mulai mengunggah informasi penting mereka ke dalam public cloud dengan jumlah yang sangat besar. Informasi yang diunggah dapat bersifat sensitif dan rentan terhadap risiko keamanan. Selain itu, layanan teknologi cloud yang tidak diketahui keamanannya dapat mengakibatkan penyusup untuk mendapatkan akses dan menyalahgunakan sumber daya layanan yang disediakan oleh Cloud Service Provider (CSP). Penyusup dapat menyebabkan anomali berupa serangan terhadap data pengguna, sumber daya CPU dalam cloud, penggunaan bandwidth, daya pemrosesan cloud, dan kapasitas penyimpanan cloud. Untuk mencegah anomali, dan aktivitas jahat ini, firewall dan sistem deteksi terhadap intrusi adalah satu – satunya solusi. Pada penelitian yang dilakukan oleh Pandeeswari, N., & Kumar, G. (2016), mereka mengusulkan metode deteksi anomali pada lapisan hypervisor dalam cloud menggunakan algoritma hybrid yang mencampurkan algoritma Fuzzy CMeans dan Artificial Neural Network (FCM-ANN) untuk meningkatkan akurasi sistem deteksi, sistem yang diusulkan kemudian dibandingkan dengan pengklasifikasi Naïve Bayes dan algoritma JST Klasik. Berdasarkan hasil analisisterbukti bahwa sistem yang diusulkan mampu mendeteksi anomali dengan akurasi deteksi tinggi dan tingkat alarm palsu yang rendah
- Clustering as a tool to support the assessment of power quality in electrical power networks with distributed generation in the mining industry
Paper ini menyajikan studi kasus penggunaan analisis cluster sebagai salah satu teknik data mining yang diterapkan dalam analisis data Power Quality jangka panjang yang direkam dalam jaringan tenaga listrik pertambangan industri. Clustering ini dimaksudkan untuk menekankan dampak distributed generation pada tingkat daya. Parameter kualitas Investigasi difokuskan pada penggunaan teknik clustering K-mean. Untuk data standar dan non-standar, Euclidean dan Chebyshev Distance dengan jumlah cluster yang bervariasi digunakan. Hasil yang diperoleh menunjukkan kemungkinan untuk memperoleh klasifikasi data secara otomatis ke dalam cluster yang dapat dibedakan yang mewakili periode waktu ketika Distributed Generation lokal aktif, dimatikan atau ketika tingkat konsumsi daya yang berbeda ditunjukkan.
Conclusion
Berdasarkan penelitian yang telah dilakukan, dapat disimpulkan dapat dikatakan bahwa clustering dalam bidang computational intelligence dapat diaplikasikan pada berbagai industri di dalam kehidupan nyata, dan setiap algoritma yang dipakai mempunyai kekuatan dan kelemahannya tersendiri. Bergantung pada masalah apa yang ingin diselesaikan, pengimplementasian yang akan dilakukan juga pasti berbeda beda, seperti yang sudah dibahas pada penelitian ini, contohnya adalah; metode clustering telah digunakan oleh industri perhotelan untuk menemukan informasi yang terdapat dalam big data dari perusahaan tersebut untuk menjadi bahan pertimbagan bagi tim marketing, selain itu juga berfungsi untuk menemukan behavior dari turis. Metode clustering juga telah diimplementasikan dalam sistem rekomendasi dengan menggunakan algoritma hybrid k-means clustering dan genetic algorithm. Bidang dalam lingkungan cloud juga telah menggunakan metode clustering dengan algoritma hybrid fuzzy c means dan artificial neural network untuk mendeteksi anomali penyerangan terhadap lingkungan cloud. Analisis clustering juga telah diimplementasikan oleh industri pertambangan untuk menekankan dampak distributed generation pada tingkat daya listrik tenaganya. Ini menunjukan bahwa bidang clustering dalam computational intelligence sangat bisa dipakai untuk memajukan perkembangan berbagai industri, jika memakai pengimplementasian yang benar terhadap masalahnya.
Reference:
- Guerra-Montenegro, J., Sanchez-Medina, J., Laña, I., Sanchez-Rodriguez, D., Alonso-Gonzalez, I., & Ser, J. D. (2021). Computational Intelligence in the hospitality industry: A systematic literature review and a prospect of challenges. Applied Soft Computing, 102, 107082.
Link: https://accedacris.ulpgc.es/bitstream/10553/77333/2/1-s2.0-S1568494621000053-main.pdf
- Geng, S., Dang, Y., Ding, S., Rasheed, R., Zhou, H., & Ye, L. (2019). Evaluation of Chinese Industry Linkage Ability by Using an Enhanced Grey Possibility Clustering Model. The Journal of Grey System, 31(4), 47-60.
Link:
- Jasiński, M., Sikorski, T., & Borkowski, K. (2019). Clustering as a tool to support the assessment of power quality in electrical power networks with distributed generation in the mining industry. Electric Power Systems Research, 166, 52-60.
Link:
https://sci-hub.hkvisa.net/10.1016/j.epsr.2018.09.020
- Pandeeswar, N., & Kumar, G. (2016). Anomaly Detection System in Cloud Environment Using Fuzzy Clustering Based ANN. Mobile Networks and Applications, 21(3), 494-505.
Link:
https://sci-hub.hkvisa.net/10.1007/s11036-015-0644-x
- Doroshenko, A. (2020, August). Analysis of the Distribution of COVID-19 in Italy Using Clustering Algorithms. In 2020 IEEE Third International Conference on Data Stream Mining & Processing (DSMP), 325-328. IEEE.
Link:
https://sci-hub.hkvisa.net/https://ieeexplore.ieee.org/abstract/document/9204202
- Wang, Z., Yu, X., Feng, N., & Wang, Z. (2014). An improved collaborative movie recommendation system using computational intelligence. Journal of Visual Languages & Computing, 25(6), 667-675.
Link:
https://sci-hub.hkvisa.net/10.1016/j.jvlc.2014.09.011
Rico Kumala – 2201829735
Marchello Yoloan – 2201771210
Ezra Karuna Wijaya – 2201772176
Andre Setiawan Wijaya – 2201775682