Klastering

Selain regresi dan klastering, klasifikasi juga merupakan topik utama dalam data mining atau machine learning. Pada klasifikasi, pengelompokan suatu dataset memerlukan label atau target untuk mengawasi (supervise) proses pembelajaran algoritma yang digunakan, sementara klastering tidak memerlukan label atau target di dalam proses pembelajaran algoritmanya. Atau dengan kata lain, pembelajaran pada klastering tidak memerlukan pengawasan (supervisor). Dengan demikian, algoritma-algoritma untuk menyelesaikan masalah klastering dikategorisasikan ke dalam unsupervised learning atau pembelajaran yang tidak diawasi. Maksud dari pembelajaran yang tidak diawasi adalah proses pembelajarannya tidak memerlukan seorang guru atau supervisor.
Gambar 1 dibawah ini adalah ilustrasi sederhana klastering dari suatu dataset menjadi 3 kelompok berdasarkan fitur-fitur tertentu tanpa adanya label atau target. Biasanya yang menjadi basis klastering adalah jarak

Gambar 1: Klastering dengan 3 pengelompokan data .

Beberapa metode standar dapat digunakan untuk menyelesaikan masalah klastering yaitu: K-Means, Self Organizing Map (SOM), Gaussian Mixture Model (GMM), Fuzzy Clustering Model (FCM) dan masih banyak lagi.

antoni wibowo