Klasifikasi Malware Berdasarkan Urutan Panggilan Sistem Menggunakan Deep Learning

 

Peneliti: Rizki Jaka Maulana dan I Gede Putra Kusuma Negara

 

Malware selalu menjadi masalah besar bagi perusahaan, lembaga pemerintah, dan individu karena orang masih menggunakannya sebagai alat utama untuk mempengaruhi jaringan, aplikasi, dan sistem operasi komputer untuk mendapatkan manfaat sepihak. Hingga saat ini, deteksi malware dengan metode heuristik dan berbasis tanda tangan masih berjuang untuk mengimbangi evolusi malware.

Machine learning diketahui mampu mengotomatiskan pekerjaan yang diperlukan untuk mendeteksi keluarga malware yang ada dan yang baru ditemukan. Sayangnya, beberapa metode untuk mendeteksi malware berdasarkan Machine learning ini hanya dapat mencapai tingkat akurasi yang rendah. Dalam penelitian ini, kami mencoba memperkenalkan pendekatan yang mengatasi masalah ini. Kami mengusulkan metode analisis dinamis untuk memantau perilaku malware menggunakan urutan panggilan sistem. Kami menggunakan teknik word2vec sebagai word embedding dan mengimplementasikan ke deep learning, yaitu Long Short-Term Memory (LSTM) dan Nested LSTM.

Untuk membandingkan dengan metode Machine learning, kami juga menerapkan  Support Vector Machine (SVM) sebagai metode benchmark. Nested LSTM  mendapatkan akurasi 93,11%, sedangkan LSTM mendapatkan akurasi terbaik di 98,61%. LSTM juga mencapai kinerja terbaik dalam hal average precision di 97,57%, average recall mencapai 97,29%, dan average f1-score adalah 97,43%. Kami telah menemukan bahwa model kami ringan tetapi kuat untuk mendeteksi malware dengan akurasi yang signifikan.

I Gede Putra Kusuma Negara