Deteksi Video Api dan Asap Menggunakan Convolutional Neural Network
Penulis: Mario Imandito dan Thayogo
Pembimbing/Editor: Amalia Zahra, S.Kom., Ph.D.
Video processing adalah sebuah metode untuk menganalisa sekuensi video. Tujuan proses tersebut adalah untuk mengetahui apa yang terjadi di dalam sebuah video tanpa intervensi manusia. Salah satu topik riset terkenal di bidang ini adalah analisis untuk mendeteksi kebakaran. Metode tradisional untuk mendeteksi api dan asap adalah dengan menggunakan sensor. Namun, sensor hanya berfungsi di dalam ruangan, harus dekat dengan api, memiliki jangkauan terbatas, dan memberikan sedikit informasi. Di sisi lain, sistem pendeteksi kebakaran yang menggunakan pemrosesan video memungkinkan digunakan di luar ruangan dan memberikan analisis tentang perilaku api.
Convolutional Neural Network (CNN) telah terbukti sangat efektif dalam mendeteksi api dan asap. CNN pertama diperkenalkan oleh Fukushima, K., & Miyake, S. (1982), di mana arsitektur neural network hierarkis terinspirasi dari penelitian Hubel. Keuntungan menggunakan CNN adalah fitur dapat langsung dipelajari dari gambar mentah. Sebuah convolutional neural network terdiri dari beberapa layer, yaitu convolutional layer, pooling layers, dan fully connected layers.
Pada tahun 2016, Frizzi dan Kaabi (2016) melakukan riset yang menggunakan CNN untuk mendeteksi api dan asap pada suatu video. Arsitektur klasifikasinya tergolong sederhana untuk CNN, di mana convolutional dan max pooling digabungkan. Arsitektur tersebut dapat dilihat di Gambar 1 berikut ini.
Gambar 1. Arsitektur CNN
Sebuah gambar berwarna berukuran 64×64 masuk melalui dua operasi convolutional dengan ukuran kernel 3×3. Max pooling dengan 2 strides mengikuti lapisan convolutional yang kedua dan kelima. Lapisan pertama hingga keempat memiliki 16 peta fitur, selain lapisan ketujuh dan kedelapan yang hanya memiliki satu peta fitur. Lapisan ketujuh dan kedelapan tersambung sepenuhnya. Hasil lapisan output tersambung diberikan pada SoftMax tiga-arah yang akan menghasilkan distribusi antara tiga kelas label: api, asap, atau negatif.
Setelah model selesai, hasil deteksi terhadap data testing memiliki akurasi 97,8%. Sebuah confusion matrix dan Receiver Operating Characteristic (ROC) digunakan untuk mengevaluasi performa tiga kelas tersebut. Kecepatan mendeteksi api juga sangatlah penting, maka untuk mempercepat proses peta fitur terakhir digunakan sliding window dengan ukuran 12×12 piksel saja. GPU sebuah graphic card digunakan supaya diperoleh perhitungan cepat. Metode tersebut dapat mengurangi ratio time cost dari 6 menjadi 60. Hasil akhir dapat dilihat di Gambar 2 berikut ini.
Gambar 2. Deteksi Api di Luar Ruangan (Frizzi & Kaabi, 2016)
Proses dimulai dari gambar pertama, yaitu satu dari 200 frames di sebuah video. Feature Map diekstraksi dengan warna hitam-putih, lalu deteksi dilakukan di atasnya dengan memberi warna tertentu. Api diberi warna merah, sedangkan asap diberi warna hijau. Intensitas warna tersebut menandakan probabilitasnya. Untuk menyimpulkan, sistem deteksi api melalui video dengan metode CNN memiliki akurasi dan kecepatan yang cukup bagus. Di penelitian selanjutnya, ada kesempatan untuk menggunakan 3D convolutional neural network. Selebihnya, sistem ini masih memiliki kesulitan dalam mendeteksi asap dan api dengan warna selain merah.
Referensi
Fukushima, K., & Miyake, S. (1982). Neocognitron: A self-organizing neural network model for a mechanism of visual pattern recognition. In Competition and cooperation in neural nets (pp. 267-285). Springer, Berlin, Heidelberg.
Frizzi, S., Kaabi, R., Bouchouicha, M., Ginoux, J. M., Moreau, E., & Fnaiech, F. (2016, October). Convolutional neural network for video fire and smoke detection. In Industrial Electronics Society, IECON 2016-42nd Annual Conference of the IEEE (pp. 877-882). IEEE.