Pengenalan Produk Toko Ritel Menggunakan Modifikasi VGG-16 dengan Dilated Convolution dan Convolutional Classifier
Pengenalan produk toko ritel tentu bermanfaat dalam dunia perdagangan fisik, seperti untuk membantu orang-orang dengan keterbatasan penglihatan dalam berbelanja. Namun, pada dataset produk toko ritel GroZi-120 dengan data pelatihan yang terbatas dan perbedaan kondisi data pelatihan dan evaluasi yang tinggi, berbagai penelitian mendapatkan akurasi yang rendah dengan kombinasi pendekatan yang tidak terlalu sederhana. Hal ini menyisakan ruang untuk peningkatan akurasi pengenalan produk dengan pendekatan/model yang lebih sederhana. Untuk menyelesaikan masalah ini, model-model VGG-16, Darknet-19, dan Darknet-53 dilatih untuk mengenali/mengklasifikasikan gambar produk toko ritel pada dataset GroZi-120. Sebagai tambahan, model baru yang terinspirasi model-model di atas dan dilated convolution dengan nama VGG-16-D diusulkan dalam penelitian ini. Hasil yang didapat menunjukkan bahwa model-model Darknet mendapatkan hasil yang cukup baik dan VGG-16 mampu beroperasi pada akurasi 66.92%. VGG-16-D sendiri mendapatkan akurasi 67.08% dengan peningkatan kesederhanaan model dalam bentuk penurunan 85% jumlah parameter yang dibutuhkan dibandingkan VGG-16. Hasil ini melebihi performa kebanyakan hasil penelitian lain berdasarkan beberapa faktor pembanding.