Klasifikasi Gambar Produk C2C E-Commerce Menggunakan Algoritma Deep Learning
Perkembangan e-commerce di Indonesia sangat cepat. Das dkk (Das, Gryseels, Sudhir, & Tan, 2016) menyebutkan bahwa pada tahun 2016, pendapatan dari sektor e-commerce di Indonesia mencapai sebesar USD 6 miliar, selain itu 78% atau sekitar 80 juta lebih dari total 102,8 juta pengguna internet pernah melakukan pembelian secara online menggunakan platform e-commerce. Badan ekonomi kreatif dalam bukunya opus 2019 menyebutkan 5 peringkat teratas platform e-commerce yang paling sering digunakan, dari kelima peringkat teratas tersebut 4 diantaranya adalah platform e-commerce dengan model bisnis C2C(Bekraf, 2019).
C2C adalah sebuah bisnis model dimana dua individu bertransaksi satu sama lain (Dan, 2014). Pada umumnya terdapat pihak perantara untuk memfasilitasi transaksi dan menyediakan platform bagi individu tersebut. Model ini memiliki salah satu kekurangan yang muncul karena produk yang ditampilkan pada situs web dibuat dan diunggah oleh individu yang bertindak sebagai penjual. Hal tersebut menyebabkan lemahnya kontrol terhadap informasi yang terdapat pada produk yang menjadi konten situs (Dan, 2014). Penjual memungkinkan baik secara disengaja ataupun tidak disengaja untuk memasang gambar produk yang salah dan tidak sesuai dengan produknya sendiri. Sebagai contoh, produk dengan gambar sepatu dijual pada kategori sandal, produk dengan gambar kemeja perempuan dijual pada kategori kemeja laki-laki, produk dengan gambar kaos kaki dijual pada kategori t-shirt atau kaos atasan, dsb.
Informasi gambar produk merupakan elemen yang penting pada sebuah halaman situs e-commerce. Pengelolaan informasi tentang produk yang baik sangat penting, hasil penelitian yang dilakukan (Li, Wang, & Chen, 2014) menunjukkan bahwa gambar dari produk berpengaruh sangat penting pada minat pembelian dari konsumen. Pada situs e-commerce umumnya, gambar yang merupakan salah satu informasi dari produk adalah elemen yang harus diperhatikan. (Lumb, 2014) menyebutkan bahwa informasi yang relevan harus benar-benar diberikan kepada konsumen ketika mencari informasi terkait sebuah produk.
Kepercayaan consumer terhadap platform berkaitan erat dengan reputasi penyedia platform, selain itu juga berkaitan dengan atribut-atribut tertentu salah satunya adalah kualitas informasi yang disajikan di dalam platform tersebut (E. Huang & Liu, 2010). Salah satu informasi yang dimuat pada situs e-commerce adalah gambar dari produk. Dibutuhkan mekanisme untuk menjaga kualitas dari gambar produk yang diunggah oleh penjual. Mekanisme tersebut diharapkan bisa menjaga kualitas informasi dari sebuah produk dalam hal ini adalah gambar produk. Kualitas informasi yang dimaksud adalah relevansi gambar produk dengan produknya sendiri. Salah satu mekanisme untuk menjaga relevansi gambar produk yang diunggah oleh penjual adalah dengan menggunakan algoritma machine learning.
Machine learning merupakan sebuah disiplin ilmu yang berkembang secara pesat. Bidang penelitian utama pada machine learning adalah supaya sebuah program komputer belajar secara otomatis mengenali pola kompleks dan membuat keputusannya sendiri secara cerdas berdasarkan data (Han, Kamber, & Pei, 2012). Pada penelitian ini metode machine learning yang digunakan adalah klasifikasi gambar. Metode ini digunakan untuk mengetahui kelas atau kategori dari sebuah gambar yang diunggah oleh penjual.
Terdapat banyak algoritma yang bisa digunakan untuk klasifikasi gambar. Salah satu algoritma yang saat ini sedang populer untuk memecahkan permasalahan klasifikasi gambar adalah Convolutional Neural Network (CNN) (Krizhevsky, Sutskever, & Hinton, 2012; Patterson & Gibson, 2016) yang termasuk ke dalam algoritma deep learning. Deep learning sendiri beberapa tahun terakhir mendapatkan banyak perhatian baik dari peneliti, komunitas maupun industri. Deep learning mampu memberikan hasil yang signifikan. Beberapa penelitian seperti pengenalan rambu lalu lintas, identifikasi tulisan huruf mandarin (Ciresan, Meier, & Schmidhuber, 2012), dan lainnya telah berhasil dilakukan menggunakan deep learning. Berangkat dari hal-hal yang berkaitan dengan perkembangan e-commerce di Indonesia, pentingnya kualitas informasi pada platform e-commerce dan performa deep learning maka diperlukan penelitian deep learning dalam dunia e-commerce, salah satunya adalah klasifikasi gambar produk C2C e-commerce. Perkembangan deep learning tidak lepas dari ketersediaan data dalam jumlah yang besar dan juga ketersediaan sumber daya komputasi yang tinggi, walaupun demikian deep learning masih bisa diimplementasikan dengan data yang relatif sedikit yakni dengan menggunakan mekanisme transfer learning. Transfer learning merujuk pada situsasi di mana sesuatu yang sudah dipelajari pada sebuah keadaan, dieksploitasi untuk meningkankan generalisasi pada keadaan yang lainnya(Ian Goodfellow, Yoshua Bengio, 2016), dalam hal klasifikasi gambar menggunakan deep learning bisa dilakukan dengan menggunakan model yang telah dilatih sebelumnya yang sering disebut dengan pre-trained model, model tersebut telah dilatih menggunakan sebuah dataset, kemudian model tersebut diimplementasikan terhadap sebuah permasalahan baru menggunakan dataset baru. Dataset baru yang dibutuhkan untuk melatih ulang model tidak perlu memiliki jumlah yang besar seperti pada proses pelatihan model dari awal, hal ini dimungkinkan dikarenakan model yang dilatih ulang telah dilatih dan memiliki pengetahuan yang serupa dengan dataset baru tersebut. Penelitian ini memberikan gambaran tentang bagaimana sebuah dataset bisa dikumpulkan untuk melatih ulang model yang sudah dilatih sebelumnya.
Selain dataset baru harus dikumpulkan, implementasi deep learning menggunakan mekanisme transfer learning juga membutuhkan model yang sudah dilatih sebelumnya, penggunaan model ini sangat membantu karena bisa mempercepat proses pelatihan dibandingkan dengan proses pelatihan sebuah model yang dilakukan dari awal. Terdapat banyak model yang bisa digunakan, masing-masing model tersebut tentu saja memiliki karakteristik masing-masing, beberapa model memiliki ukuran kecil sedangkan model yang lainnya berukuran lebih besar. Selain pengumpulan dataset, pada penelitian ini juga beberapa model dilatih ulang dengan menggunakan metode fine-tuning menggunakan dataset yang telah dikumpulkan, kemudian performa masing-masing model dibandingkan dan dievaluasi dengan menggunakan acuan testing accuracy.
Peneliti: Herdian dan I Gede Putra Kusuma Negara