Penggabungan Metadata dan Analisa Sentimen Trailer untuk Prediksi Rating Movie
Prediktor rating movie dibuat untuk memprediksi rating dari sebuah movie, yang berdasarkan metadatanya, seperti genre, anggaran, waktu berjalan, dll. Akan tetapi, terdapat juga data sentimen yang dapat digunakan sebagai data penambah untuk predictor rating movie. Data sentimen ini dapat diperoleh dan dikumpulkan dari halaman trailer dari movie yang berkaitan, dimana data sentimen ini dapat diproses lebih lanjut menjadi polaritas sentimen yang menggambarkan polaritas penontonnya (positif atau negatif) terhadap movie tersebut. Oleh karena itu, penelitian ini mengusulkan sebuah metode yang mengkombinasikan metadata dan data sentimen untuk memprediksi rating movie dengan menggunakan model-model regresi, seperti Random Forests, Gradient-Boosted Trees, Deep Neural Network, dan Stacking. Dalam studi ini, kita membandingkan performa dari dua bentuk dataset, bentuk kesatu mengandung kombinasi metadata dan data sentiment, dan bentuk kedua hanya mengandung metadata. Berdasarkan hasil eksperimen, model Stacking telah memperoleh MAE terendah sebesar 3.53 dengan pengunaan metadata dan data sentimen sebagai fitur inputnya. Kita juga telah menemukan bahwa kombinasi metadata dan data sentimen dapat menurunkan MAE dari model-model regresinya sebesar 0.39, jika dibandingkan dengan hanya menggunakan metadata.