Paper Review: Pengenalan Kepribadian Seseorang dari Status Faceebook Menggunakan Algoritma Deep Learning
Penulis: Febrian Valentino dan Richard Manaektua Simarmata
Pembimbing/Editor: Amalia Zahra, S.Kom., Ph.D.
Saat ini media sosial menjadi salah satu kebutuhan masyarakat. Jejaring sosial seperti Facebook, Twitter, Instagram menjadi sesuatu yang esensial dalam kebutuhan sehari hari, dan menyimpan banyak sekali informasi tentang personalitas seseorang. Personalitas kita berdampak kepada segala sesuatu yang kita pilih, kehidupan dan banyak sekali karakter kita bergantung kepada personalitas. Setiap informasi di jejaring sosial pun menjadi hal yang bisa dipelajari dan diprediksi. Seperti contoh, jika seseorang sedang merasa sedih, mungkin game atau film bisa menjadi hal yang baik untuk disuguhkan kepada orang tersebut. Contoh lainnya adalah karakter kepemimpinan seseorang juga bisa diprediksi dari media sosial orang tersebut dan bisa menjadi bahan untuk perusahaan menerima dia sebagai seorang pemimpin di perusahaan tersebut. Pengenalan otomatis terhadap setiap personalitas seseorang dari jejaring sosial memberikan data baru di dunia pekerjaan, kedokteran, psikologi atau kecerdasan sosialnya. Namun, performa dari data yang dihasilkan sangat tergantung dari pembacaan data yang dipresentasikan.
Saat ini mesin pembelajar memberikan performa yang baik untuk setiap Natural Language Processing (NLP). Tidak seperti konsep tradisional, deep learning memberikan proses yang cocok secara otomatis. Dalam paper ini, penulis mengimplementasikan Deep Learning sebagai algoritma utama yang menggunakan Fully-Connected Neural Networks (FC), Convolutional Neural Network (CNN) dan Recurrent Neural Network (RNN) untuk mengevaluasi teks dari kumpulan status yang ada di dalam jejaring sosial Facebok.
Pengenalan kepribadian secara otomatis biasanya melibatkan klasifikasi biner dari jenis sifat yang dimiliki pengguna berdasarkan konten yang dihasilkan olehnya. Label yang sebenarnya biasanya diperoleh dengan kuesioner penilaian diri.
Penulis menggunakan Big 5 sebagai dasar personifikasi dan dataset yang digunakan diambil dari “Workshop on Computational Personality Recognition” sebanyak 250 user dengan 9917 teks status serta membagi data tersebut untuk training sebesar 66% dan testing sebesar 33%.
Pada penelitian yang mereka lakukan, setiap jaringan dilatih dengan 100 epoch dengan menggunakan Adam sebagai optimizer dengan tingkat pembelajaran 1e-4. Kemudian, mereka menghitung akurasi klasifikasi dan hasil metrik skor F1.
Hasil penelitian menunjukkan bahwa model FC dengan menggunakan teks saja lebih buruk daripada model FC yang juga menggunakan informasi penulis. DNN dengan informasi teks dan penulis mencapai hasil terbaik. CNN, RNN dan FC dapat secara otomatis mengekstraksi fitur yang berguna untuk pengenalan kepribadian dan hasil terbaik dari 60,0 ± 6,5% skor F1 diperoleh dengan menggunakan CNN dengan pengumpulan rata-rata.
Mereka menemukan bahwa arsitektur bi-gram, tri-gram dan berulang tidak mendapatkan hasil yang lebih baik. Ini mungkin menunjukkan bahwa kata-kata yang dipilih oleh penulis memberi tahu lebih banyak tentang kepribadian penulis daripada makna yang diungkapkan oleh penulis. Mereka juga memperhatikan bahwa menerapkan regularisasi hampir tidak menahan overfitting, jaringan mempelajari pola-pola yang hanya ada di himpunan pelatihan. Ini dapat ditingkatkan dengan mengumpulkan lebih banyak data atau dengan mengubah teks menjadi representasi yang stabil untuk kepribadian oleh pengetahuan eksternal.
Dalam penelitian mendatang, mereka berencana untuk menerapkan pembelajaran tanpa pengawasan pada data teks dan menggunakan pengetahuan eksternal tentang kepribadian untuk mengelompokkan teks. Kemudian saran dari kami mereka juga harus melakukan perbaikan pada model CNN yang mereka gunakan agar mendapatkan nilai akurasi yang lebih baik dibanding hasil yang didapatkan sekarang.
Referensi:
J. Yu and K. Markov, “Deep learning based personality recognition from Facebook status updates,” 2017 IEEE 8th International Conference on Awareness Science and Technology (iCAST), Taichung, 2017, pp. 383-387, doi: 10.1109/ICAwST.2017.8256484.