Sarkasme Pada Media Sosial.
Sarkasme adalah sebuah ungkapan ironi atau satir yang digunakan untuk menghentikan pembicaraan atau untuk menghina (Kreuz, R. J., & Glucksberg, S., 1989). Sarkasme digunakan untuk menandakan bahwa sebuah komentar memiliki sentimen negatif, karena secara tradisional sarkasme dianggap sebagai bentuk negatif, tajam dan pedas dari sebuah pendapat (Colston, H. L., 2000). Polaritas sentimen dari sebuah kalimat positif berubah menjadi negatif dan juga sebaliknya jika kalimat tersebut adalah kalimat yang bersifat sarkasme.
Sarkasme mempengaruhi pemahaman pembaca dan kualitas analisis pada analisis sentimen. Selain itu, cukup sulit untuk mendeteksi sarkasme jika dilakukan secara manual oleh pembaca dan jika tidak disadari akan menyesatkan pemahaman pembaca (Bharti, S. K., et al, 2016). Observasi yang dapat digunakan untuk menentukan sebuah ucapan atau kalimat adalah sebuah ungkapan sarkasme adalah pemilihan kata, pola kalimat, intonasi pencapaian kalimat dan gesture pada saat kalimat tersebut disampaikan. Pada konteks data sebagai sumber observasi, intonasi, ekrepresi wajah, dan gesture tidak terlihat, oleh karena itu kesalahan deteksi bisa saja terjadi sehingga dibutuhkan metode yang robust dalam mendeteksi sarkasme.
Secara garis besar, deteksi sarkasme dapat dilakukan menggunakan dua pendekatan, yaitu pendekatan menggunakan Machine Learning dan pendekatan menggunakan Rule-Based. Pendekatan-pendekatan tersebut memiliki kelebihan dan kekurangannya masing-masing. Pendekatan menggunakan machine learning membutuhkan dataset yang digunakan sebagai data training. Pendekatan ini dapat dikategorikan menjadi tiga kategori berdasarkan proses learning-nya, yaitu supervised machine learning, semi-supervised machine learning dan unsupervised machine learning. Akurasi dari pendekatan klasifikasi machine learning sangat baik, akan tetapi performa klasifikasinya domain dependent terhadap dataset yang digunakan pada saat training (Kundi, F. M., & Asghar, M. Z., 2014). Metode-metode yang masuk ke dalam kategori ini adalah Naïve Bayes, Maximum Entropy, SVM, dan Neural Network. Semua metode pada pendekatan machine learning membutuhkan proses training.
Rule-Based adalah pendekatan deteksi sarkasme menggunakan serangkaian rule yang dibangun berdasarkan pola-pola yang mengindikasikan sarkasme. Terdapat berbagai fitur yang dapat digunakan pada pendekatan ini, antara lain adalah lexical feature, pragmatic feature, dan hyperbole feature (Bharti, S. K., et al, 2017). Feature-feature tersebut diproses lebih lanjut untuk menemukan indikasi sarkasme. Proses tersebut antara lain adalah PBLGA (Parsing Based Lexicon Generation Algorithm), IWS (Interjection Word Start), TCUF (Tweet Contradicting Universal Facts), Coherence Identification, dan TCTDF (Tweet Contradicting Time-Dependent Facts) (Bharti, S. K., et al, 2016) (Tungthamthiti, P., Kiyoaki, S., & Mohd, M., 2014). Indikator-indikator tersebut dievaluasi menggunakan rule. Sarkasme dideteksi jika indikator-indikator tersebut memenuhi kondisi rule yang dibuat.
Penelitian deteksi sarkasme pada Bahasa Indonesia masih sedikit.
Pendekatan menggunakan machine learning dapat dibagi menjadi tiga, yaitu supervised machine learning, semi-supervised machine learning dan unsupervised machine learning. Pada pendekatan supervised machine learning dibutuhkan dataset yang telah diberi class tag, oleh karena itu dibutuhkan effort untuk mengumpulkan dan melakukan class tag pada sampel dataset tersebut. Pada pendekatan semi supervised learning, dibutuhkan beberapa dataset yang memiliki class tag Sedangkan pada unsupervised machine learning hanya dibutuhkan beberapa dataset yang telah diberi class tag atau tidak memiliki class tag sama sekali. Pendekatan ini membutuhkan dataset yang cukup besar sehingga proses training pada pendekatan machine learning adalah proses yang memakan biaya dan waktu yang banyak (Cao, J., et al, 2014). Akurasi dari pendekatan klasifikasi machine learning sangat baik, akan tetapi performa klasifikasinya domain dependent terhadap dataset yang digunakan pada saat training (Kundi, F. M., & Asghar, M. Z., 2014).
Metode-metode yang masuk ke dalam kategori ini adalah Naïve Bayes, Maximum Entropy, SVM, dan Neural Network. Semua metode pada pendekatan machine learning membutuhkan proses training sebelum dapat digunakan untuk melakukan proses klasifikasi. Rule-Based adalah pendekatan deteksi sarkasme menggunakan serangkaian rule yang dibangun berdasarkan pola-pola yang mengindikasikan sarkasme. Terdapat berbagai fitur yang dapat digunakan pada pendekatan ini, antara lain adalah lexical feature, pragmatic feature, dan hyperbole feature (Bharti, S. K., et al, 2017).
DAFTAR PUSTAKA
Asghar, M. Z., Khan, A., Ahmad, S., & Kundi, F. M. (2014). A review of feature extraction in sentiment analysis. Journal of Basic and Applied Scientific Research, 4(3), 181-186.
Bharti, S. K., Vachha, B., Pradhan, R. K., Babu, K. S., & Jena, S. K. (2016). Sarcastic sentiment detection in tweets streamed in real time: a big data approach. Digital Communications and Networks, 2(3), 108-121.
Bharti, S. K., Pradhan, R., Babu, K. S., & Jena, S. K. (2017). Sarcasm analysis on twitter data using machine learning approaches. In Trends in Social Network Analysis (pp. 51-76). Springer, Cham.
Cao, J., Zeng, K., Wang, H., Cheng, J., Qiao, F., Wen, D., & Gao, Y. (2014). Web-based traffic sentiment analysis: Methods and applications. IEEE transactions on Intelligent Transportation systems, 15(2), 844-853.
Colston, H. L. (2000). On necessary conditions for verbal irony comprehension. Pragmatics & Cognition, 8(2), 277-324.
Gastelum, Z. N., & Whattam, K. M. (2013). State-of-the-Art of Social Media Analytics Research (No. PNNL-22171). Pacific Northwest National Lab.(PNNL), Richland, WA (United States).
Hughes, D. J., Rowe, M., Batey, M., & Lee, A. (2012). A tale of two sites: Twitter vs. Facebook and the personality predictors of social media usage. Computers in Human Behavior, 28(2), 561-569.
Kumar, L., Somani, A., & Bhattacharyya, P. (2017). ” Having 2 hours to write a paper is fun!”: Detecting Sarcasm in Numerical Portions of Text. arXiv preprint arXiv:1709.01950.
Kundi, F. M., & Asghar, M. Z. (2014). Lexicon-based sentiment analysis in the social web. Journal of Basic and Applied Scientific Research, 4(6).
Kreuz, R. J., & Glucksberg, S. (1989). How to be sarcastic: The echoic reminder theory of verbal irony. Journal of experimental psychology: General, 118(4), 374.
Le, T. A., Moeljadi, D., Miura, Y., & Ohkuma, T. (2016). Sentiment Analysis for Low Resource Languages: A Study on Informal Indonesian Tweets. In Proceedings of the 12th Workshop on Asian Language Resources (ALR12) (pp. 123-131).
Liebrecht, C. C., Kunneman, F. A., & van Den Bosch, A. P. J. (2013). The perfect solution for detecting sarcasm in tweets# not.
Lunando, E., & Purwarianti, A. (2013, September). Indonesian social media sentiment analysis with sarcasm detection. In Advanced Computer Science and Information Systems (ICACSIS), 2013 International Conference on (pp. 195-198). IEEE.
Jiang, D., Luo, X., Xuan, J., & Xu, Z. (2017). Sentiment computing for the news event based on the social media big data. IEEE Access, 5, 2373-2382.
Novaković, J. D., Veljović, A., Ilić, S. S., Papić, Ž., & Milica, T. (2017). Evaluation of Classification Models in Machine Learning. Theory and Applications of Mathematics & Computer Science, 7(1), 39-46.
Ptáček, T., Habernal, I., & Hong, J. (2014). Sarcasm detection on czech and english twitter. In Proceedings of COLING 2014, the 25th International Conference on Computational Linguistics: Technical Papers (pp. 213-223).