Ekstraksi Fitur dan Klasifikasi Pada Kalimat Sarkasme
Berdasarkan Cambridge English Dictionary sarkasme adalah penggunaan kalimat yang memiliki arti yang berbalikan dari apa yang di ucapkan, di gunakan untuk menyakiti perasaan seseorang atau untuk mengkritik sesuatu dengan konteks humor.
Pendapat lain mengartikan sarkasme sebagai ironi verbal yang mengekspresikan sikap negatif dan kritikal terhadap seseorang atau suatu peristiwa. Ironi verbal sendiri dapat di artikan sebagai ekspresi yang di mana arti dari suatu kata memiliki arti yang berbeda atau berlawanan dengan arti yang sebenarnya. Diungkapkan pula bahwa dari berbagai penelitian terhadap topik sarkasme ada beberapa fitur vokal yang sering kutip yaitu: nada yang tinggi; kenyaringan kata atau kalimat yang di tingkatkan; perubahan dalam waktu berbicara (misalnya, mengurangi kecepatan berbicara atau meningkatkan jumlah jeda); perubahan kualitas suara; monoton atau menurunkan nada. Kalimat sarkasme sering di gunakan untuk membalas hinaan dan juga di gunakan untuk mengkritik situasi yang kurang menyenangkan. Dalam penelitian terkait sarkasme dan observasinya di media sosial twitter, sarkasme dapat di cirikan sebagai satu atau kombinasi berikut:
- Sarkasme sebagai kontras sentimen. kalimat sarkastik secara awal di tangkap dalam arti harifahnya. Jika arti harifah kalimat di temukan tidak sesuai dengan konteks, maka baru arti dari kalimat tersebut di artikan
- Sarkasme sebagai bentuk ekspresi yang kompleks. Mengekspresikan sarkasme di butuhkan kondisi tertentu yang mendukung agar sarkasme dapat di artikan oleh orang yang menangkapnya.
- Sarkasme sebagai sarana untuk menyampaikan emosi. Fungsi utama dari sarkasme adalah bentuk penyampaian emosi seseorang. Kalimat sarkasme biasanya di ekspresikan kepada kondisi dan sikap yang negatif.
- Sarkasme sebagai tanda keakraban. Teman dan kerabat biasanya lebih mudah untuk mendeteksi sarkasme di banding orang asing.
- Sarkasme sebagai bentuk ekspresi tertulis. Dalam psikologi, sarkasme di pelajari sebagai bentuk ekpresi lisan. Tetapi penggunaan sarkasme dalam ekspresi tertulis juga dapat di temukan, terutama dengan berkembangnya media sosial.
Kalimat sarkasme memiliki struktur kalimat yang serupa, yang dapat di kenal dari penggunaan kata yang memiliki sentimen positif dan kata yang memiliki sentimen negatif yang bersebelahan dalam suatu kalimat. Dalam penelitian lainnya yang di lakukan, kalimat sarkasme sering muncul pada konten yang di buat oleh pengguna seperti blog atau forum, terutama dalam bahasa inggris, dan sulit untuk di analisis tidak hanya oleh mesin, tetapi juga manusia. Sarkasme dalam bahasa indonesia dapat di contohkan dalam kalimat “bagus sekali kinerja karyawan itu, semoga dia di pecat”, yang memiliki kata “bagus” dengan sentimen yang positif dan kata “pecat” dengan sentimen yang negatif.
Oleh karena itu penelitian sarkasme menjadi sangat menarik. Tulisan ini mencoba memaparkan bagaimana ekstraksi fitur yang dilakukan beberapa peneliti untuk dapat mengklasifikasikannya. Ada 3 kelompok teknik ekstraksi fitur yang bisa digunakan untuk mengklasifikasi kalimat tweeter. Teknik ini dilakukan setelah melewati proses preprocessing
- Sentiment-related
Di dalam kelompok ini, fitur – fitur yang di kumpulkan adalah fitur yang dapat mengindikasikan sentiment dari suatu teks. Kelompok ini di dasarkan oleh sifat dari sarkasme, yang di gunakan untuk mengekspresikan sikap negatif dan kritikal terhadap seseorang atau suatu peristiwa. Penilaian sentimen kata akan bedasarkan SentiWordNet yang di translasi menjadi bahasa Indonesia. Kata berbahasa inggris akan di beri nilai sesuai nilai bahasa inggris dari SentiWordNet. Kata yang tidak di temukan nilainya akan di berikan nilai netral yaitu 0. Fitur dalam kelompok ini berupa:
- pada fitur ini, Penggunaan unigram di tetap kan karena teks pada media sosial bahasa Indonesia lebih cenderung informal dan memiliki struktur yang acak.
- Sentimen kata. Di dalam fitur ini, setiap unigram yang di dapat dari tweet akan di berikan nilai sentiment (positif & negatif) dan di hitung jumlahnya. Fitur ini akan menghasilkan:
- Jumlah kata positif (kt+).
- Jumlah kata negatif (kt-).
- Sentimen Sentimen dari keseluruhan tweet di dapatkan dari jumlah nilai sentimen setiap bigram kata yang di hasilkan Penggunaan fitur ini di tetap kan karena pada bahasa Indonesia, kata negasi seperti “tidak”, “kurang”, “belum”, dan kata negasi lainnya dapat mengubah sentimen dari suatu kata. contoh penggunaan fitur ini dapat di lihat sebagai:
- “makanan ini kurang enak”. Kalimat tersebut akan menghasilkan bigram : [[“makanan”, “ini”], [“ini”, “kurang”], [“kurang”, “enak”]]
- Sentimen topik. Sentimen suatu topik juga di anggap sebagai fitur penting. Hal ini di karena kan suatu kalimat yang memiliki sentimen positif pada suatu topik yang memiliki sentimen negatif memungkin kan bahwa kalimat tersebut adalah sarkasme. Topik dari tweet akan di tentukan secara manual.
- Fitur emotikon di tambahkan karena emotikon sendiri dapat merubah sentimen dari suatu kalimat, yang dapat di contohkan dengan kalimat “hebat ya kerja gubernur kita L”, yang di mana arti dari kalimat sebenernya adalah mengkritik kinerja gubernur.
- Punctuation-related.
Kelompok dari fitur ini di dasar kan oleh sarkasme yang memiliki berbagai fitur vokal. Dengan abensinya fitur vokal dalam suatu teks, fitur tersebut di representasi kan oleh fitur tanda baca. Fitur dalam kelompok ini berupa:
- Jumlah kata all-caps. All-caps yang di maksud adalah kata yang semua huruf alfabetnya di kapital kan. Fitur ini di asumsikan sebagai pengganti dari fitur vokal sarkasme yang memiliki tingkat kenyaringan yang naik turun.
- Jumlah tanda baca. Penggunaan tanda baca yang berlebihan dapat mengindikasi tingkat emosi yang berbeda – beda. Dalam fitur ini, jumlah dari tanda baca yang di ambil adalah sebagai berikut:
- Jumlah titik (.)
- Jumlah tanda seru (!)
- Jumlah tanda tanya (?)
- Jumlah tanda petik (“)
- Jumlah kata di dalam Fitur ini akan di korelasi kan dengan fitur jumlah kata all-caps. Di mana jika jumlah kata di dalam tweet sama jumlahnya dengan jumlah kata all-caps, maka fitur all-caps dapat di abaikan.
- Syntatic and Semantic.
Kelompok dari fitur ini juga di dasar kan oleh sarkasme yang memiliki berbagai fitur vokal. Fitur ini menandakan emosi pada suatu kalimat. Fitur dalam kelompok ini berupa:
- Jumlah kata Kata interjeksi sendiri di gunakan untuk mengekspresikan emosi dalam 1 kata. Kata interjeksi dalam bahasa indonesia dapat di contoh kan dengan kata “cih”, “cis”, “ih”, “idih”, “wah”, “wow”, “duh”, “ai”, “lho”, “eh”, “oh”, “ah”, dan lain – lain. Penggunaan kata interjeksi dapat di contoh kan sebagai berikut:
- “ih pinter banget makan ga cuci tangan”.
- “alah gitu doang ga bisa”.
- “idih masa mahasiswa kayak gitu kelakuannya”