Pendeteksian Berita Hoax Berbasis Support Vector Machine di Berita Online Indonesia
Oleh Pangondian Prederikus Sihombing, Riyanto Jayadi, Edward Chandra dan Stefanie Liu
Pesatnya perkembangan teknologi informasi dan media sosial mengakibatkan penyebaran informasi lebih banyak berupa berita digital dan mengubah media analog menjadi media online. Namun, penyebaran berita di media online tidak semuanya benar (hoax). Permasalahan yang dihadapi oleh pengguna internet berita hoax dapat diselesaikan melalui pengenalan pola.
Penelitian dilakukan terhadap 2.000 berita Indonesia, 1.000 untuk berita non-hoax, dan 1.000 untuk berita hoax. Data dikumpulkan dari portal berita online Indonesia dengan metode teks crawling. Model penelitian dibangun dengan menggunakan metodologi CRISP-DM. Penelitian ini juga telah melalui proses tokenizing, case folding, normalization, filtering, stopwords remove, stemming, dan TF-IDF.
Hasil penelitian menunjukkan bahwa proses analisis sentimen berita dilakukan dengan menghitung jumlah bobot sentimen hoax dan non-hoax yang terdapat dalam konten berita berbahasa Indonesia. Setelah itu dilakukan proses klasifikasi melalui tahap preprocessing, analisis sentimen dan perhitungan bobot kata dengan TF-IDF. Berdasarkan bobot tersebut akan dihitung kedekatan kata dengan data uji dan data latih.
Dengan proses menganalisis kata-kata dalam berita akan dapat menganalisis sentimen berita yang terkandung dalam kata tersebut. Berdasarkan hasil analisis sentimen menggunakan metode SVM Predictor menghasilkan presisi 96%, akurasi 96%, recall 95,5% dan ROC 0,98. Berdasarkan hasil tersebut dapat disimpulkan bahwa pemodelan ini dapat digunakan untuk mendukung pendeteksian berita hoax di Indonesia saat ini. Diharapkan model ini juga dapat diterapkan sehingga membantu pemerintah menyaring berita yang akan disebarluaskan kepada masyarakat Indonesia. Dengan begitu pemerintah bisa meminimalisir pemberitaan yang tidak semestinya menjadi konsumsi masyarakat Indonesia
Selengkapnya di http://dx.doi.org/10.30534/ijatcse/2020/297942020