Klasifikasi Konten Web Radikal Di Indonesia menggunakan Web Content Mining Dan Algoritma K-Nearest Neighbor
DOI:
https://doi.org/10.55606/isaintek.v4i2.3Keywords:
Indonesia, Radical Content, Nearest Neighbour, K-NNAbstract
Konten radikal dalam arti procedural adalah konten memprovokasi kekerasan menyebarkan kebencian dan anti nasionalisme. Definisi radikal di setiap negara sangat berbeda, khususnya di Indonesia, konten radikal lebih identik dan sering dikaitkan dengan isu provokasi, kebencian terhadap Suku dan Agama (SARA) tertentu. Konten SARA masih sangat sulit dideteksi, selain karena jumlahnya sangat banyak, tidak terstruktur dan banyak noise juga menimbukan multitafsir Sehingga dapat mengancam persatuan dan kerukunan umat beragama. Berdasarkan hal tersebut, maka dibutuhkan solusi berupa sistem yang mampu membedakan antara konten radikal atau bukan. Pada penelitian ini, kami mengusulkan sistem tersebut melalui pendekatan text mining dengan menggunakan DF Threshold dan Human Brain sebagai ekstraksi fiturnya. Dimana system ini dibagi beberapa tahap yaitu, collecting data dan preprocessing, text mining, fitur seleksi, klasifikasi untuk mengelompokkan data dengan kelas label yang ada, perhitungan kemiripan data latih, terakhir visualisasi konten terkategori radikal atau bukan radikal. Pengujian dilakukan melalui 10-cross validation dengan k-Nearest Neighbor (kNN) sebagai metode klasifikasinya. Berdasarkan uji coba tersebut, maka didapatkan performansi, berupa nilai akurasi, tertinggi dari proposed method sebesar 66.37% dengan nilai k pada kNN sebesar 7.