Analisis Perbandingan antara Model Pembelajaran Mesin Tradisional dan Model Pembelajaran Mendalam Berurutan untuk Klasifikasi Email Spam


Gambar Ilustrasi AI

FORMOSA NEWS - Blitar - LSTM dan GRU Ungguli Algoritma Klasik dalam Memfilter Email Spam Berformat Pendek. Penelitian yang dilakukan oleh Harliana dan Achmad Alvi Yudanuari dari Universitas Nahdlatul Ulama Blitar, bekerja sama dengan Hartatik dari Universitas AMIKOM Yogyakarta  dalam artikel penelitian yang dipublikasikan pada Formosa Journal of Computer and Information Science (FJCIS) edisi Vol. 5 No. 1 Tahun 2026 menyoroti bahwa keandalan model pembelajaran mendalam (deep learning) dalam memisahkan pesan bersih (ham) dari gangguan spam.

Penelitian yang dilakukan oleh Harliana dan Achmad Alvi Yudanuari dari Universitas Nahdlatul Ulama Blitar, bekerja sama dengan Hartatik dari Universitas AMIKOM Yogyakarta menyoroti bahwa 
riset ini krusial untuk memberikan standar evaluasi yang adil dan konsisten bagi pengembang sistem keamanan digital di tengah membanjirnya data teks berformat pendek.

Dilema Kata vs Konteks dalam Deteksi Spam
Selama ini, industri teknologi mengandalkan metode klasifikasi klasik seperti Logistic Regression yang dikombinasikan dengan pembobotan kata TF-IDF. Metode ini disukai karena efisiensi komputasinya yang tinggi dan performanya yang stabil. Namun, algoritma tradisional tersebut memiliki kelemahan fatal: mereka hanya menghitung frekuensi kemunculan kata tanpa mampu memahami urutan kalimat ataupun konteks linguistik yang adaKondisi tersebut dimanfaatkan oleh para pelaku spam modern. Mereka memanipulasi struktur teks dan menggunakan variasi bahasa agar pesan sampah mereka terlihat seperti pesan penting bagi pengguna. Di sisi lain, teknologi deep learning berbasis sekuensial hadir menawarkan kemampuan mengingat hubungan antar-kata, namun performanya sering kali inkonsisten jika diterapkan pada data teks pendek, seperti SMS atau pesan obrolan singkat.

Standardisasi Metodologi dengan Framework Terkontrol
Untuk menguji performa sejati dari masing-masing teknologi tanpa adanya bias eksternal, tim peneliti merancang sebuah framework evaluasi terkontrol. Mereka menggunakan satu basis data seragam berisi 5.572 pesan. Data tersebut memiliki ketimpangan kelas yang nyata, yakni terdiri dari 4.825 pesan normal dan hanya 747 pesan spamGuna menghindari eror estimasi, peneliti menerapkan teknik oversampling khusus pada data pelatihan (80% dari total data) untuk menyeimbangkan porsi kedua kelas pesan tanpa memicu kebocoran data (data leakage) pada fase pengujian (20% sisa data).
Ada empat model komputasi yang diuji secara head-to-head di bawah kondisi eksperimen yang identik:
  • Logistic Regression (TF-IDF): Digunakan sebagai garis dasar (baseline) mewakili mesin pembelajar tradisional.
  • Recurrent Neural Network (RNN): Model deep learning sekuensial dasar.
  • Long Short-Term Memory (LSTM): Model lanjutan dengan mekanisme gerbang (gating) untuk mengingat informasi jangka panjang.
  • Gated Recurrent Unit (GRU): Varian LSTM yang lebih ringkas dan hemat daya komputasi.
Hasil Eksperimen: Menang Tipis, Unggul Konteks

Secara umum, seluruh model menunjukkan akurasi yang luar biasa tinggi, berkisar antara 98% hingga 99%. Pengujian mendalam memetakan angka riil performa masing-masing model sebagai berikutLogistic Regression klasik mencatatkan recall tinggi (0,95), yang berarti ia sangat sensitif dalam menyapu bersih spam. Sayangnya, tingkat presisinya paling rendah (0,93), ditandai dengan lolosnya 11 pesan normal yang salah dituduh sebagai spam (false positive). Ini membuktikan bahwa model tradisional mudah terkecoh jika pesan biasa menggunakan kata-kata yang mirip dengan pola spamSebaliknya, RNN tampil sangat kaku dan konservatif. Presisinya nyaris sempurna (0,99), namun recall-nya merosot ke angka 0,92 karena mencatatkan 12 false negative (spam yang lolos ke kotak masuk) akibat kendala hilangnya gradien (vanishing gradient) saat membaca rangkaian teksPuncak performa terbaik diraih secara kembar oleh LSTM dan GRU dengan nilai F1-Score mencapai 0,97. Berkat mekanisme gerbang digital di dalam arsitekturnya, kedua model ini mampu menahan informasi relevan dan membuang derau teks. Hasilnya, mereka hanya menghasilkan 1 kesalahan alarm (false positive) dan meloloskan 9 spam dari total pengujian. Grafik pembelajaran juga menunjukkan GRU memiliki kurva validasi yang lebih stabil dan efisien dibandingkan LSTM karena struktur arsitekturnya yang lebih sederhana.

Implikasi Bagi Industri dan Keamanan Siber
Penelitian ini membawa dampak praktis yang besar bagi dunia usaha dan penyedia layanan teknologi komunikasi. Bagi platform dengan infrastruktur raksasa, integrasi GRU atau LSTM adalah harga mati untuk menurunkan angka salah filter, demi menjaga kenyamanan pengalaman pengguna agar pesan penting tidak masuk ke folder spam secara keliruNamun, riset ini juga memberikan pembelaan bagi Logistic Regression. Bagi perusahaan rintisan (startup) atau aplikasi dengan keterbatasan modal dan sumber daya komputasi, model klasik berbasis TF-IDF ini dinilai masih sangat layak diandalkan sebagai fondasi awal penyaringan karena efisiensi biayanya yang tinggi.

Profil Peneliti
Harliana, S.Kom., M.Kom. – Dosen dan peneliti di Program Studi Ilmu Komputer, Universitas Nahdlatul Ulama Blitar. Memiliki fokus keahlian di bidang pemrosesan bahasa alami (Natural Language Processing) dan kecerdasan buatan.
Hartatik, S.Si., M.Cs. – Akademisi dan peneliti senior di Universitas AMIKOM Yogyakarta, aktif dalam pengembangan riset rekayasa perangkat lunak dan komputasi cerdas.
Achmad Alvi Yudanuari, S.Kom., M.M. – Peneliti di Universitas Nahdlatul Ulama Blitar yang menaruh minat besar pada analisis data dan sistem informasi manajemen.

Sumber Penelitian
Harliana, Hartatik, Achmad Alvi Yudanuri (2026). Comparative Analysis of Traditional Machine Learning and Sequential Deep Learning Models for Spam Email Classification. Formosa Journal of Computer and Information Science (FJCIS), Vol. 5, No. 1, 2026
DOI: https://doi.org/10.55927/fjcis.v5i1.16502
URL: https://journal.formosapublisher.org/index.php/fjcis

Posting Komentar

0 Komentar