Analisis Perbandingan antara Model Pembelajaran Mesin Tradisional dan Model Pembelajaran Mendalam Berurutan untuk Klasifikasi Email Spam

Gambar Ilustrasi AI

FORMOSA NEWS - Blitar - LSTM dan GRU Ungguli Algoritma Klasik dalam Memfilter Email Spam Berformat Pendek. Penelitian yang dilakukan oleh Harliana dan Achmad Alvi Yudanuari dari Universitas Nahdlatul Ulama Blitar, bekerja sama dengan Hartatik dari Universitas AMIKOM Yogyakarta dalam artikel penelitian yang dipublikasikan pada Formosa Journal of Computer and Information Science (FJCIS) edisi Vol. 5 No. 1 Tahun 2026 menyoroti bahwa keandalan model pembelajaran mendalam (deep learning) dalam memisahkan pesan bersih (ham) dari gangguan spam

.

Penelitian yang dilakukan oleh Harliana dan Achmad Alvi Yudanuari dari Universitas Nahdlatul Ulama Blitar, bekerja sama dengan Hartatik dari Universitas AMIKOM Yogyakarta menyoroti bahwa riset ini krusial untuk memberikan standar evaluasi yang adil dan konsisten bagi pengembang sistem keamanan digital di tengah membanjirnya data teks berformat pendek

.

Dilema Kata vs Konteks dalam Deteksi Spam
Selama ini, industri teknologi mengandalkan metode klasifikasi klasik seperti Logistic Regression yang dikombinasikan dengan pembobotan kata TF-IDF

. Metode ini disukai karena efisiensi komputasinya yang tinggi dan performanya yang stabil

. Namun, algoritma tradisional tersebut memiliki kelemahan fatal: mereka hanya menghitung frekuensi kemunculan kata tanpa mampu memahami urutan kalimat ataupun konteks linguistik yang ada

. Kondisi tersebut dimanfaatkan oleh para pelaku spam modern

. Mereka memanipulasi struktur teks dan menggunakan variasi bahasa agar pesan sampah mereka terlihat seperti pesan penting bagi pengguna

. Di sisi lain, teknologi deep learning berbasis sekuensial hadir menawarkan kemampuan mengingat hubungan antar-kata, namun performanya sering kali inkonsisten jika diterapkan pada data teks pendek, seperti SMS atau pesan obrolan singkat

.

Standardisasi Metodologi dengan Framework Terkontrol
Untuk menguji performa sejati dari masing-masing teknologi tanpa adanya bias eksternal, tim peneliti merancang sebuah framework evaluasi terkontrol

. Mereka menggunakan satu basis data seragam berisi 5.572 pesan

. Data tersebut memiliki ketimpangan kelas yang nyata, yakni terdiri dari 4.825 pesan normal dan hanya 747 pesan spam

. Guna menghindari eror estimasi, peneliti menerapkan teknik oversampling khusus pada data pelatihan (80% dari total data) untuk menyeimbangkan porsi kedua kelas pesan tanpa memicu kebocoran data (data leakage) pada fase pengujian (20% sisa data)

.
Ada empat model komputasi yang diuji secara head-to-head di bawah kondisi eksperimen yang identik

Logistic Regression (TF-IDF): Digunakan sebagai garis dasar (baseline) mewakili mesin pembelajar tradisional.
Recurrent Neural Network (RNN): Model deep learning sekuensial dasar.
Long Short-Term Memory (LSTM): Model lanjutan dengan mekanisme gerbang (gating) untuk mengingat informasi jangka panjang.
Gated Recurrent Unit (GRU): Varian LSTM yang lebih ringkas dan hemat daya komputasi.

Hasil Eksperimen: Menang Tipis, Unggul Konteks

Secara umum, seluruh model menunjukkan akurasi yang luar biasa tinggi, berkisar antara 98% hingga 99%. Pengujian mendalam memetakan angka riil performa masing-masing model sebagai berikut: Logistic Regression klasik mencatatkan recall tinggi (0,95), yang berarti ia sangat sensitif dalam menyapu bersih spam. Sayangnya, tingkat presisinya paling rendah (0,93), ditandai dengan lolosnya 11 pesan normal yang salah dituduh sebagai spam (false positive). Ini membuktikan bahwa model tradisional mudah terkecoh jika pesan biasa menggunakan kata-kata yang mirip dengan pola spam. Sebaliknya, RNN tampil sangat kaku dan konservatif. Presisinya nyaris sempurna (0,99), namun recall-nya merosot ke angka 0,92 karena mencatatkan 12 false negative (spam yang lolos ke kotak masuk) akibat kendala hilangnya gradien (vanishing gradient) saat membaca rangkaian teks. Puncak performa terbaik diraih secara kembar oleh LSTM dan GRU dengan nilai F1-Score mencapai 0,97. Berkat mekanisme gerbang digital di dalam arsitekturnya, kedua model ini mampu menahan informasi relevan dan membuang derau teks. Hasilnya, mereka hanya menghasilkan 1 kesalahan alarm (false positive) dan meloloskan 9 spam dari total pengujian. Grafik pembelajaran juga menunjukkan GRU memiliki kurva validasi yang lebih stabil dan efisien dibandingkan LSTM karena struktur arsitekturnya yang lebih sederhana.

Implikasi Bagi Industri dan Keamanan Siber
Penelitian ini membawa dampak praktis yang besar bagi dunia usaha dan penyedia layanan teknologi komunikasi. Bagi platform dengan infrastruktur raksasa, integrasi GRU atau LSTM adalah harga mati untuk menurunkan angka salah filter, demi menjaga kenyamanan pengalaman pengguna agar pesan penting tidak masuk ke folder spam secara keliru. Namun, riset ini juga memberikan pembelaan bagi Logistic Regression. Bagi perusahaan rintisan (startup) atau aplikasi dengan keterbatasan modal dan sumber daya komputasi, model klasik berbasis TF-IDF ini dinilai masih sangat layak diandalkan sebagai fondasi awal penyaringan karena efisiensi biayanya yang tinggi.

Profil Peneliti
Harliana, S.Kom., M.Kom. – Dosen dan peneliti di Program Studi Ilmu Komputer, Universitas Nahdlatul Ulama Blitar. Memiliki fokus keahlian di bidang pemrosesan bahasa alami (Natural Language Processing) dan kecerdasan buatan.
Hartatik, S.Si., M.Cs. – Akademisi dan peneliti senior di Universitas AMIKOM Yogyakarta, aktif dalam pengembangan riset rekayasa perangkat lunak dan komputasi cerdas.
Achmad Alvi Yudanuari, S.Kom., M.M. – Peneliti di Universitas Nahdlatul Ulama Blitar yang menaruh minat besar pada analisis data dan sistem informasi manajemen.

Sumber Penelitian
Harliana, Hartatik, Achmad Alvi Yudanuri (2026). Comparative Analysis of Traditional Machine Learning and Sequential Deep Learning Models for Spam Email Classification. Formosa Journal of Computer and Information Science (FJCIS), Vol. 5, No. 1, 2026
DOI: https://doi.org/10.55927/fjcis.v5i1.16502
URL: https://journal.formosapublisher.org/index.php/fjcis

Analisis Perbandingan antara Model Pembelajaran Mesin Tradisional dan Model Pembelajaran Mendalam Berurutan untuk Klasifikasi Email Spam

Diposting oleh Sarah Hutabarat

Posting Komentar

0 Komentar

Tampilkan Iklan

FORMOSA NEWS

200ribu/Bulan

Facebook

Home Top Ad

Iklan right sidebar

Main Tags

Random Posts

The Efforts to Preserve and Develop Jakarta's Old City to Meet the Criteria as a World Heritage Site

Perbedaan SPSS, AMOS, dan SMART PLS: Kapan dan dalam Situasi Apa Menggunakannya?

Deretan Artis Indonesia yang Terlibat Skandal Perselingkuhan

Latest

Popular Posts

The Efforts to Preserve and Develop Jakarta's Old City to Meet the Criteria as a World Heritage Site

Pemetaan Desa Wisata di Maluk Dorong Diversifikasi Ekonomi Pascatambang di Sumbawa Barat

Tips Menyelesaikan Skripsi Atau Tesis Tepat Waktu

Footer Menu Widget

Contact form

Analisis Perbandingan antara Model Pembelajaran Mesin Tradisional dan Model Pembelajaran Mendalam Berurutan untuk Klasifikasi Email Spam

Diposting oleh Sarah Hutabarat

Anda mungkin menyukai postingan ini

Posting Komentar

0 Komentar

Tampilkan Iklan

FORMOSA NEWS

200ribu/Bulan

Facebook

Home Top Ad

Iklan right sidebar

Main Tags

Social Plugin

Random Posts

The Efforts to Preserve and Develop Jakarta's Old City to Meet the Criteria as a World Heritage Site

Perbedaan SPSS, AMOS, dan SMART PLS: Kapan dan dalam Situasi Apa Menggunakannya?

Deretan Artis Indonesia yang Terlibat Skandal Perselingkuhan

Latest

Popular Posts

The Efforts to Preserve and Develop Jakarta's Old City to Meet the Criteria as a World Heritage Site

Pemetaan Desa Wisata di Maluk Dorong Diversifikasi Ekonomi Pascatambang di Sumbawa Barat

Tips Menyelesaikan Skripsi Atau Tesis Tepat Waktu

Footer Menu Widget

Contact form