Pemodelan Risiko Prediktif melalui Pemrosesan Bahasa Alami pada Laporan Keselamatan Industri

Ilustrasi by AI 

AI Mampu Prediksi Jenis Cedera Konstruksi dari Laporan Tertulis dengan Akurasi 79 Persen

Sebuah studi terbaru yang dipublikasikan tahun 2026 di Internasional Journal of Integrative Sciences menunjukkan bahwa kecerdasan buatan mampu memprediksi jenis cedera kerja hanya dari analisis laporan kecelakaan tertulis. Penelitian ini dilakukan oleh Kimberly Long Holt, MS, dari Health and Safety Concepts – Environmental Health & Safety. Dengan menganalisis 16.878 laporan kecelakaan konstruksi periode 2018–2022 menggunakan Natural Language Processing (NLP) dan machine learning, Holt menemukan bahwa sistem AI dapat mengubah laporan naratif menjadi alat prediksi risiko yang akurat dan proaktif. Temuan ini penting karena membuka peluang pencegahan cedera sebelum kecelakaan serius terjadi.

Penelitian berjudul “Predictive Risk Modeling via Natural Language Processing of Industrial Safety Reports” tersebut memperlihatkan bagaimana data teks yang selama ini jarang dimanfaatkan dapat menjadi sumber intelijen keselamatan yang bernilai tinggi.

Masalah Besar di Balik Laporan Kecelakaan

Kecelakaan kerja masih menjadi persoalan sosial dan ekonomi di berbagai sektor industri. Cedera non-fatal menyebabkan hilangnya produktivitas, peningkatan biaya asuransi, denda regulasi, serta dampak jangka panjang bagi pekerja dan keluarganya.

Di industri konstruksi, laporan kecelakaan biasanya sangat detail. Petugas keselamatan mencatat kronologi kejadian, kondisi lingkungan, alat yang digunakan, hingga perilaku pekerja. Namun sebagian besar organisasi hanya menganalisis data terstruktur seperti tanggal, lokasi, atau kategori biaya. Bagian naratif yang panjang sering kali tidak dianalisis secara sistematis.

Padahal, menurut Holt, justru di dalam teks bebas itulah tersimpan pola-pola risiko yang penting.

Perkembangan teknologi NLP memungkinkan komputer memahami dan mengolah bahasa manusia dalam jumlah besar. Teknologi ini sudah digunakan di sektor penerbangan, kesehatan, dan industri kimia. Kini pendekatan yang sama diterapkan pada keselamatan konstruksi.

Cara Penelitian Dilakukan

Penelitian ini menggunakan desain kuantitatif berbasis data sekunder. Total 16.878 laporan kecelakaan konstruksi dianalisis. Setiap laporan memuat data terstruktur dan deskripsi naratif.

Proses analisis dilakukan dalam empat tahap utama:

1. Seleksi dan pembersihan data
Laporan yang tidak lengkap atau terlalu singkat dihapus untuk menjaga kualitas analisis.

2. Pemrosesan teks (NLP)
Teks dibersihkan dan distandarkan melalui pemecahan kalimat menjadi kata-kata, penghapusan kata umum yang tidak bermakna, serta penyederhanaan bentuk kata. Istilah teknis seperti PPE dan OSHA tetap dipertahankan.

3. Konversi teks menjadi data numerik
Sistem menggunakan metode pembobotan kata untuk menyoroti istilah risiko yang paling relevan.

4. Pemodelan machine learning
Beberapa algoritma diuji. Model terbaik adalah Random Forest, metode berbasis kumpulan pohon keputusan yang dikenal stabil dan akurat.

    Model ini dilatih untuk memprediksi tiga jenis cedera:

    • Cedera anggota tubuh atas
    • Cedera anggota tubuh bawah
    • Cedera kepala dan leher

      Hasil Utama Penelitian

      Model Random Forest menunjukkan performa yang kuat:

      • Akurasi: 79,3 persen
      • Presisi: 77,1 persen
      • Recall: 78,0 persen
      • F1-score: 78,5 persen
      • AUROC: 0,98

        Nilai AUROC 0,98 menunjukkan kemampuan hampir sempurna dalam membedakan jenis cedera.

        Artinya, hampir 4 dari 5 kasus cedera dapat diprediksi dengan benar berdasarkan isi laporan naratif.

        Faktor Paling Berpengaruh

        Analisis menunjukkan bahwa:

        • Mekanisme kecelakaan dan sifat cedera menjadi prediktor terkuat.
        • Faktor waktu (hari atau shift kerja) tidak terlalu berpengaruh.
        • Faktor ekonomi seperti biaya proyek juga bukan penentu utama jenis cedera.

          Temuan ini menegaskan bahwa detail fisik kejadian lebih menentukan hasil cedera dibanding faktor administratif.

          Dampak bagi Industri dan Kebijakan

          Penelitian ini menandai pergeseran dari pendekatan keselamatan yang reaktif menjadi proaktif.

          Selama ini, indikator keselamatan seperti tingkat kecelakaan hanya menggambarkan kejadian masa lalu. Model berbasis NLP memungkinkan perusahaan memanfaatkan data historis untuk memprediksi risiko di masa depan.

          Beberapa manfaat praktisnya antara lain:

          • Mengidentifikasi pola berisiko tinggi dalam laporan nyaris celaka (near miss)
          • Mengarahkan pelatihan keselamatan pada risiko paling dominan
          • Mengalokasikan sumber daya pengawasan secara lebih tepat
          • Mendukung pengambilan keputusan manajemen berbasis data

            Kimberly Long Holt dari Health and Safety Concepts – Environmental Health & Safety menegaskan bahwa laporan naratif mengandung sinyal prediktif yang selama ini terabaikan. Dengan analisis yang tepat, organisasi dapat melakukan intervensi lebih awal sebelum cedera serius terjadi.

            Model ini tidak menggantikan peran profesional keselamatan kerja. Sebaliknya, AI berfungsi sebagai alat pendukung keputusan yang membantu analisis dalam skala besar secara konsisten.

            Potensi Pengembangan Lintas Industri

            Metode yang digunakan dalam studi ini bersifat replikatif dan dapat diterapkan pada sektor lain seperti:

            • Manufaktur
            • Pertambangan
            • Minyak dan gas
            • Kesehatan
            • Penerbangan

              Selama organisasi memiliki sistem pelaporan insiden yang terdokumentasi dengan baik, teknologi NLP dapat diintegrasikan untuk meningkatkan intelijen risiko.

              Namun, implementasi tetap memerlukan tata kelola data yang baik dan perlindungan privasi pekerja. Holt menekankan bahwa sistem prediktif harus digunakan untuk perlindungan keselamatan, bukan sebagai alat pengawasan yang merugikan pekerja.

              Profil Penulis

              Kimberly Long Holt, MS
              Health and Safety Concepts – Environmental Health & Safety

              Sumber Penelitian

              Holt, K. L. (2026). Predictive Risk Modeling via Natural Language Processing of Industrial Safety Reports. Internasional Journal of Integrative Sciences, Vol. 5, No. 2, halaman 371–384.

              Posting Komentar

              0 Komentar