PENGGUNAAN METODE NBC DAN LINEARITASNYA UNTUK TEKS HUKUM

Rubric of Faculty Members

Oleh SHIDARTA dan YI YING (Agustus 2021)

Artikel ini ditulis karena didorong oleh kemunculan artikel kami yang juga ditulis bersama dengan Prof. Tirta Nugraha Mursitama, dan Lohansen, berjudul “Effectiveness of the News Text Classification Test Using the Naïve Bayes’ Classification Text Mining Method” yang dipublikasikan dalam Journal of Physics: Conference Series 1764(2021)012105. Latar belakang pendidikan dari kami berempat cukup beragam. Prof. Tirta adalah seorang guru besar dalam manajemen yang juga pakar di bidang hubungan internasional. Yi Ying dan Lohansen menekuni linguistik. Shidarta adalah seorang penstudi filsafat hukum, yang cukup lama menaruh minat pada kajian bahasa hukum (legal language). Pada tahun 2017, misalnya, Shidarta pernah menulis tentang “Laws of Language and Legal Language: A Study of Legal Language in Some Indonesian Regulations” yang dipublikasikan dalam Jurnal Humaniora, Vol. 8 No.1(2017). Kajian-kajiannya tentang putusan hakim juga membuktikan minatnya tentang bahasa hukum itu, antara lain pada tulisan-tulisannya di Jurnal Yudisial. Salah satu tulisan Shidarta yang penting disimak tentang analisis putusan hakim ini, berjudul “Mencari Jarum Kaidah di Tumpukan Jerami Yurisprudensi” dalam Jurnal Yudisial Vol. 5 No.3(2012).

Mari kita kembali ke isi artikel pada Journal of Physics: Conference Series di atas! Muncul pertanyaan yang sering diajukan oleh para ahli hukum, yaitu apa kaitannya kajian itu dengan area hukum? Dengan perkataan lain, apakah ada linearitasnya dengan kajian dalam disiplin hukum, khususnya filsafat hukum?

Harus diakui bahwa artikel tersebut belum benar-benar menyentuh diskursus filsafat hukum, karena artikel tersebut ingin membatasi diri pada pengenalan suatu metode. Penekanannya lebih pada aspek linguistik, sehingga kontribusi keilmuan dari dua penulis terakhir (Dr. Yi Ying dan Lohansen) terlihat lebih dominan. Namun, tulisan itu sendiri merupakan tawaran menarik bagi pengkaji teks hukum, yang notabene telah sejak lama menjadikan tafsir maknawi atas teks hukum sebagai diskursus menarik bagi peminat filsafat hukum di ranah epistemologi. Hal ini dapat dibuktikan dari begitu banyaknya artikel dalam penalaran hukum yang juga menelaah kajian-kajian teks. Sebagai salah satu contoh mutakhir adalah artikel yang ditulis oleh Adam Wyner et al. (2010), “Approaches to Text Mining Arguments from Legal Cases” yang sudah diunduh lebih ari 2000 kali. Dalam bagian latar belakang artikel mereka, Adam Wyner et al., menyatakan:

Research in argumentation is interdisciplinary, relating discussions found in Philosophy, Linguistics, and Computer Science. Empirically oriented approaches attend to specific, linguistically realised argument structures, properties, or elements of legal texts. Given analyses of argument patterns, arguments can be graphically represented as trees, where premises branch off of conclusions. XML markup languages have been developed for argumentation such that an argument, once marked up, can be searched for or used for reasoning. While the results of some of this work can be used for information extraction, it is not produced automatically and is not suitable for working with large corpora.

Analisis tentang teks hukum melalui alat bantu teknologi informasi memang masih terbilang baru di Indonesia karena hal itu membutuhkan kajian interdisipliner. Model kolaborasi antar-disiplin belum menjadi tradisi ilmiah di kalangan ilmuwan Indonesia. Kendati jurusan-jurusan aneka disiplin itu sudah dinaungi di bawah satu fakultas, misalnya fakultas humaniora, pada kenyataannya tetap saja para akademisinya tidak terbuka untuk saling menyapa secara keilmiuan. Oleh sebab itu tidak mengherankan apabila kajian interdisipliner memang tidak cukup berkembang. Adam Wyner pada kutipan di atas, menyebutkan kajian tentang analisis teks hukum dengan mengunakan teknologi informasi harus melibatkan paling sedikit: penstudi filsafat (jadi tidak keliru untuk mengaitkannya dengan filsafat hukum), lingusitik, dan ilmu komputer.

Dengan semangat kolaborasi secara interdisipliner itulah, artikel kami di Journal of Physics: Conference Series tersebut secara spesifik menyoroti tentang pengujian efektivitas pengklasifikasian teks berita dengan menggunakan Metode Text Mining Naïve Bayes Classification (TM-NBC). Latar belakang dari pengujian ini bermula dari gagasan Dr. Yi Ying dan mahasiswa bimbingannya Lohansen dari Jurusan Sastra China Universitas Bina Nusantara berkenaan dengan kesulitan yang kerap dialami para pengiat media sosial saat mereka berhadapan dengan berbagai jenis berita yang perlu diklasifikasi sesuai kriteria yang ada. Misalnya, mana berita politik, ekonomi, budaya, hukum, dan lain-lain. Selama ini, pengklasifikasian dilakukan secara manual. Atas dasar kesulitan itulah, lalu muncul ide untuk mengembangkan metode machine learning. Mesin ini akan melakukan prepocessing data pada teks-teks berita itu. Metode preprocessing data inilah yang disebut sebagai text mining.

Dalam artikel tersebut diungkapkan bahwa para penulis telah melakukan text mining terhadap berita-berita berbahasa Inggris dari website portal berita TheOnion dan Huffpost. Pemilihan terhadap berita-berita pada dua portal ini menarik, karena berita-berita di sana punya karateristik tersendiri, yaitu ditulis oleh para profesional, sehingga kesalahan-kesalahan penulisan teksnya–seperti kekeliruan ejaan–dapat diminimalisasi. Di samping itu reputasi dari berita utama The Onion dan Huffington Post sudah sangat dikenal di Amerika Serikat dengan berita sarkastiknya. Nah, jika berita-berita itu dilakukan pengklasifikasian dengan menggunakan TM-NBC, apakah efektif?

NBC sendiri adalah kumpulan algoritma klasifikasi berdasarkan Teorema Bayes. Pengklasfikasiannya sendiri melewati beberapa tahap, yang tentu teknisnya akan lebih pas dijelaskan oleh ahli-ahli dalam ilmu komputer. Singkat kata, artikel yang ditulis oleh Yi Ying, Tirta Mursitama, Shidarta, dan Lohansen itu sampai pada kesimpulan bahwa proses text mining yang telah dilakukan melalui metode TM-NBC mampu menghasilkan machine learning yang dapat memprediksi makna sarkasme yang terkandung dalam berita-berita yang menjadi objek penelitian.

Para penstudi hukum kiranya perlu juga melirik arti penting kajian seperti ini. Sebab, tatkala wacana filsafat hukum di era modern ikut tersedot perhatiannya untuk mengambil logosentrisme sebagai wacananya, maka tidak dapat dihindari bahwa masalah-masalah yang menyelimuti perdebatan teks sudah dan akan terus mengemuka.

Barangkali masih segar dalam ingatan kita, kasus tuduhan penodaan agama yang dialamatkan pada mantan Gubernur DKI Jakarta, yang bermula pada tafsir terhadap potongan ucapan lisannya di hadapan masyarakat Kepulauan Seribu, yakni: “dibohongi pakai Kitab Suci”. Benarkah, misalnya, penggunaan kata “pakai” di sini sama maknanya dengan tanpa kata “pakai”? Apakah metode text mining, — dengan cara menelaah sumber teks itu dari berbagai dokumen, lalu tujuan penggunaan teks itu dengan menganalisis keterhubungan antara satu dokumen dengan dokumen lainnya, —dapat membantu para pengambil pengambil keputusan dalam menangani problematika hukum seperti kasus tersebut?

Dalam persidangan kasus Basuki Tjahaja Purnama yang berlangsung tanggal 21 Maret 2017, seorang ahli linguistik bernama Rahayu Surtiarti Hidayat (Universitas Indonesia) mengatakan bahwa terminologi “pakai” itu sama artinya dengan “menggunakan”. Jadi ujaran Basuki itu tidak dimaksudkan untuk mengatakan bahwa Al-Maidah 51 itu bohong, tetapi mensinyalir ada orang yang menggunakannya untuk membohongi orang lain.

Kaidah yurisprudensi pun dapat diteropong dengan kajian text mining. Para mahasiswa yang belajar hukum di Indonesia masih perlu didorong untuk lebih rajin mengkaji putusan-putusan pengadilan. Penalaran hukum yang diperagakan di dalam putusan-putusan tersebut terkadang tidak mudah diidentifikasi karena tersembunyi di balik cara pengungkapan yang tidak eksplisit. Apalagi jika putusan itu dilabelkan sebagai putusan yang mengandung penemuan hukum, bahkan layak disebut sebagai yurisprudensi. Hasil penelaahan kerap menunjukkan kaidah yurisprudensinya tidak ditemukan. Sungguh merupakan kerja keras untuk menelaah putusan-putusan yang demikian banyaknya itu dalam rangka mengetahui apa sesungguhnya kaidah yurisprudensi yang ingin dinyatakan oleh majelis hakim dan seberapa konsisten kaidah itu kemudian dikutip oleh hakim-hakim lain dalam kasus-kasus serupa. Kendala-kendala penelitian terhadap putusan-putusan hakim tersebut sangat mungkin akan terbantu dengan teknologi informasi.

Konvensi dalam hukum acara di Indonesia (mungkin hampir di seluruh dunia) sampai saat ini masih sangat mengandalkan keterangan ahli seperti di atas dalam rangka meyakinkan hakim. Perpsektifnya subjektif dan kualitatif. Pertanyaannya tentu saja, seberapa mungkin ada machine learning yang dapat menyajikan analisis teks tentang hal ini? Analisis yang tidak lagi personal, tetapi dengan menggunakan teknologi informasi dan diolah secara kuantitatif? Dan, hasilnya dapat diuji lagi secara statistik, antara lain untuk mencari tahu tingkat akurasinya.

Gagasan di atas tentu bukan hal baru dan orisinal karena sudah dikaji banyak ahli secara interdisipliner. Namun, tidak demikian bagi sebagian besar penstudi hukum di Indonesia. Tawaran untuk menggunakan text mining seperti yang diajukan dalam tulisan ini, mungkin saja bakal dicap sebagai provokasi yang tidak perlu. Namun, bukankah penstudi filsafat hukum harus terbiasa dengan provokasi-provokasi seperti ini? Artikel kami berjudul “Effectiveness of the News Text Classification Test Using the Naïve Bayes’ Classification Text Mining Method” tersebut dapat dikatakan memberi dasar pijakan awal ke arah itu semua. (***)