JURNAL ILMIAH
Penggunaan Decision Tree (Pohon
Keputusan) Pada Resiko Pengguna Kendaraan di Jalan Raya
Nama : Faridatul Ilmi
NIM : 3115100924
Program Studi : D3
Mata Kuliah : Bahasa Indonesia
Dosen Pengampu : Drs. Agus Riyono
Penggunaan Decision Tree (Pohon
Keputusan) Pada Resiko Pengguna Kendaraan di Jalan Raya
Faridatul
Ilmi
Sekolah Tinggi Ilmu Komputer PGRI
Banyuwangi
Abstraksi
Di
dalam penulisan jurnal ilmiah ini berfungsi untuk mengetahui karakter para pengguna
jalan raya yang akan menggunakan jalan raya. Pemilihan pengguna ini dibutuhkan
untuk meminimalkan resiko yang dapat mengakibatkan kecelakaan dalam berlalu
lintas. Resiko tersebut dikategorikan tinggi (high), sedang(moderat), dan
rendah (low). Adapun adata pengguna
memiliki 5 buah atribut dan 100 record. Knowledge Discovery In Databases (KDD)
adalah salah satu metode yang digunakan untuk memperoleh pengetahuan dalam
sebuah basis data. Salah satu cara yang digunakan adalah penggunaan pohon
keputusan (Decision Tree). Pengetahuan tersebut di representasikan dalam bentuk
kaidah produksi, Algoritma yang digunakan adalah Iteractive Dichotomicer 3
(ID3).
Kata Kunci: jalan raya, Decision Tree, Knowledge Discovery In Databases(KDD)
I.
PENDAHULUAN
Proses
pengajuan kredit oleh nasabah(customer) menjadi semakin mudah, baik untuk
kredit barang maupun uang. Khususnya dalam perbankan, pengajuan kredit uang
dapat dilakukan oleh semua masyarakat dengan memenuhi syarat-syarat yang ditentukan oleh bank
tersebut. Untuk menghindari adanya kredit macet, perlu diketahui profil nasbah
khususnya yang akan melakukan kredit, sehingga resikonya menjadi minimal.
Knowledge Discovery In Databases (KDD) metode untuk memperoleh pengetahuan dari
basis data yang dibentuk. Di dalamnya berisi tabel-tabel yang saling
berhubungan/berelasi. Hasilnya digunakan sebagai basis pengetahuan (knowledge
base) untuk keperluan pengambilan keputusan. Dengan cara menambang data dengan
pohon keputusan(decision tree).
II.
PERMASALAHAN
Berdasrkan
latar belakang diatas, salah satu pokok permasalahan yang diangkat adalah
bagaimana memperoleh pengetahuan untuk mengindentifikasi pengguna jalan raya
sehingga meminimalkan adanya resiko kecelakaan ataupun permaslahan lain yang
mengganggu kelancaran dalam berlalu lintas. Cara yang digunakan menggunakan
pohon keputusan (decision tree) dengan algorima interactive dichotomicer 3
(ID3) .
A. Pohon
Keputusan (decision tree)
Algoritma induksi
yang paling umum digunakan adalah kelompok TDIDT (Top Down Induction Decision
Tree). Algoritma ini didasarkan pada algorima lain yaitu ID3 (Interactive
Dichotomicer 3). Input algoritma ini
adalah sebuah database dengan beberapa variabel yang juga dikenal dengan
atribut. Setiap masukan dalam database dengan beberapa variabel bebas. Sebuah atribut
didesain untuk mengklasifikasikan obyek, yang selanjutnya disebut vriabel tidak
bebas. Masalah yang harus dipecahkan adalh proses klasifikasi terhadap data
yang disimpan dalam database. Algoritma TDIDT memerlukan 2 langkah yaitu
membangun pohon keputusan dan menyederhanakannya. Pohon keputusan terdiri dari rangkaian
tes sehungga terjadi klasifikasi diantara data atau obyek yang disimpan.
B.
Bagan Pohon Keputusan
Proses
Klasifikasi dilakukan dari node paling atas atau akar pohon (root). Dilanjutkan
ke bawah melakui cabang-cabang sampai dihasilkan node daun (leaves) dimana node
daun menujukkan hasil akhir klasifikasi. Pohon harus di tes nilai
entropinya. Entropi adalah ukuran dari
teori informasi yang dapat mengetahui karakteristik impuruty, dan homogenety
dari kumpula data. Dari entropi kemudian dihitung nilai informasi gain (IG)
masing-masing atribut independent terhadap atribut independentnya. IG adalh
nilai-nilai entropi pada semua atribut.
Sebuah pohon
keputusan dapat dikontruksikan dengan melihat regurasi dibawah ini:
Berdasarkan data diatas gambar akn diubah
menjadi bentuk pohon keputusan. Pengubahan bentuk data dilakukan dengan
menggunakan algoritma ID3 dengan langkah sebagai berikut:
1.
Tentukan atribut yang akan dijadikan
node pohon dengan menghitung nilai entropinya
2.
Pilih atribut yang mempunyai nilai
minimal
Setelah pohon keputusan dibuat,
merupakan hal yang mudah untuk mengkonfirmasikannya kedalam bentuk aturan
(rules). Yang biasanya disajikan dalam bentuk kaidah produksi.
Adapun cara yang dilakukan adalh
melakukan trace pada setiap path dalam pohon dari node akar higga mendaptkan
node daun dimana antesedent diperoleh dari outcomes dan konsekuen diperoleh
dari node daun.
C.
Running Decision Tree
Jika
sebuah rule dibuat berdasarkan pohon keputusan , maka dilakukan:
·
Eliminasi antesedent yang tidak
diperlukan caranya:
-
Buat tabel kontigensi untuk setiap rule
yang mempunyai beberapa antesedent.
-
Sederhanakan rule dengan cara
mengeliminasi antesedent yang tidak mempengaruhi konklusi dengan menggunakan
tes indepensi.
-
Chi-Square Test jika frekuensi nilai
ekspektasi > 10 yates correction for continuity jika frekuensi nilai
ekspektasi 5-10 fisher’s exact test jika frekuensi nilai ekspektasi <5.
·
Eliminasi rule yang tidak perlu
D.
Metode Penelitian
Adapun
cara yang digunakan untuk menjalankan penelitian ini:
·
Mencari sampel data yang akan digunakan
untuk melaksanakn proses transformasi menjadi pengetahuan.
·
Melakukan konstruksi pohon keputusan
·
Melakukan prunning decision tree
·
Mengenerate basis pengetahuan dalam
format if.... then...
III. PEMBAHASAN
Profil
pengguna jalan dikategorikan sebagai berikut:
·
Pengguna berisiko rendah (low risked)
·
Pengguna beresiko menengah (moderat
risked)
·
Pengguna beresiko tinggi (high risked)
Dari
ketiga kategori tersebut, kita akan memilih pengguna yang mempunyai resiko
rendah atau moderat untuk diberikan reward. Record-record pengguna yang telah
direkam oleh pihak dinas terkait dikumpulkan dari waktu ke waktu adalah:
·
Riwayat pengguna (user history) yang
berisi nilai buruk (bad), baik (good), tidak dketahui(uknown)
·
Colateral berisi nilai tidak ada(none),
dan adequatic.
·
Pekerjaan berisi nilai pegawai negeri,
pegawai swasta, mahasiswa/pelajar.
·
Jenis kelamin(gender) yang berisi pria
dan wanita.
IV. BASIS PENGETAHUAN
Dari
pohon keputusan tersebut, dapat diahasilkan basis pengetahuan yang
direpresentasikan dalam kaidah produksi. Selanjutnya setelah diujikan
independent dengan Chi-Square dapat diperoleh basis pengetahuan akhir.
V. KESIMPULAN
Berdasarkan
pembahasan bab-bab sebelumnya, dapat ditarik kesimpulan sebagai berikut:
1).
Pohon keputusan dengan algoritma ID3 dapat digunakan untuk memoeroleh
pengetahuan pada bidang transportasi khususnya untuk mengklasifikasikan
keamanan dalam berkendara di jalan raya.
2).
Klasifikasi user didasarkan pada resiko rendah (low) dan sedang (moderat)
tergantung pada pihak pengguna.
VI. DAFTAR PUSTAKA
[1]
prayudi, yudi, 2002, Datamining for Knowledge Discovery in medical data.
[2]
Sudjana, 1996, Metode Statistik Edisi 6,
Penulis tarsito, Bandung.
[3]
Greening, Dan R, There’s’Gold In That
Mountain Of Data, http://www.newarchietechmag.com/archieve/2000/01/greening/
[4]
Han, Jie dan Chambber M, 2001, Data Mining Concept and Technique, Academic
Press, USA.
Tidak ada komentar:
Posting Komentar