Rabu, 30 Desember 2015

3115100924-Faridatul Ilmi-Jurnal Ilmiah- d3 sore



JURNAL ILMIAH
Penggunaan Decision Tree (Pohon Keputusan) Pada Resiko Pengguna Kendaraan di Jalan Raya



Nama : Faridatul Ilmi
NIM : 3115100924
Program Studi : D3
Mata Kuliah : Bahasa Indonesia
Dosen Pengampu : Drs. Agus Riyono


Penggunaan Decision Tree (Pohon Keputusan) Pada Resiko Pengguna Kendaraan di Jalan Raya
Faridatul Ilmi
Sekolah Tinggi Ilmu Komputer PGRI Banyuwangi


Abstraksi
            Di dalam penulisan jurnal ilmiah ini berfungsi untuk mengetahui karakter para pengguna jalan raya yang akan menggunakan jalan raya. Pemilihan pengguna ini dibutuhkan untuk meminimalkan resiko yang dapat mengakibatkan kecelakaan dalam berlalu lintas. Resiko tersebut dikategorikan tinggi (high), sedang(moderat), dan rendah (low). Adapun adata pengguna memiliki 5 buah atribut dan 100 record. Knowledge Discovery In Databases (KDD) adalah salah satu metode yang digunakan untuk memperoleh pengetahuan dalam sebuah basis data. Salah satu cara yang digunakan adalah penggunaan pohon keputusan (Decision Tree). Pengetahuan tersebut di representasikan dalam bentuk kaidah produksi, Algoritma yang digunakan adalah Iteractive Dichotomicer 3 (ID3).

Kata Kunci: jalan raya, Decision Tree, Knowledge Discovery In Databases(KDD)

I.                   PENDAHULUAN
Proses pengajuan kredit oleh nasabah(customer) menjadi semakin mudah, baik untuk kredit barang maupun uang. Khususnya dalam perbankan, pengajuan kredit uang dapat dilakukan oleh semua masyarakat dengan memenuhi  syarat-syarat yang ditentukan oleh bank tersebut. Untuk menghindari adanya kredit macet, perlu diketahui profil nasbah khususnya yang akan melakukan kredit, sehingga resikonya menjadi minimal. Knowledge Discovery In Databases (KDD) metode untuk memperoleh pengetahuan dari basis data yang dibentuk. Di dalamnya berisi tabel-tabel yang saling berhubungan/berelasi. Hasilnya digunakan sebagai basis pengetahuan (knowledge base) untuk keperluan pengambilan keputusan. Dengan cara menambang data dengan pohon keputusan(decision tree).
II.                PERMASALAHAN
Berdasrkan latar belakang diatas, salah satu pokok permasalahan yang diangkat adalah bagaimana memperoleh pengetahuan untuk mengindentifikasi pengguna jalan raya sehingga meminimalkan adanya resiko kecelakaan ataupun permaslahan lain yang mengganggu kelancaran dalam berlalu lintas. Cara yang digunakan menggunakan pohon keputusan (decision tree) dengan algorima interactive dichotomicer 3 (ID3) .
A.      Pohon Keputusan (decision tree)
Algoritma induksi yang paling umum digunakan adalah kelompok TDIDT (Top Down Induction Decision Tree). Algoritma ini didasarkan pada algorima lain yaitu ID3 (Interactive Dichotomicer 3). Input algoritma ini  adalah sebuah database dengan beberapa variabel yang juga dikenal dengan atribut. Setiap masukan dalam database dengan beberapa variabel bebas. Sebuah atribut didesain untuk mengklasifikasikan obyek, yang selanjutnya disebut vriabel tidak bebas. Masalah yang harus dipecahkan adalh proses klasifikasi terhadap data yang disimpan dalam database. Algoritma TDIDT memerlukan 2 langkah yaitu membangun pohon keputusan dan menyederhanakannya. Pohon keputusan terdiri dari rangkaian tes sehungga terjadi klasifikasi diantara data atau obyek yang disimpan.

B.     Bagan Pohon Keputusan
Proses Klasifikasi dilakukan dari node paling atas atau akar pohon (root). Dilanjutkan ke bawah melakui cabang-cabang sampai dihasilkan node daun (leaves) dimana node daun menujukkan hasil akhir klasifikasi. Pohon harus di tes nilai entropinya.  Entropi adalah ukuran dari teori informasi yang dapat mengetahui karakteristik impuruty, dan homogenety dari kumpula data. Dari entropi kemudian dihitung nilai informasi gain (IG) masing-masing atribut independent terhadap atribut independentnya. IG adalh nilai-nilai entropi pada semua atribut.
Sebuah pohon keputusan dapat dikontruksikan dengan melihat regurasi dibawah ini:


      Berdasarkan data diatas gambar akn diubah menjadi bentuk pohon keputusan. Pengubahan bentuk data dilakukan dengan menggunakan algoritma ID3 dengan langkah sebagai berikut:
1.      Tentukan atribut yang akan dijadikan node pohon dengan menghitung nilai entropinya
2.      Pilih atribut yang mempunyai nilai minimal
Setelah pohon keputusan dibuat, merupakan hal yang mudah untuk mengkonfirmasikannya kedalam bentuk aturan (rules). Yang biasanya disajikan dalam bentuk kaidah produksi.
Adapun cara yang dilakukan adalh melakukan trace pada setiap path dalam pohon dari node akar higga mendaptkan node daun dimana antesedent diperoleh dari outcomes dan konsekuen diperoleh dari node daun.
C.     Running Decision Tree
Jika sebuah rule dibuat berdasarkan pohon keputusan , maka dilakukan:
·      Eliminasi antesedent yang tidak diperlukan caranya:
-          Buat tabel kontigensi untuk setiap rule yang mempunyai beberapa antesedent.
-          Sederhanakan rule dengan cara mengeliminasi antesedent yang tidak mempengaruhi konklusi dengan menggunakan tes indepensi.
-          Chi-Square Test jika frekuensi nilai ekspektasi > 10 yates correction for continuity jika frekuensi nilai ekspektasi 5-10 fisher’s exact test jika frekuensi nilai ekspektasi <5.
·      Eliminasi rule yang tidak perlu
D.    Metode Penelitian
Adapun cara yang digunakan untuk menjalankan penelitian ini:
·         Mencari sampel data yang akan digunakan untuk melaksanakn proses transformasi menjadi pengetahuan.
·         Melakukan konstruksi pohon keputusan
·         Melakukan prunning decision tree
·         Mengenerate basis pengetahuan dalam format if.... then...
III.            PEMBAHASAN
Profil pengguna jalan dikategorikan sebagai berikut:
·         Pengguna berisiko rendah (low risked)
·         Pengguna beresiko menengah (moderat risked)
·         Pengguna beresiko tinggi (high risked)
Dari ketiga kategori tersebut, kita akan memilih pengguna yang mempunyai resiko rendah atau moderat untuk diberikan reward. Record-record pengguna yang telah direkam oleh pihak dinas terkait dikumpulkan dari waktu ke waktu adalah:
·         Riwayat pengguna (user history) yang berisi nilai buruk (bad), baik (good), tidak dketahui(uknown)
·         Colateral berisi nilai tidak ada(none), dan adequatic.
·         Pekerjaan berisi nilai pegawai negeri, pegawai swasta, mahasiswa/pelajar.
·         Jenis kelamin(gender) yang berisi pria dan wanita.

IV.           BASIS PENGETAHUAN
Dari pohon keputusan tersebut, dapat diahasilkan basis pengetahuan yang direpresentasikan dalam kaidah produksi. Selanjutnya setelah diujikan independent dengan Chi-Square dapat diperoleh basis pengetahuan akhir.

V.                KESIMPULAN
Berdasarkan pembahasan bab-bab sebelumnya, dapat ditarik kesimpulan sebagai berikut:
1). Pohon keputusan dengan algoritma ID3 dapat digunakan untuk memoeroleh pengetahuan pada bidang transportasi khususnya untuk mengklasifikasikan keamanan dalam berkendara di jalan raya.
2). Klasifikasi user didasarkan pada resiko rendah (low) dan sedang (moderat) tergantung pada pihak pengguna.

VI.             DAFTAR PUSTAKA
[1] prayudi, yudi, 2002, Datamining for Knowledge Discovery in medical data.
[2] Sudjana, 1996, Metode Statistik Edisi 6, Penulis tarsito, Bandung.
[3] Greening, Dan R, There’s’Gold In That Mountain Of Data, http://www.newarchietechmag.com/archieve/2000/01/greening/
[4] Han, Jie dan Chambber M, 2001, Data Mining Concept and Technique, Academic Press, USA.

Tidak ada komentar:

Posting Komentar