Pohon Keputusan

Pohon Keputusan

Apa Itu Pohon Keputusan?

Pohon keputusan adalah diagram alir dalam bentuk struktur pohon yang digunakan untuk menggambarkan hasil yang mungkin untuk masukan yang diberikan. Struktur pohon terdiri dari simpul akar, cabang, dan simpul internal dan daun. Node internal individu mewakili keputusan partisi, dan setiap node daun mewakili prediksi kelas.

Anda bebas menggunakan gambar ini di situs web Anda, templat, dll., Harap berikan kami tautan atribusiBagaimana Memberikan Atribusi? Tautan Artikel menjadi Hyperlink
Misalnya: Sumber: Pohon Keputusan (wallstreetmojo.com)

Ini berguna dalam membangun model pelatihan yang memprediksi kelas atau nilai variabel target melalui aturan pengambilan keputusan yang sederhana. Mengingat informasi dan opsi yang relevan dengan keputusan, ini membantu bisnis dalam menentukan keputusan mana pada titik pilihan mana pun yang akan menghasilkan pengembalian finansial tertinggi yang diprediksi.

Takeaway kunci

  • Pohon keputusan adalah diagram alir terarah yang digambar dalam struktur yang mirip dengan pohon. Struktur pohon terdiri dari simpul akar, cabang, simpul dalam, dan simpul daun.
  • Proses pengambilan keputusan dilakukan melalui percabangan dari node, yang menggambarkan berbagai kemungkinan dimana pengguna memutuskan untuk memilih atau membuang pilihan. Hasil atau simpul penutup disebut daun.
  • Struktur memungkinkan pengambilan keputusan dengan mengkategorikannya sebagai yang terbaik atau terburuk
  • Ini membantu dalam menyimpulkan dengan memungkinkan interpretasi data secara visual

Pohon Keputusan Dijelaskan

Sebuah pohon keputusan adalah classifier yang membantu dalam membuat keputusan. Itu digambarkan sebagai pohon berakar yang diisi dengan simpul dengan tepi yang masuk. Satu node tanpa sisi masuk dikenal sebagai node “root”, dan masing-masing node lainnya hanya memiliki satu sisi masuk. Demikian pula, simpul dengan tepi menonjol keluar adalah simpul internal atau uji. Pada saat yang sama, simpul yang tersisa di ujung adalah daun, yang disebut terminal atau simpul keputusan. Selain itu, setiap node internal dalam struktur membagi ruang instance menjadi beberapa sub-ruang dengan fungsi diskrit tertentu dari nilai atribut input.

Setiap tes memperhitungkan satu atribut. Ruang instance kemudian membagi dirinya sendiri sesuai dengan nilai atributnya. Dalam kasus yang melibatkan atribut numerik, seseorang dapat menyebutnya sebagai rentang. Setiap daun menerima kelas yang mewakili nilai target yang ideal. Selain itu, daun mungkin berisi vektor probabilitas yang menampilkan kemungkinan bahwa properti target akan memiliki nilai tertentu. Menurut hasil pengujian di sepanjang jalur, seseorang dapat mengkategorikan contoh. Ini dimungkinkan dengan memindahkannya dari akar pohon ke daun. Singkatnya, kriteria penghentian dan teknik pemangkasan secara langsung mengontrol kompleksitas pohon.

Struktur

Struktur tersebut berisi hal-hal berikut:

  • Root Node: Root node mewakili seluruh populasi atau sampel. Kemudian partisi menjadi dua atau lebih set homogen.
  • Memisahkan: Proses pemisahan melibatkan pemisahan node menjadi beberapa sub-node.
  • Node Keputusan: Sebuah sub-node menjadi node keputusan ketika dibagi menjadi lebih banyak sub-node.
  • daun atau terminal: Node yang tidak terbelah adalah node daun atau terminal.
  • Pemangkasan: Pemangkasan adalah proses menghapus sub-node dari node keputusan. Seseorang dapat menggambarkannya sebagai membelah secara terbalik.
  • Cabang atau Sub-Pohon: Cabang atau sub-pohon adalah pembagian dari keseluruhan pohon.
  • Node Induk dan Anak: Node yang dipecah menjadi node anak perusahaan disebut node induk. Sub-node adalah turunan dari node induk

Penggunaan

Pohon keputusan umumnya paling cocok untuk masalah dengan karakteristik berikut:

  1. Instance yang diwakili oleh pasangan atribut-nilai:

Instance memiliki kumpulan atribut dan nilainya yang tetap. Pohon-pohon ini membantu pengambilan keputusan dengan jumlah nilai disjoint yang terbatas dan memungkinkan representasi numerik dari atribut bernilai nyata seperti level atau derajat.

  1. Fungsi target yang memiliki nilai output diskrit :

Ini memungkinkan klasifikasi dan fungsi boolean (ya atau tidak) dengan lebih dari dua kemungkinan nilai keluaran dan keluaran bernilai nyata.

  1. Deskripsi disjungtif:

Mereka berguna dalam mewakili ekspresi disjungtif.

  1. Data dengan nilai atribut yang hilang :

Metode ini membantu mencapai keputusan bahkan dengan nilai yang hilang atau tidak diketahui.

Dalam aplikasi dunia nyata, mereka berguna dalam keputusan investasi bisnis dan proses pengambilan keputusan individu secara umum. Pohon keputusan sangat populer sebagai model prediktif saat melakukan pengamatan. Selain itu, pembelajaran pohon keputusan adalah pendekatan pembelajaran terawasi yang digunakan dalam statistik, penambangan data, dan pembelajaran mesin.

Contoh

Lihat contoh-contoh ini untuk mendapatkan ide yang lebih baik:

Contoh 1

David mempertimbangkan untuk berinvestasi dalam jumlah tertentu. Akibatnya, dia mempertimbangkan tiga opsi: reksa dana, dana utang, dan mata uang kripto. Dia menganalisisnya dengan satu kriteria prioritas – mereka harus memberikan pengembalian lebih dari 60%. Dave memahami bahwa risiko yang terkait juga tinggi, tetapi jumlah yang dia investasikan adalah uang ekstra yang bisa saja dia hilangkan. Karena hanya cryptocurrency yang dapat memberikan pengembalian seperti itu, dia memilihnya.

Perhatikan ilustrasi proses pengambilan keputusan di bawah ini.

Anda bebas menggunakan gambar ini di situs web Anda, templat, dll., Harap berikan kami tautan atribusiBagaimana Memberikan Atribusi? Tautan Artikel menjadi Hyperlink
Misalnya: Sumber: Pohon Keputusan (wallstreetmojo.com)

Contoh #2

Dave memiliki $ 100.000 bersamanya. Dia ingin membelanjakannya tetapi tidak yakin bagaimana caranya. Dia tahu dia menginginkan mobil baru tetapi juga memahami bahwa itu adalah aset yang terdepresiasi dan nilainya cenderung berkurang seiring waktu. Di sisi lain, dia memiliki opsi lain – berinvestasi di dalamnya. Jika dia memilih opsi itu, dia dapat membaginya, memasukkannya ke dalam Roth IRA (akun pensiun individu khusus), dan menggunakan sisanya untuk membeli rumah, yang dapat memberinya penghasilan pasif melalui sewa. Karena itu, dia memilih untuk berinvestasi.

Anda bebas menggunakan gambar ini di situs web Anda, templat, dll., Harap berikan kami tautan atribusiBagaimana Memberikan Atribusi? Tautan Artikel menjadi Hyperlink
Misalnya: Sumber: Pohon Keputusan (wallstreetmojo.com)

Keuntungan Kerugian

Berikut adalah keuntungan dan kerugian utama menggunakan pohon keputusan;

Keuntungan #1

  • Ini membantu dalam kesimpulan keputusan yang mudah dengan memungkinkan interpretasi data secara visual.
  • Struktur dapat digunakan untuk kombinasi data numerik dan non-numerik.
  • Klasifikasi pohon keputusan memungkinkan pengambilan keputusan dengan mengkategorikannya sesuai dengan spesifikasi.

#2 Kekurangan

  • Jika struktur pohon menjadi kompleks, seseorang dapat menginterpretasikan data yang tidak relevan.
  • Perhitungan dalam analisis prediktif dapat dengan mudah menjadi membosankan, terutama ketika rute keputusan mengandung banyak variabel peluang.
  • Perubahan kecil pada data dapat berdampak signifikan pada struktur pohon keputusan, yang menunjukkan hasil yang berbeda dari yang mungkin terjadi pada pengaturan normal.

Pohon Keputusan vs Hutan Acak vs Regresi Logistik

  • Pohon keputusan adalah struktur di mana setiap formasi berbentuk simpul adalah sebuah pertanyaan, dan setiap sisi yang turun dari simpul tersebut merupakan jawaban potensial untuk pertanyaan itu.
  • Random Forest menggabungkan output dari berbagai pohon keputusan untuk menghasilkan satu hasil. Dengan demikian, ini memecahkan masalah klasifikasi dan regresi; metode ini sederhana dan mudah beradaptasi.
  • Regresi logistik menghitung kemungkinan terjadinya peristiwa tertentu berdasarkan kumpulan variabel independen dan kumpulan data yang diberikan. Kisaran variabel dependen adalah 0 hingga 1 dalam metode ini.

Sementara semuanya berkaitan dengan sampai pada kesimpulan berdasarkan probabilitas, ketiganya berbeda.

Pertanyaan yang Sering Diajukan (FAQ)

  1. Apa itu pohon keputusan dalam pembelajaran mesin?

Keputusan pembelajaran pohon adalah pembelajaran mesin terawasi di mana data pelatihan terus disegmentasi berdasarkan tertentu. Ini menghasilkan output yang sesuai untuk input yang diberikan seperti pada data pelatihan.

  1. Apa itu entropi dalam pohon keputusan?

Entropi mengontrol bagaimana pohon keputusan memutuskan untuk membagi data. Entropi informasi mengukur tingkat kejutan (atau ketidakpastian) dalam nilai variabel acak. Sederhananya, itu adalah ukuran kemurnian.

  1. Bagaimana cara kerja pohon keputusan?

Proses pengambilan keputusan dilakukan melalui pencabangan node mulai dari root node. Node yang bercabang menggambarkan berbagai kemungkinan di mana pengguna memutuskan untuk memilih atau membuang opsi itu berdasarkan preferensi. Hasil atau simpul penutup disebut daun.

  1. Apa itu analisis pohon keputusan?

Analisis pohon keputusan menimbang pro dan kontra dari keputusan dan memilih opsi terbaik dari struktur seperti pohon. Prosesnya meliputi asimilasi data, klasifikasi pohon keputusan, dan memilih opsi terbaik yang tersedia.

Artikel yang Direkomendasikan

Ini telah menjadi panduan tentang apa itu Pohon Keputusan & definisinya. Kami menjelaskan struktur, kegunaan, contoh, kelebihan, kekurangan, dan perbandingannya dengan regresi logistik/hutan acak. Anda dapat mempelajarinya lebih lanjut dari artikel berikut –

  • Diagram pohon
  • Analisis Keputusan
  • Teori Keputusan

Related Posts

Tinggalkan Balasan