Pendekatan Metode Classification and Regression Tree untuk Diagnosis Tingkat Keganasan Kanker
pada pasien Kanker Tiroid
Seminar Hasil Tugas Akhir
Sri Hartati Selviani Handayani1311106007
Pembimbing :Dr. Santi Wulan Purnami, S.Si, M.Si
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember
Surabaya - 2014
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Kanker Tiroid
Indonesia
Terkadang Berlebih dalammenghasilkan hormon tiroid
Membatasi menghasilkan hormontiroid
Membatasi menyerap Yodium
KelenjarTiroid
Urutan ke-9 dariinsiden kanker yang ada di Indonesia
Hiperteriodisme
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Ganas
Faktor-faktor yang mempengaruhi
timbulnya kanker tiroid
Classification and Regression Tree
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Sumartini (2013), Variabel yang signifikan terhadaphasil patologi kanker tiroid yaitu usia pasien dan riwayatpenyakit keluarga pasiendengan ketepatan klasifikasisebesar 86,6%
Istichana (2013), Variabel penentu pada kankertiroid yang berpengaruh signifikan terhadap hasilpatologi yaitu hasil pemeriksaan USG dengan ketepatanklasifikasi sebesar 86,6%.
Ramdani (2013) dengan menggunakan metodeCART menyimpulkan bahwa kontribusi tertinggi darihasil Pap Smear Test berturut-turut yaitu usiapasien, riwayat keguguran, pemakaian alatkontrasepsi, usia menstruasi, dan frekuensi melahirkan
Penelitian Sebelumnya
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Bagaimana karakteristik pasien kanker tiroid diRumah Sakit “X” Surabaya?
Bagaimana klasifikasi dan ketepatan klasifikasi padadiagnosis tingkat keganasan kanker berdasarkanfaktor yang mempengaruhi dengan pendekatanmetode Classification and Regression Tree ?
Apa sajakah faktor-faktor yang memberi kontribusitinggi terhadap klasifikasi pasien kanker tiroid diRumah Sakit “X” Surabaya?
Rumusan Masalah
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Mengetahui karakteristik pasien kanker tiroid diRumah Sakit “X“ Surabaya.
Mengetahui klasifikasi dan ketepatan klasifikasi padadiagnosis tingkat keganasan kanker berdasarkanfaktor yang mempengaruhi hasil patologi kankertiroid dengan pendekatan metode Classification andRegression Tree
Mengetahui faktor-faktor yang memberi kontribusitertinggi pada klasifikasi pasien kanker tiroid diRumah Sakit “X” Surabaya
Tujuan
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Dapat memberikan informasi kepada pihak Rumah Sakit“X” Surabaya tentang klasifikasi pasien hasil patologikanker tiroid berdasarkan variabel-variabel (faktor-faktor)yang menyebabkan timbulnya kanker tiroid setelahmelakukan pemeriksaan patologi sehingga dapatdilakukan perlakuan/pengobatan yang tepat padapenderita kanker tiroid
Manfaat Penelitian
Batasan MAsalah
Data Pasien Hasil Patologi Kanker Tiroid yang Melakukan operasi dan Pemeriksaan di rumah sakit “X” pada tahun 2011 dan 2012
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Variabel Respon Hasil
Data Kontinu Model Pohon Regresi
Data Kategorik Model Pohon Klasifikasi
(Breiman dkk, 1993)
Classification and Regression Trees (CART)
Metode statistik nonparametrik yang dikembangkanuntuk klasifikasi
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Langkah-Langkah Algoritma Pada Metode CART
(Breiman dkk, 1993)
PembentukanPohon Klasifikasi
PenghentianPembentukanpohon
Pemangkasanpohon Klasifikasi
PembentukanPohon KlasifikasiOptimal
1. Pemilihan Pemilah
2. Pemilihan Simpul
3. Menentukan Goodness of split
4.Penentuan Simpul Terminal
5.Penandaan Label kelas
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Kanker Tiroid
(Djokomoeljanto,2009)
Kanker Tiroid merupakan penyakit yang tidakmenular yang menyerang pada bagian depan lehersedikit dibawah laring yang berbentuk kupu-kupu.
Ciri-Ciri Kanker Tiroid Jinak GanasMengganggu Fungsi Aktivitas Tubuhdan Menyebar Keseluruh Tubuhsecara sporadik Tidak YaSifat Lunak PadatNyeri pada bagian leher Tidak YaPertumbuhan Lambat Cepat
Permukaan Nodul Rata/normalBenjolan/terjadipembengkakan
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Penyebab Kanker Tiroid
Terjadinya perubahan atau mutasi genetik pada seltiroid yang menjadikan sel berkembang secara cepat
(Djokomoeljanto,2009)
1. Nyeri di tenggorokan atau pada daerah leher .2. Adanya pembesaran nodul / benjolan pada leher yang
mengakibatkan terganggunya pernapasan.3. Suara serak yang tidak kunjung sembuh. 4. Pembesaran pada kelenjar getah bening yang ada di
leher.
Gejala pada Kanker Tiroid
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Data yang digunakan dalam penelitian ini merupakandata sekunder pasien hasil patologi kanker tiroid yangdiperoleh dari data rekam medis di salah satu rumahsakit “X” Surabaya pada tahun 2011 dan 2012 dimanadata berjumlah 82 orang pasien.
Sumber Data
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
No Variabel Skala Keterangan
1 Jenis Kanker (Y) Nominal 0 : Jinak 1 : Ganas
2 Jenis Kelamin (X1) Nominal 0 : Laki-laki 1 : Perempuan
3 Usia (X2) Nominal 0: < 42 tahun1 : ≥ 42 tahun
4 Hasil Pemeriksaan USG (X3) Nominal 0 : Stuma 1 : Ca thyroid 2: Kista
5 Hasil Pemeriksaan Klinis (X4) Nominal 0 : Stuma 1 : Ca thyroid 2: Kista
6 Riwayat Penyakit Gondok (X5) Nominal 0 : Ada Keluhan 1 : Tidak Ada Keluhan
7 Riwayat Penyakit Kanker (X6) Nominal 0 : Ada Riwayat 1 : Tidak Ada Riwayat
Variabel Penelitian
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Langkah Analisis
Analisis deskriptif dari data penderitaKanker Tiroid1.
2.
3.
Kombinasi atau membagi data learning dan testing
Klasifikasi data penderita KankerTiroid dengan metode CART
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Langkah Analisis
Mulai
Analisis Statistika Deskriptif
Kesimpulan dan saran
Proses pembentukan Pohon Klasifikasi
CART (Classification and Regression Trees)
Penentuan data learning dan data testing
Evaluasi Ketepatan Klasifikasi
Selesai
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Tahap pembentukan CART
Pemisahan data menjadi dua bagian yaitu lerningdan testing
Pembentukan Pohon Klasifikasi
Menghitung ketepatan Klasifikasi model yang dihasilkan
Penentuan Pohon Klasifikasi Optimal
Pemangkasan Pohon Klasifikasi
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Analisis & PEmbahasan
Jinak67%
Ganas33%
Hasil Patologi
Analisis Deskriptif
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Laki-laki Perempuan
11
448
19
Jenis Kelamin
Jinak Ganas
Analisis Deskriptif
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Analisis Deskriptif
< 42 Tahun >= 42 Tahun
21
34
19
8
Usia PasienJinak Ganas
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Analisis Deskriptif
Struma Ca Thyroid Kista
47
08
15
120
Hasil Pemeriksaan USG
Jinak Ganas
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Analisis Deskriptif
Struma Ca Thyroid Kista
50
05
11
16 0
Hasil Pemeriksaan Klinis
Jinak Ganas
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Analisis Deskriptif
Ada Riwayat Tidak Ada Riwayat
15
408
19
Riwayat Penyakit Gondok
Jinak Ganas
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Analisis Deskriptif
Ada Riwayat Tidak Ada Riwayat
10
45
11
16
Riwayat Penyakit Keluarga
Jinak Ganas
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Kombinasi Data Learning dan Testing
Analisis Kombinasi Pohon (CART)
Pada penelitian ini data yang digunakan sebanyak 82 pengamatan, yang akan dicoba untuk kelompok Ke-i di jadikan sebagai data testing dan banyak data pada data learning untuksetiap kelompok ke-i merupakan penjumlahan data dari data testing kelompok lainnya dimana i = 1,2,3,4,5. Ketepatanklasifikasi pada data learning dan data testing yang paling tinggiyaitu pada kelompok 1 sehingga kombinasi data ini yang akandigunakan pada analisis selanjutnya
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Kemungkinan Pemilah Pada VariabelPrediktor
VariabelSkala
KatagoriJumlah
KatagoriKemungkinan
Pemilah
X1 Jenis Kelamin Nominal 2 22-1 -1= 1 Pemilahan
X2 Usia Nominal 2 22-1 -1=1 Pemilahan
X3
Hasil Pemeriksaan USG Nominal 3 23-1 -1=3 Pemilahan
X4
Hasil Pemeriksaan Klinis Nominal 3 23-1 -1=3 Pemilahan
X5
Riwayat Penyakit Gondok Nominal 2 22-1 -1=1 Pemilahan
X6
Riwayat Penyakit Keluarga Nominal 2 22-1 -1=1 Pemilahan
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Pohon Klasifikasi Maksimal yang terbentuk
Variabel yang memberi kontribusi tertinggi Pada PohonKlasifikasi Maksimal
Variable ScoreHasil Pemeriksaan Klinis (X4) 100.00Hasil Pemeriksaan USG (X3) 86.63Usia (X2) 24.71Riwayat Penyakit Keluarga (X6) 16.46Jenis Kelamin (X1) 5.71Riwayat Penyakit Gondok (X5) 4.23
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Pohon Klasifikasi Maksimal
Klasifikasi pohon maksimal yang terbentuk terdiri atas8 simpul terminal. Hasil klasifikasi dengan simpulterminal ini menujukkan bahwa pohon maksimalmemiliki pengertian yang kompleks sehingga perluuntuk dilakukan pemangkasan
Ketepatan Hasil Klasifikasi Pada Pohon KlasifikasiMaksimal
Observasi
Prediksi
Total Prediksi Sensitivity Specificity
Total Tingkat Akurasi Jinak Ganas
Data Learning
Jinak 36,00 4,00 40,0090,00% 92,00% 90,76%
Ganas 2,00 23,00 25,00
Data Testing
Jinak 12,00 3,00 15,0080,00 % 50,00% 76,47%
Ganas 1,00 1,00 2,00
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Pemangkasan Pohon Klasifikasi Maksimal
** : Pohon Klasifikasi Optimal
Urutan Simpul Akhir
Pohon ke-4 dengan simpul ke-2 merupakan pohon optimal dengan uji kesalahanrelatif 0,500 ± 0,354 dimana Resubtition Relative Costsebesar 0,400 dan kompleksitas parameter sebesar 0,034
0.500
Relat
ive C
ost
Number of Nodes
0.10.30.50.70.91.1
0 2 4 6 8
0.700
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Pohon Klasifikasi Optimal
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Ketepatan Hasil Klasifikasi Pada Pohon KlasifikasiOptimal
Validasi Pohon Klasifikasi Optimal
Ketepatan klasifikasi yang dihasilkan oleh data testing tersebut maka modelklasifikasi optimal yang dihasilkan sudah baik atau layak dalam model
ObservasiPrediksi
Total Misklasifikasi/ KelsalahanJinak Ganas
Data Learning
Jinak 40,00 0,00 40,00 0%
Ganas 10,00 15,00 25,00 40,00%Tingkat Akurasi Total % 84,6%
ObservasiPrediksi
Total Misklasifikasi/ KesalahanJinak Ganas
Data Testing
Jinak 15,00 0,00 15,00 0%
Ganas 1,00 1,00 2,00 50,00%Tingkat Akurasi Total (%) 94,1%
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Evaluasi Ketepatan Klasifikasi
Dari 5 kelompok kombinasi data yang dicobakan diatas dapatdilihat bahwa ketepatan klasifikasi data learning dan data testing yang paling tinggi yaitu pada kelompok 1 dengantingkat akurasi data learning sebesar 0,846 dan testingsebesar 0,941 sehingga kombinasi data kelompok 1 yang digunakan pada analisis dan rata-rata nilai akurasi dari 5 kelompok data diatas maka pada data learning sebesar 0,875 dan testing yaitu sebesar 0,839.
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Variabel yang Berpengaruh pada Tiap-tiap Kelompokdi Pohon Klasifikasi Optimal
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Perbandingan Hasil Penelitian
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Kesimpulan & SaranKesimpulan
1.
2.
Hasil dari statistika deskriptif menunjukkan bahwa hasil patologikanker tiroid pasien yang didiagnosis kanker tiroid yang jinaksebanyak 55 orang atau 67% dan pasien yang didiagnosiskanker tiroid yang jinak sebanyak 27 orang atau 33%. Karakteristik pasien pada hasil patologi kanker tiroid mayoritasdengan pemeriksaan USG dan klinis mayoritas hasilpemeriksaannya Struma, pada riwayat penyakit gondokmayoritas tidak ada riwayat dan tidak ada riwayat penyakitkanker pada keluarga pasien.
Klasifikasi dari diagnosis tingkat keganasan pada kankertiroid dengan faktor yang berpengaruh yaitu hasilpemeriksaan klinis. Pasien hasil patologi yang beresikomenderita kanker tiroid jinak hasil pemeriksaan klinisnyayaitu struma dan kista. Sedangkan pasien yang beresikomenderita kanker tiroid ganas yaitu ca thyroid
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
3.
Dengan total akurasi pada pasien kanker tiroid pada datalearning sebesar 84,6%, maka dapat disimpulkan bahwa modelklasifikasi optimal yang terbentuk baik untuk menggambarkanmodel klasifikasi pohon dan ketepatan klasifikasi pada datatesting sebesar 94,1%, hal ini menyimpulkan bahwa pohonklasifikasi yang diklasifikasikan pada data baru layak dalammodel.
Faktor yang memberi kontribusi tertinggi padaklasifikasi pasien kanker tiroid dengan menggunakanmetode CART yaitu hasil pemeriksaanklinis, sedangkan pada ketiga metode yang telahditeliti sebelumnya faktor-faktor yang berpengaruhpada klasifikasi pasien kanker tiroid yaitu hasilpemeriksaan klinis, hasil pemeriksaan USG, riwayatpenyakit keluarga dan usia.
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Saran
Hasil pemeriksaan klinis merupakan variabel yangsangat berpengaruh yang menyebabkan timbulnyakanker tiroid, oleh sebab disarankan bagi pihak rumahsakit atau bagi orang yang pernah melakukanpemeriksaan klinis pada kelenjar tiroid sebaiknyamemeriksakan dirinya sedinimungkin dan lebihmendalam karena bila dibiarkan akan membawadampak yang buruk bagi kesehatan
Pada penelitian selanjutnya sebaiknya melakukankonsultasi kembali dengan dokter ahli dalammelakukan riset, agar memperoleh variable-variabelprediktor baru yang menyebabkan timbulnya kankertiroid.
Jurusan Statistika - FMIPAInstitut Teknologi Sepuluh Nopember - Surabaya - 2014
Daftar Pustaka
American Cancer Society. 2012. [Online]. Avaible: (http://www.thyroid.cancer.int/ ,diaksestanggal 8 Oktober 2013)Breiman L., Friedman J.H Olshen R.A & Stone C.J. (1993). Classification And Regression Tree. New York, NY: Chapman And HallDjokomoeljanto, (2009). Indonesian Society of Endocrinology, Indonesian Study Group ofThyroidology, Indonesian Society of Endocrinology Semarang Branch, The 2nd
Thyroidology Update 2009. Semarang: Badan Penerbit Undip (Di unduh tanggal 22 September 2013)Hamdani , W dan Sampepajung, D. Thyroid cancer. The diagnose and the management.
Department of Surgery Medical Faculty, Hasanuddin University, Makasarhttp://med.unhas.ac.id/jurnal/attachments/article/74/THYROID%20Ca-William%20Hamdani.pdf (Diunduh tanggal 23 September 2013)Istichana, Y. Y. (2013). Penggunaan Metode CHAID Untuk Klasifikasi Pasien HasilPatologi kanker Tiroid. Tugas Akhir Diploma III Jurusan Statistika, Surabaya, InstitutTeknologi Sepuluh November.Layla, R. D. (2013). Klasifikasi Pendekatan Diabetes Melitus Dengan Metode CHAID danCART. Tugas Akhir Sarjana Jurusan Statistika, Surabaya, Institut Teknologi Sepuluh November.Laseduw,J.(2012) Kanker Tiroid. http://kanker tiroid.wordpress.com/2013/06/21/penyebab/.
(Di unduh tanggal 18 September 2013).Lewis, M.D dan Roger, J. (2000). An Introduction to Classification and Regression Tree (CART) Analysis. Ramdani, Y. (2013). Klasifikasi Hasil Pap Smear Test Kanker Serviks berdasarkan FaktorResiko. Tugas Akhir Sarjana Jurusan Statistika, Surabaya, Institut Teknologi SepuluhNovember.Subekti, I., Aru, W., Sudoyo., B. S., Idrus, A., Marcellius, S., Sesiati, S. (2010). KarsinomaTiroid. Buku Ajaran Ilmu Penyakit Dalam. Edisi 5. Jakarta : Interna Publising. P. 2031-37Sumartini, S. H. (2013). Analisis Regresi Biner Pada Faktor Yang Mempengaruhi HasilPatologi kanker Tiroid. Tugas Akhir Diploma III Jurusan Statistika, Surabaya, InstitutTeknologi Sepuluh November.Utama, Y. D. C (2012). Nilai diagnostik Karakteristik klinis di Bandingkan dengan Biopsipatologi Anatomi dalam mendiagnosis Karsinoma Tiroid, Skripsi, fakultasKedokteran Universitas diponegoro,Semarang. (Di unduh tanggal 14 Oktober 2013)Walpole, (1995). Pengantar Statistika. Gramedia Pustaka Utama: Jakarta.