analisis model regresi coxrepository.usd.ac.id/30211/12/143114018 edit.pdf · 2018. 8. 7. · 3....
TRANSCRIPT
-
ANALISIS DATA KETAHANAN HIDUP DENGAN MODEL REGRESI
COX PROPORSIONAL HAZARDS
Tugas Akhir
Diajukan Untuk Memenuhi Salah Satu Syarat
Memperoleh Gelar Sarjana Sains
Program Studi Matematika
Oleh:
Etri Amiani
NIM: 143114018
PROGRAM STUDI MATEMATIKA JURUSAN MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS SANATA DHARMA
YOGYAKARTA
2018
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
ii
SURVIVAL DATA ANALYSIS WITH THE COX PROPORTIONAL
HAZARDS REGRESSION MODEL
A Thesis
Present as a Partial Fulfillment of the
Requirements to Obtain the Degree of Sarjana Sains
Mathematics Study Program
Written by:
Etri Amiani
Student Number: 143114018
MATHEMATICS STUDY PROGRAM
DEPARTMENT OF MATHEMATICS
FACULTY OF SCIENCE AND TECHNOLOGY
SANATA DHARMA UNIVERSITY
YOGYAKARTA
2018
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
v
HALAMAN PERSEMBAHAN
Skripsi ini saya persembahkan kepada:
Tuhan Yesus Kristus atas segala Berkat dan Kasih-Nya yang mengalir
sepanjang perjalanan hidup saya.
Papah, mamah, kak Mela, dan kak Noto tercinta.
Bapak Ir. Ig. Aris Dwiatmoko, M.Sc., selaku dosen pembimbing yang tidak
akan tergantikan.
Semua orang yang akan membaca skripsi saya.
“Hormatilah ayahmu dan ibumu, supaya lanjut umurmu di tanah yang
diberikan Tuhan, Allahmu, kepadamu.” Keluaran 20:12
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
vii
ABSTRAK
Banyak peristiwa yang terjadi dalam kehidupan sehari-hari berhubungan
dengan waktu ketahanan hidup. Data tentang lamanya waktu ketahanan hidup
individu disebut data ketahanan hidup. Data ketahanan hidup yang tidak dapat
diamati sepenuhnya atau tidak lengkap disebut sebagai data tersensor. Model
regresi Cox proporsional hazards digunakan untuk menganalisis dan menentukan
model regresi dari data ketahanan hidup, serta menyelidiki hubungan antara waktu
ketahanan hidup dengan satu atau lebih variabel penjelas. Model regresi Cox
dikatakan proporsional karena rasio hazard bernilai konstan seiring bertambahnya
waktu.
Pada tugas akhir ini, penduga model regresi Cox proporsional hazards
diaplikasikan pada data pasien kanker payudara di Rumah Sakit Panti Rapih
Yogyakarta tahun 2014-2016. Dari hasil komputasi diperoleh model regresi Cox
proporsional hazards yang terbaik untuk pasien kanker payudara tahun 2014-2016,
yaitu
.)(),( 5881.10xethth X
Nilai pendugaan paramater ̂ adalah -1.5881. Artinya, risiko untuk gagal
bertahan hidup pasien kanker payudara yang mengikuti kemoterapi lebih kecil
dari pada pasien yang tidak mengikuti kemoterapi. Selanjutnya, pasien kanker
payudara yang mengikuti kemoterapi berpeluang bertahan hidup kurang lebih 5
kalinya pasien kanker payudara yang tidak mengikuti kemoterapi.
Kata Kunci: Data Tersensor, Model Regresi Cox Proporsional Hazards, Rasio
Hazard.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
viii
ABSTRACT
A lot of events occured in daily life are connected with survival time. Data
discussing the duration of survival time is called survival data. Survival data
which cannot be observed completely is called as censored data. Cox proportional
hazards regression model is employed to analyze and determine regression model
from survival data, and to find the relationship between survival time and one or
more explanatory variables. Cox regression model is proportional because the
hazard ratio is constant over time.
In this thesis, Cox proportional hazards regression model is applied to
breast cancer patients at Panti Rapih Hospital Yogyakarta in 2014-2016. From the
computation as results, it is obtained that the best Cox proportional hazards
regression model for breast cancer patients in 2014-2016, is
.)(),( 5881.10xethth X
The estimate value of the parameter is -1.5881. It means that the risk to fail
for patients who take the chemotherapy is smaller than patients who do not take
the chemotherapy. Moreover, patients who take the chemotherapy have a
probability to survive about 5 times patients who do not take the chemotherapy.
Keywords: Censored Data, Cox Proportional Hazards Regression Model, Hazard
Ratio.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
x
KATA PENGANTAR
Puji syukur penulis haturkan kepada Tuhan Yang Maha Esa atas segala
berkat dan penyertaan-Nya sehingga penulis dapat menyelesaikan tugas akhir ini
dengan baik. Tugas akhir yang berjudul “Analisis Data Ketahanan Hidup Dengan
Model Regresi Cox Proporsional Hazards” merupakan salah satu syarat untuk
memperoleh gelar sarjana Sains pada Fakultas Sains dan Teknologi Universitas
Sanata Dharma Yogyakarta. Penulis mendapat banyak dukungan dan bantuan
dalam menyelesaikan tugas akhir ini. Oleh karena itu, penulis ingin
menyampaikan terima kasih kepada:
1. Bapak Ir. Ig. Aris Dwiatmoko, M.Sc., selaku dosen pembimbing tugas akhir
yang sangat baik hati dan penuh kesabaran telah meluangkan waktu, tenaga
dan pikiran serta selalu memberikan masukan, arahan, nasihat dan motivasi
kepada penulis.
2. Romo Prof. Dr. Frans Susilo, S.J., Bapak Dr. Rer. Nat. Herry P. Suryawan,
S.Si., M.Si., Bapak Y.G. Hartono, Ph.D., Bapak Ir. Ig. Aris Dwiatmoko,
M.Sc., Ibu M. V. Any Herawati, S.Si., M.Si., dan Bapak Sudi Mungkasi,
S.Si., M.Math., Ph.D., selaku dosen program studi matematika yang telah
membagikan ilmu dan pengalaman selama masa perkuliahan.
3. Perpustakaan Universitas Sanata Dharma dan staf sekretariat Fakultas Sains
dan Teknologi yang telah banyak membantu dalam proses administasi dan
akademik.
4. Kedua orang tuaku yang selalu memberikan doa, semangat, motivasi, dan
nasihat sampai tugas akhir ini selesai.
5. Sahabat d’joker: Vivi, Sandy, Rian, Ajie, Aldi, Andhi, Ilham, Ferisa, Yely
yang telah mewarnai pertemanan dan perjuangan saya di Yogyakarta.
6. Sahabat saya Sifra,Winda, dan Damai yang selalu berbagi cerita dan memberi
semangat di segala suasana.
7. Teman-teman Program Studi Matematika Angkatan 2014: Bella, Eka, Aan,
Inne, Dila, Dewi, Meme, Wulan, Monica, Destika, Dini, Mega, Arista, Efrem,
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
xii
DAFTAR ISI
HALAMAN JUDUL .................................................................................................. i
HALAMAN JUDUL DALAM BAHASA INGGRIS ................................................ ii
HALAMAN PERSETUJUAN PEMBIMBING ........................................................ iii
HALAMAN PENGESAHAN .................................................................................... iv
HALAMAN PERSEMBAHAN ................................................................................ v
PERNYATAAN KEASLIAN KARYA ...................................................................... vi
ABSTRAK ................................................................................................................. vii
ABSTRACT ............................................................................................................... viii
LEMBAR PERNYATAAN PERSETUJUAN ............................................................ ix
KATA PENGANTAR ................................................................................................. x
DAFTAR ISI .............................................................................................................. xii
BAB I PENDAHULUAN .......................................................................................... 1
A. Latar Belakang Masalah ................................................................................. 1
B. Rumusan Masalah .......................................................................................... 3
C. Batasan Masalah ............................................................................................. 3
D. Tujuan Penulisan ............................................................................................ 3
E. Manfaat Penulisan .......................................................................................... 4
F. Metode Penulisan ........................................................................................... 4
G. Sistematika Penulisan ..................................................................................... 4
BAB II LANDASAN TEORI .................................................................................... 6
A. Probabilitas ..................................................................................................... 6
1. Probabilitas dari Suatu Kejadian ............................................................... 6
2. Probabilitas Bersyarat ............................................................................... 7
3. Variabel Acak ............................................................................................ 8
B. Distribusi Probabilitas .................................................................................... 9
1. Distribusi Probabilitas Diskrit ................................................................... 9
2. Distribusi Probabilitas Kontinu (Fungsi Densitas) ................................... 13
3. Nilai Harapan ............................................................................................ 15
4. Variansi ...................................................................................................... 20
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
xiii
5. Momen dan Fungsi Pembangkit Momen .................................................. 24
6. Metode Fungsi Pembangkit Momen ......................................................... 28
C. Distribusi Probabilitas Multivariat ................................................................. 30
D. Teorema Limit Pusat ...................................................................................... 33
E. Pendugaan Parameter ..................................................................................... 36
1. Penduga Titik ............................................................................................ 36
2. Penduga Selang (Selang Kepercayaan) ..................................................... 38
3. Metode Pivot ............................................................................................. 38
4. Selang Kepercayaan untuk Sampel Besar ................................................. 40
F. Fungsi Kemungkinan (Likelihood) ................................................................. 42
BAB III MODEL REGRESI COX ........................................................................ 46
A. Analisis Regresi ............................................................................................... 46
B. Analisis Ketahanan Hidup ............................................................................... 46
C. Data Tersensor ................................................................................................. 47
1. Penyensoran Tipe I .................................................................................... 47
2. Penyensoran Tipe II ................................................................................... 48
3. Penyensoran Tipe III.................................................................................. 49
D. Fungsi Ketahanan Hidup ................................................................................. 50
E. Fungsi Hazard ................................................................................................. 52
F. Model Regresi Cox Proporsional Hazards ...................................................... 53
G. Penduga Kemungkinan Maksimum Model Regresi Cox Proporsional
Hazards ............................................................................................................ 55
1. Pendugaan Parameter .......................................................................... 55
2. Pengujian Parameter .................................................................................. 56
a. Pengujian Secara Serentak .................................................................. 56
b. Pengujian Secara Parsial ..................................................................... 57
3. Menghitung Rasio Hazard ........................................................................ 57
BAB IV APLIKASI MODEL REGRESI COX PROPORSIONAL HAZARDS
UNTUK MENGANALISIS DATA KETAHANAN HIDUP ......................... 69
A. Sumber Data ................................................................................................... 69
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
xiv
B. Identifikasi Variabel ....................................................................................... 69
C. Model Regresi Cox Proporsional Hazards untuk Data Ketahanan Hidup ..... 70
BAB V PENUTUP ..................................................................................................... 76
A. Kesimpulan ..................................................................................................... 76
B. Saran ............................................................................................................... 77
DAFTAR PUSTAKA
LAMPIRAN
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
1
BAB I
PENDAHULUAN
A. Latar Belakang Masalah
Statistika merupakan salah satu cabang dari ilmu matematika yang
dipelajari oleh pelajar maupun mahasiswa saat ini. Statistika erat sekali
hubungannya dengan pengambilan sampel dari suatu populasi, proses pengolahan
data, analisis data serta penarikan kesimpulan yang sangat penting dalam
pengambilan keputusan. Banyak sekali orang memakai ilmu statistika untuk
mengambil keputusan dari suatu masalah, misalnya di bidang kesehatan.
Dalam bidang kesehatan, ilmu statistika yang sering digunakan adalah
analisis data ketahanan hidup. Analisis data ketahanan hidup adalah suatu
penyelidikan terhadap daya tahan hidup individu. Dalam bidang kesehatan pula,
sulit sekali bagi kita untuk mengetahui lamanya ketahanan hidup dari seseorang
yang menjalani pengobatan suatu penyakit, khususnya penyakit mematikan
seperti kanker. Ketahanan hidup yang dimaksud adalah proses terjadinya suatu
kejadian khusus, berupa kesembuhan, kambuhnya penyakit yang diderita, bahkan
kematian seseorang. Hal yang dapat kita lakukan adalah mengetahui sifat
karakteristik dari penyakit tersebut, seperti menganalisis peluang seseorang
bertahan hidup, risiko kematian, memodelkan sifat karakteristik penyakit dalam
suatu persamaan matematika, menentukan selang kepercayaan, serta mengambil
keputusan yang berhubungan dengan penyakit yang diderita orang tersebut.
Faktanya dalam bidang kesehatan, banyak sekali kejadian yang melibatkan
populasi heterogen. Sehingga penting sekali untuk menentukan hubungan waktu
ketahanan hidup seseorang dengan faktor lainnya. Model regresi Cox proporsional
hazards (Cox, 1972) pada dasarnya adalah model regresi yang sering digunakan
dalam penelitian medis untuk menyelidiki hubungan antara waktu ketahanan
hidup pasien dengan satu atau lebih variabel penjelas.
Model regresi Cox proporsional hazards diperluas pada kasus risiko
kematian seseorang di waktu tertentu yang bergantung pada nilai pxxx ,,, 21 dari
sejumlah p variabel bebas .,,, 21 pXXX Menurut Lee dan Wang (2003),
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
2
persamaan model regresi Cox proporsional hazards untuk pengamatan ke-i dari n
orang dapat dituliskan sebagai berikut:
ix
i ethth
)()( 0
dengan t variabel terikat yaitu waktu, parameter model, ix variabel bebas
ke-i.
Rasio hazard adalah rasio tingkat bahaya sesuai dengan kondisi yang
dijelaskan oleh satu atau lebih variabel penjelas. Nilai dugaan parameter
menyatakan hubungan variabel penjelas dengan besarnya rasio hazard. Jika nilai
0ˆ j maka naiknya nilai jx akan memperbesar nilai rasio hazardnya atau
semakin besar risiko seseorang untuk gagal bertahan hidup. Jika nilai 0ˆ j
maka naiknya nilaijx akan memperkecil nilai rasio hazardnya atau semakin kecil
risiko seseorang untuk gagal bertahan hidup. Jika nilai 0ˆ j maka naiknya
nilaijx tidak berpengaruh terhadap nilai rasio hazardnya. Untuk mendapatkan
nilai dugaan parameter dapat digunakan metode kemungkinan maksimum
(maximum likelihood) parsial dengan menyelesaikan persamaan (Lee dan Wang,
2008),
.0ln)(ln1
)(
m
i
tRj
x
x
j
j
i
e
eL
Pada tugas akhir ini, data yang digunakan berupa data tak tersensor atau
data tersensor. Data tak tersensor adalah adalah data yang didapat dari setiap
individu dalam sampel dan setiap perkembangan individu dari awal penelitian
sampai individu tersebut meninggal dunia tercatat dengan jelas. Pada
kenyataannya data dari setiap perkembangan individu dari awal hingga individu
tersebut meninggal dunia jarang ditemukan. Banyak faktor yang menyebabkan
data tersebut tidak bisa diperoleh. Faktor-faktor tersebut antara lain individu yang
dinyatakan sembuh sebelum penelitian berakhir, individu yang tidak lagi bersedia
mengikuti penelitian, individu berhenti diberikan perlakuan karena suatu alasan,
dan individu meninggal dunia bukan karena diberi perlakuan sebagaimana yang
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
3
dimaksud dalam penelitian. Data yang dihasilkan oleh berbagai faktor tersebut
disebut data tersensor. Biasanya data yang dihasilkan berupa waktu dengan satuan
hari, minggu, bulan atau tahun.
B. Rumusan Masalah
Berdasarkan latar belakang yang telah diuraikan, maka rumusan
masalahnya adalah sebagai berikut:
1. Apa itu model regresi Cox proporsional hazards?
2. Bagaimana persamaan model regresi Cox proporsional hazards untuk suatu
data ketahanan hidup di bidang kesehatan?
3. Bagaimana menduga hubungan antara variabel respon yaitu waktu ketahanan
hidup pasien dengan satu atau lebih variabel penjelas?
C. Batasan Masalah
Batasan masalah dalam tugas akhir ini adalah sebagai berikut:
1. Data yang digunakan merupakan data tersensor acak.
2. Teorema Ketunggalan Distribusi Probabilitas tidak dibuktikan.
3. Teori probabilitas yang dibahas hanya yang berkaitan dengan materi pokok.
4. Variansi koefisien regresi tidak dibahas tetapi cukup diterapkan saja.
5. Data yang digunakan untuk analisis di bab IV menggunakan data hasil
penelitian Girik Allo, Caecilia B. (2017).
D. Tujuan Penulisan
Berdasarkan rumusan masalah di atas, tujuan dari penulisan skripsi ini
adalah sebagai berikut:
1. Menjelaskan model regresi Cox proporsional hazards dalam analisis
ketahanan hidup.
2. Mendapatkan persamaan model regresi Cox proporsional hazards untuk suatu
data ketahanan hidup di bidang kesehatan.
3. Mengetahui hubungan antara variabel respon yaitu waktu ketahanan hidup
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
4
pasien dengan satu atau lebih variabel penjelas dari data ketahanan hidup.
E. Manfaat Penulisan
Manfaat dari penulisan tugas akhir ini adalah sebagai berikut:
1. Memperluas wawasan pembaca tentang model regresi yang digunakan untuk
menganalisis data ketahanan hidup.
2. Menambah pengetahuan pembaca tentang penerapan analisis model regresi
Cox proporsional hazards di bidang kesehatan.
F. Metode Penulisan
Metode penulisan dalam tugas akhir ini adalah metode studi pustaka yaitu
dengan membaca dan mempelajari buku-buku atau jurnal-jurnal yang berkaitan
dengan analisis data ketahanan hidup dengan model regresi Cox proporsional
hazards, serta proses pengolahan data menggunakan program R.
G. Sistematika Penulisan
Sistematika penulisan skripsi ini adalah sebagai berikut:
BAB I PENDAHULUAN
A. Latar Belakang Masalah
B. Rumusan Masalah
C. Batasan Masalah
D. Tujuan Penulisan
E. Manfaat Penulisan
F. Metode Penulisan
G. Sistematika Penulisan
BAB II LANDASAN TEORI
A. Probabilitas
B. Distribusi Probabilitas
C. Distribusi Probabilitas Multivariat
D. Teorema Limit Pusat
E. Pendugaan Parameter
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
5
F. Fungsi Kemungkinan (Likelihood)
BAB III MODEL REGRESI COX
A. Analisis Regresi
B. Analisis Ketahanan Hidup
C. Data Tersensor
D. Fungsi Ketahanan Hidup
E. Fungsi Hazard
F. Distribusi Waktu Ketahanan Hidup Model Diskrit
G. Distribusi Waktu Ketahanan Hidup Model Kontinu
H. Model Regresi Cox Proporsional Hazards
I. Penduga Kemungkinan Maksimum Model Regresi Cox Proporsional Hazards
BAB IV APLIKASI MODEL REGRESI COX PROPORSIONAL HAZARDS
UNTUK MENGANALISIS DATA KETAHANAN HIDUP
A. Sumber Data
B. Identifikasi Variabel
C. Model Cox Proporsional Hazards untuk Data Ketahanan Hidup
BAB V KESIMPULAN
A. Kesimpulan
B. Saran
DAFTAR PUSTAKA
LAMPIRAN
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
6
BAB II
LANDASAN TEORI
A. Probabilitas
1. Probabilitas dari Suatu Kejadian
Definisi 2.1
Misalkan S adalah ruang sampel yang terkait dengan suatu percobaan. Untuk
setiap kejadian A dalam S, dilambangkan dengan P(A), disebut probabilitas dari A
memenuhi:
Aksioma 1 : .0)( AP
Aksioma 2 : .1)( SP
Aksioma 3 : Jika ,,, 321 AAA membentuk urutan berpasangan kejadian saling
asing dalam S maka
1
321 ).()(i
iAPAAAP
Contoh 2.1
Seorang produsen memiliki lima terminal komputer yang identik, tersedia untuk
dikirimkan. Tanpa diketahui oleh produsen tersebut, dua dari lima terminal
komputer adalah cacat. Ada suatu pesanan datang meminta untuk dikirimkan dua
terminal dan diisi secara acak dengan memilih dua dari lima yang tersedia.
a. Daftarkan ruang sampel untuk eksperimen ini.
b. Misalkan A adalah kejadian bahwa pesanan diisi dengan dua terminal yang
tidak cacat. Daftarkan titik sampel A.
c. Tentukan probabilitas kejadian A.
Jawab:
a. Misalkan dua terminal yang cacat diberi label 1D dan 2D serta misalkan tiga
terminal yang bagus diberi label .,, 321 GGG Setiap titik sampel tunggal akan
terdiri dari dua terminal yang dipilih untuk pengiriman. Kejadian sederhananya
dapat ditulis dengan
),,{ 211 DDE ),,{ 125 GDE ),,{ 218 GGE ).,{ 3210 GGE
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
7
),,{ 112 GDE ),,{ 226 GDE ),,{ 319 GGE
),,{ 213 GDE ),,{ 327 GDE
),,{ 314 GDE
Jadi, ada sepuluh titik sampel dalam ruang sampel S, dan }.,,,{ 1021 EEES
b. Kejadian }.,,{ 1098 EEEA
c. Karena 1098 EEEA , maka oleh Aksioma 3 diperoleh
.10
3
10
1
10
1
10
1)()()()( 1098 EPEPEPAP
2. Probabilitas Bersyarat
Definisi 2.2
Probabilitas bersyarat dari kejadian A jika diketahui kejadian B terjadi adalah
,)(
)()|(
BP
BAPBAP
dengan .0)( BP
Lambang )|( BAP dibaca “probabilitas bersyarat dari A jika diketahui kejadian
B”.
Contoh 2.2
Sebuah dadu setimbang dilempar satu kali. Tentukan probabilitas munculnya mata
dadu yang kurang dari lima jika diketahui munculnya kejadian mata dadu genap
terlebih dahulu.
Jawab:
Ruang sampel }.6,5,4,3,2,1{S
A = kejadian muncul mata dadu yang kurang dari lima }.4,3,2,1{
B = kejadian munculnya mata dadu genap }.6,4,2{
}.4,2{ BA
.3
1
6
2)( BAP
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
8
.2
1
6
3)( BP
Sehingga diperoleh,
.3
2
2
13
1
)(
)()|(
BP
BAPBAP
Jadi, probabilitas munculnya mata dadu yang kurang dari lima jika diketahui
munculnya kejadian mata dadu genap terlebih dahulu adalah .32
3. Variabel Acak
Defisi 2.3
Variabel acak adalah fungsi yang memetakan setiap elemen ruang sampel ke
bilangan real. Dengan kata lain variabel acak merupakan pemetaan dari himpunan
ruang sampel ke himpunan bilangan real. Variabel acak dilambangkan dengan
huruf kapital, misalnya X.
Definisi 2.4
Variabel acak X dikatakan diskrit jika nilai-nilainya berhingga atau tak berhingga
terbilang. Jika tidak memenuhi kondisi tersebut maka variabel acak X dikatakan
kontinu.
Contoh 2.3
Dua buah bola diambil berturut-turut tanpa pengembalian dari sebuah tabung yang
berisi 4 bola merah dan 3 bola hitam. Kemungkinan hasil dan nilai x dari variabel
acak X, dengan X adalah banyaknya bola merah, adalah
Ruang sampel S X
RR 2
RB 1
BR 1
BB 0
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
9
Dengan kata lain, ruang sampel BBRBBRRRS ,,,,,,, dan setiap
elemen dari S dipetakan ke ℝ yang merupakan nilai y dari variabel acak X
seperti berikut:
S
ℝ
B. Distribusi Probabilitas
1. Distribusi Probabilitas Diskrit
Definisi 2.5
Himpunan pasangan terurut ))x(p,x( adalah fungsi probabilitas atau distribusi
probabilitas dari variabel acak diskrit X jika untuk setiap kemungkinan nilai x,
1. ,0)x(p
2. ,x
1)x(p
Peluang suatu variabel random X bernilai x, dinotasikan dengan )( xXP atau
).(xp
Contoh 2.4
Pengiriman 20 komputer sejenis ke sebuah toko memuat 3 komputer yang rusak.
Jika sebuah sekolah membeli secara acak 2 komputer dari 20 komputer tersebut,
tentukan distribusi probabilitas untuk banyaknya komputer yang rusak.
Jawab:
Misalkan X adalah variabel acak dengan x adalah kemungkinan nilai banyaknya
komputer rusak yang dibeli oleh sekolah, maka kemungkinan nilai x adalah 0, 1,
atau 2.
{(R,R)}
{(R,B)}
{(B,R)}
{(B,B)}
0
1
2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
10
,95
68
2
20
2
17
0
3
)0X(P)0(p
,190
51
2
20
1
17
1
3
)1X(P)1(p
.190
3
2
20
0
17
2
3
)2X(P)2(p
Jadi, distribusi probabilitas untuk X adalah
X 0 1 2
f(x) 95
68
190
51
190
3
Definisi 2.6
Fungsi distribusi kumulatif )(xF dari variabel acak diskrit X dengan distribusi
probabilitas )x(p adalah
xt
),t(p)xX(P)x(F untuk . x
Contoh 2.5
Jika sebuah agen mobil menjual 50% inventaris mobil asing tertentu yang
dilengkapi dengan kantong udara samping, tentukan rumus untuk distribusi
probabilitas dari banyaknya mobil dengan kantong udara samping yang terjual
dari 4 mobil yang tersedia oleh agensi dan tentukan juga fungsi distribusi
kumulatifnya.
Jawab:
Karena probabilitas menjual mobil dengan kantong udara samping adalah ,5.0
1624 titik ruang sampel sama-sama mungkin terjadi. Oleh karena itu,
penyebut untuk semua probabilitas, dan juga untuk fungsi yang dicari, adalah 16.
Untuk memperoleh banyaknya cara menjual 3 mobil dengan kantong udara
samping, perlu dipertimbangkan berapa banyak cara membagi 4 hasil ke dalam 2
bagian, 1 bagian untuk 3 mobil dengan kantong udara samping dan 1 bagian
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
11
lainnya untuk model tanpa kantong udara samping. Hal tersebut bisa dilakukan
dengan 43
4
cara. Secara umum, kejadian menjual x model dengan kantong
udara samping dan x4 model tanpa kantong udara samping dapat terjadi pada
x
4 cara, dengan kemungkinan nilai x adalah 0, 1, 2, 3, atau 4. Dengan demikian,
distribusi probabilitas )xX(P)x(p adalah
,16
x
4
)x(p
untuk .4,3,2,1,0x
Selanjutnya, dari rumus distribusi probabilitas di atas, secara langsung
memberikan ,161)0(p ,41)1(p ,83)2(p ,41)3(p dan .161)4(p
Sehingga,
,161)0(p)0(F
,165)1(p)0(p)1(F
,1611)2(p)1(p)0(p)2(F
,1615)3(p)2(p)1(p)0(p)3(F
.1)4(p)3(p)2(p)1(p)0(p)4(F
Jadi,
.4,1
,43,16
15
,32,16
11
,21,16
5
,10,16
1
,0,0
)(
x
x
x
x
x
x
xF
Contoh-contoh distribusi probabilitas diskrit adalah distribusi Binomial, distribusi
Geometrik, distribusi Hipergeometrik, dan distribusi Poisson. Selanjutnya akan
dibahas mengenai distribusi Binomial.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
12
Definisi 2.7
Eksperimen Binomial memiliki sifat sebagai berikut:
1. Eksperimen terdiri dari n ulangan yang identik.
2. Setiap ulangan menghasilkan satu dari dua hasil, yaitu sukses (S) atau gagal
(G).
3. Probabilitas sukses pada sebuah ulangan adalah p, dan tetap sama untuk
ulangan-ulangan lainnya. Probabilitas gagal pada ulangan tersebut adalah
.1 pq
4. Ulangan-ulangan bersifat saling bebas.
5. Variabel acak X adalah banyaknya sukses yang teramati selama n ulangan.
Contoh 2.6
Sebuah ujian pilihan ganda mempunyai 15 pertanyaan, masing-masing dengan
lima kemungkinan jawaban, hanya satu dari antaranya yang benar. Asumsikan
bahwa seorang siswa menjawab semua pertanyaan dalam ujian tersebut. Apakah
pengamatan terhadap hasil ujian ini termasuk eksperimen Binomial?
Jawab:
Jika pengamatan di atas termasuk eksperimen Binomial maka harus memenuhi
sifat-sifat yang ada pada definisi 2.7.
1. Mengamati siswa menjawab 15 soal pilihan ganda berarti dapat diasumsikan
dengan eksperimen dengan ulangan sebanyak .15n
2. Setiap soal hanya ada dua kemungkinan hasil, yaitu benar (sukses) atau salah
(gagal).
3. Untuk setiap soal, peluang menjawab benar (sukses) 5
1p dan peluang
menjawab salah (gagal) .5
4q
4. Jawaban setiap soal saling bebas satu dengan yang lain.
5. Variabel acak X adalah banyaknya jawaban yang benar.
Jadi, pengamatan di atas termasuk eksperimen Binomial.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
13
Definisi 2.8
Variabel acak X dikatakan berdistribusi Binomial dengan n ulangan dan
probabilitas sukses p jika dan hanya jika
,)( xnx qpx
nxp
nx ,,2,1,0 dan .10 p
Contoh 2.7
Tentukan probabilitas siswa menjawab benar minimal 10 soal pada contoh 2.6.
Jawab:
X = banyaknya jawaban yang benar
.15,,3,2,1,0 x
xx
xxp
15
5
4
5
115)(
Probabilitas bahwa siswa menjawab benar minimal 10 soal )10( XP
)15()14()13()12()11()10( XPXPXPXPXPXP
213312411510
5
4
5
1
13
15
5
4
5
1
12
15
5
4
5
1
11
15
5
4
5
1
10
15
015114
5
4
5
1
15
15
5
4
5
1
14
15
.10132256625.1
4
2. Distribusi Probabilitas Kontinu (Fungsi Densitas)
Definisi 2.9
Fungsi )(xf adalah fungsi probabilitas untuk variabel acak kontinu X, jika
1. ,0)( xf x ℝ.
2.
)(xf .1dx
Peluang variabel random X terletak dalam interval [a,b] dinyatakan dengan
b
a
dx)x(f)bXa(P
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
14
Contoh 2.8
Misalkan kesalahan dalam pengiriman pada suatu perusahaan pengiriman adalah
variabel acak kontinu X yang memiliki fungsi densitas
lainnya
xx
xf
,0
20,4)(
3
Buktikan bahwa )(xf adalah fungsi densitas.
Jawab:
Menurut definisi 2.9
1. 0)( xf jelas terlihat dari definisi ).(xf
2.
)(xf 2
0
3
4
xdx .1
0
2
16
4
x
dx
Jadi, terbukti bahwa )(xf adalah fungsi densitas.
Definisi 2.10
Fungsi distribusi kumulatif )(xF dari variabel acak kontinu X dengan fungsi
densitas )(xf adalah
x
tfxXPxF )()()( ,dt untuk . x
Akibat dari definisi 2.10
)()()( aFbFbXaP dan dx
xdFxf
)()( jika turunannya ada.
Contoh 2.9
Tentukan fungsi distribusi kumulatif dari contoh 2.8 dan tentukan ).31( XP
Jawab:
o Untuk 0x
x
xF 0)( .0dt
o Untuk 20 x
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
15
dxxxf
xxp
XEx
)(
)(
)(
0
0)(xF x
tdt
0
3
4.
16
4xdt
o Untuk 2x
0
0)(xF 2
0
3
4
tdt
2
0dt .116
16dt
Jadi,
2,1
20,16
0,0
)(4
x
xx
x
xF
Selanjutnya, .16
15
16
11)1()3()31( FFXP
Contoh-contoh distribusi probabilitas kontinu adalah distribusi Normal, distribusi
Gamma, distribusi Eksponensial, dan distribusi Chi-square. Selanjutnya akan
dibahas mengenai distribusi Normal.
Definisi 2.11
Variabel acak X dikatakan berdistribusi Normal jika dan hanya jika untuk 0
dan , fungsi densitas dari X adalah
,2
1)(
2
2
1
x
exf . x
3. Nilai Harapan
Definisi 2.12
Misalkan X adalah variabel acak. Nilai harapan dari X, dilambangkan dengan
),(XE didefinisikan sebagai
, jika X adalah variabel acak diskrit
, jika X adalah variabel acak kontinu.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
16
Contoh 2.10
Tentukan nilai harapan X dari contoh 2.4.
Jawab:
.10
3
190
32
190
511
95
680)(
XE
Contoh 2.11
Tentukan nilai harapan X dari contoh 2.8
Jawab:
.5
8
0
2
2044)(
2
0
52
0
43
x
dxx
dxx
xXE
Teorema 2.1
Jika X adalah variabel acak dengan fungsi probabilitas )(xp atau f(x) dan )(Xg
adalah fungsi yang bernilai real dari X maka nilai harapan dari )(Xg diberikan
oleh
, jika X adalah variabel acak diskrit
Bukti:
Akan dibuktikan
x
xpxgXgE )()( pada kasus dengan nilai variabel acak
diskrit X berhingga yaitu .,,, 21 nxxx Karena fungsi )(xg mungkin bukan
fungsi satu-satu, asumsikan bahwa )(Xg mengambil nilai mggg ,,, 21
(dengan nm ). Hal ini berarti )(Xg adalah variabel acak sedemikian hingga
untuk ,,,2,1 mi
jx
iji gpxpgXgP ),()()( dengan .)( ij gxg
Sehingga, oleh definisi 2.12,
, jika X adalah variabel acak kontinu
dx x f x g
x p x g
x g E x
) ( ) (
) ( ) (
)) ( (
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
17
m
i
ii gpgXgE1
)(
m
i x
ji
j
xpg1
)(
m
i x
ji
j
xpg1
)(
n
j
jj xpxg1
).()(
Jadi, terbukti bahwa
x
xpxgXgE ).()(
Untuk kasus kontinu,
dx)x(f)x(gXgE
dapat dibuktikan secara analog.
Contoh 2.12
Manajer ruang persediaan di sebuah pabrik telah membuat distribusi probabilitas
berikut untuk permintaan harian (banyaknya waktu yang digunakan) untuk alat
tertentu.
x 0 1 2
p(x) 0.1 0.5 0.4
Biaya penggunaan di pabrik adalah $10 setiap kali alat tersebut digunakan.
Tentukan rata-rata dari biaya harian untuk menggunakan alat tersebut.
Jawab:
X = banyaknya kali peralatan digunakan
g(X) = biaya penggunaan alat harian .10X
g(x) 0 10 20
p(x) 0.1 0.5 0.4
x
xpxgXgE )()())(( .13850)4.0(20)5.0(10)1.0(0
Teorema 2.2
Jika X adalah variabel acak dan c adalah suatu konstanta taknegatif maka
.)( ccE
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
18
Bukti:
Kasus 1: untuk X variabel acak diskrit
x x
ccxpcxcpcE .)1()()()(
Kasus 2: untuk X variabel acak kontinu
.)1()()()( ccdxxfcdxxcfcE
Jadi, terbukti bahwa .)( ccE
Teorema 2.3
Jika X adalah variabel acak dan c adalah konstanta taknegatif maka
).()( XcEcXE
Bukti:
Kasus 1: untuk X variabel acak diskrit
x x
XcExxpcxcxpcXE ).()()()(
Kasus 2: untuk X variabel acak kontinu
).()()()( XcEdxxxfcdxxcxfcXE
Jadi, terbukti bahwa ).()( XcEcXE
Teorema 2.4
Jika X adalah variabel acak diskrit dengan fungsi probabilitas )(xp dan
)(,),(),( 21 XgXgXg k adalah k fungsi dari X maka
.)()()()()()( 2121 XgEXgEXgEXgXgXgE kk
Bukti:
x
kk xpxgxgxgXgXgXgE )())()()(()()()( 2121
x
k xpxgxpxgxpxg )()()()()()( 21
x
k
x x
xpxgxpxgxpxg )()()()()()( 21
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
19
.)()()( 21 XgEXgEXgE k
Jadi, terbukti bahwa
.)()()()()()( 2121 XgEXgEXgEXgXgXgE kk
Teorema 2.5
Jika X adalah variabel acak kontinu dengan fungsi densitas )(xf dan
)(,),(),( 21 XgXgXg k adalah k fungsi dari X maka
.)()()()()()( 2121 XgEXgEXgEXgXgXgE kk
Bukti:
dxxfxgxgxgXgXgXgE kk )())()()(()()()( 2121
dxxfxgxfxgxfxg k
)()()()()()( 21
dxxfxgdxxfxgdxxfxg k )()()()()()( 21
.)()()( 21 XgEXgEXgE k
Jadi, terbukti bahwa
.)()()()()()( 2121 XgEXgEXgEXgXgXgE kk
Teorema 2.6
Jika X adalah variabel acak Binomial dengan n ulangan dan p adalah probabilitas
sukses, maka
.)( npXE
Bukti:
Akan dibuktikan npXE )(
Dari definisi 2.12 diperoleh
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
20
n
x
xxpXE0
)()(
Karena jumlahan pertama adalah 0 dan menurut Definisi 2.8 diperoleh
ynxn
x
qpx
nxXE
1
)(
xnxn
x
qpxxn
nx
!)!(
!
1
n
x
xnx qpxxn
n
1 )!1()!(
!
n
x
xnx qpxxn
nnp
1
1
)!1()!(
)!1(
Misal ,1 xy sehingga
ynzn
y
qpyyn
nnpXE
1
1
0 !)!1(
)!1()(
ynyn
y
qpy
nnp
1
1
0
1
Karena ,11
11
0
ynyn
y
qpy
n maka
.)( npXE
Jadi, terbukti bahwa .)( npXE
4. Variansi
Definisi 2.13
Jika X adalah variabel acak dengan rata-rata ,)( XE variansi dari variabel
acak X didefinisikan menjadi nilai harapan dari .)(2X Dengan kata lain,
.)()( 2 XEXV Standar deviasi dari X adalah akar kuadrat positif dari ).(XV
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
21
Contoh 2.13
Tentukan variansi dari X pada contoh 2.12.
Jawab:
x
xg xpxgXgEXgV )())(())(())((2
)(
2
4.0)1320(5.0)1310(1.0)130( 222
.415
98
2
9
10
169
Teorema 2.7
Jika X adalah variabel acak dengan fungsi probabilitas )(xp dan rata-rata
)(XE maka .)(])[()(2222 XEXEXV
Bukti:
])[()( 22 XEXV
]2[ 22 XXE
][]2[][ 22 EXEXE
][][2][ 22 EXEXE
222 2][ XE
.][ 22 XE
Jadi, terbukti bahwa .)(])[()(2222 XEXEXV
Contoh 2.14
Tentukan variansi dan standar deviasi dari X pada contoh 2.4
Jawab:
Diketahui dari contoh 2.10 bahwa .103
,19063)1903()2()19051()1()9568()0()()( 22222 x
xpxXE
Oleh Teorema 2.6, diperoleh
.1900459100919063)()( 222 XEXV
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
22
.4915068131.01900459)( XV
Teorema 2.8
Jika X adalah variabel acak dan c adalah konstanta taknegatif maka
).()( 2 XVccXV
Bukti:
]))([()(2cXEcXEcXV
])[( 2ccXE
]2[ 22222 cXcXcE
][]2[][ 22222 cEXcEXcE
222222 2][ ccXEc
2222 ][ cXEc
)][( 222 XEc
).(2 XVc
Jadi, terbukti bahwa ).()(2 XVccXV
Teorema 2.9
Jika X adalah variabel acak dan c adalah konstanta taknegatif maka
).()( XVcXV
Bukti:
]))()[(()( 2cXEcXEcXV
]))()[(( 2ccXE
]222222[ 22222 ccccbXXccXXE
]2[ 22 XXE
])[( 2 XE
).(XV
Jadi, terbukti bahwa ).()( XVcXV
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
23
Teorema 2.10
Jika X adalah variabel acak Binomial dengan n ulangann dan p adalah probabilitas
sukses, maka
.)( 2 npqXV
Bukti:
Akan dibuktikan npqXV 2)(
Dari Teorema 2.7 diketahui bahwa 22 )()( XEXV
o
n
x
xpxXE0
22 )()(
xnxn
x
qpx
nx
0
2
xnxn
x
qpxxn
nx
!)!(
!
0
2
Dari bentuk di atas dapat disimpulkan bahwa mencari )(2XE adalah sulit
karena 2x bukanlah faktor dari !.x Oleh karena itu, )(2XE dapat diperoleh
dari ).()]1([)(2 XEXXEXE
o
n
x
xpxxXXE0
)()1()]1([
xnxn
x
qpx
nxx
0
)1(
xnxn
x
qpxxn
nxx
0 !)!(
!)1(
Jumlahan saat 0x dan 1x adalah nol, sehingga diperoleh
xnxn
x
qpxxn
nXXE
2 )!2()!(
!)]1([
xnxn
x
qppxxn
nnn
22
2 )!2()!(
)!2)(1(
xnxn
x
qpxxn
npnn
2
2
2
)!2()!(
)!2()1(
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
24
Misal ,2 xy diperoleh
ynyn
y
qpyyn
npnnXXE
2
0
2
!)!2(
)!2()1()]1([
Karena ,1!)!2(
)!2( 2
0
ynyn
y
qpyyn
n maka
2)1()]1([ pnnXXE
Sehingga diperoleh .)1()()]1([)(22 nppnnXEXXEXE
22 )()( XEXV
222 )()( npnppnn
22222 pnnpnppn
2npnp
)1( pnp
.npq
Jadi, terbukti bahwa .)(2 npqXV
5. Momen dan Fungsi Pembangkit Momen
Definisi 2.14
Momen ke-k dari variabel acak X di sekitar titik asal adalah .')( kkXE
Definisi 2.15
Fungsi pembangkit momen )(tm untuk variabel acak X adalah ).()(tXeEtm
Fungsi pembangkit momen untuk X dikatakan ada jika ada sebuah konstanta
positif a sedemikian hingga )(tm berhingga untuk .|| at
Teorema 2.11
Jika )(tm ada, maka untuk sebarang bilangan positif k,
.)0()( ')(
0
k
k
t
k
k
mdt
tmd
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
25
Bukti:
k
k
dt
tmd )( atau )(
)( tm k adalah turunan ke-k dari )(tm terhadap t. Karena
,!3!2
1)()( '3
3'
2
2'
1 tt
teEtm tX
sehingga
'3
2'
2
'
1
)1(
!3
3
!2
2)(
tttm
'3'
2
)2(
!2
2)(
ttm
Secara umum,
'
2
2'
1
')(
!3
3
!2
2)( kkk
k tttm
saat ,0t maka '
1
)1( )( tm dan ,)( '2)2( tm sehingga secara umum
.)( ')( kk tm
Jadi, terbukti bahwa .)0()( ')(
0
k
k
t
k
k
mdt
tmd
Contoh 2.15
Tentukan fungsi pembangkit momen dari distribusi Binomial.
Jawab:
)()(tXeEtm
n
x
tx xpe0
)(
n
x
xnxtx qpx
ne
0
n
x
xnxt
x
nqpe
0
)(
ntntntn pen
nqpe
nqpe
nq
n)()(
210
221
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
26
.)( nt qpe
Ingat bahwa .210
)( 221 nnnnn pn
nqp
npq
nq
npq
Jadi, fungsi pembangkit momen dari distribusi Binomial adalah
.)()( nt qpetm
Contoh 2.16
Tentukan )(XE dan )(XV untuk Contoh 2.15 dengan cara mendiferensiasikan
fungsi pembangkit momen pada Contoh 2.15.
Jawab:
nt
tt
qpedt
dtm
dt
dXE )()()(
0
)1(
0
'
1
0
1)(
t
tnt peqpen
1)( nqpnp
Karena 1 qp maka .)( npXE
Selanjutnya,
)()(0
'
2
)2( qpenpedt
dtm tt
t
0
21 ))(1()(
t
tnttntt peqpennpeqpenpe
pnnpnp )1((
.222 nppnnp
2)1()2( )]([)()( tmtmXV
2222 )(npnppnnp
22222 pnnppnnp
2npnp
)1( pnp
.npq
Jadi, npXE )( dan .)( npqXV
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
27
Contoh 2.17
Tentukan fungsi pembangkit momen dari distribusi Normal.
Jawab:
dxeeeEtmx
txtX
2
2)(
2
1
2
1)()(
Misal xu maka ux dan ,dxdu maka diperoleh
dueetmu
ttu
2
22
1
2
1)(
dueeutu
t
2
22
1
2
1
duee
utu
t 2
22
2
2
2
1
duee
tuu
t 2
22
2
2
2
1
Karena 42222 2)( ttuutu maka
dueetmttu
t])[(
2
1 4222
2
1)(
dueeet
t
t])[(
2
1
2
22
22
42
2
1
dxeetx
tt
22
2
22
)(2
1
2
2
1
Karena 12
122
2)(
2
1
dxetx
dengan rata-rata
2 t dan variansi
,2 maka
.)( 222
t
t
etm
Teorema 2.12
Jika X berdistribusi Normal dengan parameter dan maka
)(XE dan .)(2XV
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
28
Bukti:
Pembuktian nilai harapan dan variansi dari distribusi Normal dibuktikan dengan
cara mendiferensiasikan fungsi pembangkit momen dari distribusi Normal.
Dari Definisi 2.14 dan Teorema 2.11, diperoleh
2
0
)1(
0
'
1
22
)()(
t
t
tt
edt
dtm
dt
dXE
0
22
22
)(
t
tt
et
.
Selanjutnya,
22
0
'
2
)2(
22
)()(
t
t
t
etdt
dtm
0
22222
2222
)(
t
tt
tt
ete
22
2)1()2( )]([)()( tmtmXV
222
.2
Jadi, terbukti bahwa )(XE dan .)(2XV
6. Metode Fungsi Pembangkit Momen (FPM)
Metode fungsi pembangkit momen digunakan untuk menentukan distribusi
probabilitas untuk fungsi dari variabel acak .,,, 21 nXXX
Teorema 2.13 Teorema Ketunggalan Distribusi Probabilitas
Misalkan )(tmX dan )(tmY adalah fungsi pembangkit momen dari variabel
acak X dan Y. Jika kedua fungsi pembangkit momen ada dan )()( tmtm YX
untuk semua nilai t, maka X dan Y mempunyai distribusi probabilitas yang sama.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
29
Bukti:
Julie, H. (1999). Teorema Limit Pusat Lindenberg dan Terapannya. Skripsi
Pada skripsi tersebut, teorema ketunggalan dibuktikan secara umum dengan
menggunakan definisi fungsi karakteristik, yaitu ),()(itx
x eEt dengan i adalah
bilangan kompleks.
Perhatikan bahwa fungsi pembangkit momen adalah bentuk khusus dari fungsi
karakteristik, bukti dilakukan dengan menunjukkan bahwa bila F dan G adalah
fungsi distribusi kumulatif dengan fungsi karakteristik yang sama, yaitu
,)()(
xdGexdFe itxitx t ℝ.
Maka )()( xGxF (Skripsi halaman 54).
Berdasarkan teorema ketunggalan terdapat korespondensi satu-satu antara fungsi
pembangkit momen dengan fungsi probabilitas.
Contoh 2.18
Misalkan X adalah variabel yang berdistribusi normal dengan rata-rata dan
variansi .2 Tentukan fungsi pembangkit momen dan distribusi probabilitas dari
. XU
Jawab:
)()( utu eEtm
)( )( txeE
)( )( ttxeE
t
tx
e
eE
t
tt
e
e 222
tt
t
e
222
.222t
e
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
30
Jadi, fungsi pembangkit momen dari XU adalah 22
)(
t
u etm sama
dengan fungsi pembangkit momen dari distribusi Normal sedemikian hingga
XU berdistribusi Normal.
Teorema 2.14
Misalkan nXXX ,,, 21 adalah variabel acak yang saling bebas dengan fungsi
pembangkit momen ).(,),(),(21
tmtmtmnxxx
Jika nXXXU 21
maka ).()()()(21
tmtmtmtmnxxxU
Bukti:
)()( tUU eEtm
)()( 21 nxxxteE
)( 21 ntxtxtx
eeeE
)()()( 21 ntxtxtx
eEeEeE
).()()(21
tmtmtmnxxx
Jadi, terbukti bahwa ).()()()(21
tmtmtmtmnxxxU
C. Distribusi Probabilitas Multivariat
Definisi 2.16
Misalkan 1X dan 2X adalah variabel acak diskrit. Fungsi probabilitas bersama
untuk 1X dan 2X adalah
),,(),( 221121 xXxXPxxp ., 21 xx
Definisi 2.17
Misalkan 1X dan 2X adalah variabel acak diskrit dengan fungsi probabilitas
bersama ),( 21 xxp maka
1. ,0),( 21 xxp untuk semua 1x dan ,2x
2. 21 ,
21 .1),(xx xxp
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
31
Contoh 2.19
Sebuah supermarket memiliki tiga buah kasir. Dua pelanggan datang ke kasir pada
waktu yang berbeda ketika kasir tidak melayani pelanggan lain. Setiap pelanggan
memilih kasir secara acak, saling bebas satu sama lain. Misalkan 1X adalah
banyaknya pelanggan yang memilih kasir I, dan 2X adalah banyaknya
pelanggan yang memilih kasir II. Tentukan fungsi probabilitas bersama untuk 1X
dan .2X
Jawab:
Misal pasangan terurut },{ ji adalah kejadian sederhana bahwa pelanggan
pertama memilih kasir i dan pelanggan kedua memilih kasir j, dengan ,2,1, ji
dan 3. Menggunakan aturan mn, ruang sampel terdiri dari 933 titik sampel.
Dengan asumsi yang telah diberikan sebelumnya, setiap titik sampel sama-sama
memiliki probabilitas .91 Ruang sampel yang terkait adalah
}].3,3{},2,3{},1,3{},3,2{},2,2{},1,2{},3,1{},2,1{},1,1[{S
Perlu diperhatikan bahwa titik sampel {1,1} adalah satu-satunya titik sampel yang
sesuai dengan )0,2( 21 XX akibatnya .91)0,2( 21 XXP Sama
halnya dengan }2,1({)1,1( 21 PXXP atau .92})1,2{ Tabel 2.1 memuat
probabilitas yang berhubungan dengan setiap kemungkinan pasangan nilai untuk
1X dan .2X Dengan kata lain, tabel 2.1 menyajikan fungsi probabilitas bersama
untuk 1X dan .2X
x1
x2
0
1
2
0 1/9 2/9 1/9
1 2/9 2/9 0
2 1/9 0 0
Tabel 2.1 Fungsi probabilitas bersama untuk 1X dan 2X
Definisi 2.18
Untuk sebarang variabel acak 1X dan ,2X fungsi distribusi bersama ),( 21 xxF
adalah ),,(),( 221121 xXxXPxxF ., 21 xx
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
32
Untuk dua variabel diskrit 1X dan ,2X ),( 21 xxF adalah
).,(),( 212111 22
ttpxxFxt xt
Contoh 2.20
Berdasarkan variabel acak 1X dan 2X pada Contoh 2.18, tentukan ),2,1(F
),2,5.1(F dan ).7,5(F
Jawab:
Menggunakan hasil pada Tabel 2.1, diperoleh
.0)()2,1()2,1( 21 PXXPF
Selanjutnya,
)2,5.1()2,5.1( 21 XXPF
)2,1()1,1()0,1()2,0()1,0()0,0( ppppp
.9
8
9
022121
.1)7,5()7,5( 21 XXPF
Perlu diperhatikan bahwa 1),( 21 xxF untuk semua 21 , xx sedemikian hingga
2},min{ 21 xx dan 0),( 21 xxF jika .0},min{ 21 xx
Definisi 2.19
Misalkan 1X dan 2X adalah variabel acak kontinu dengan fungsi distribusi
bersama ).,( 21 xxF Jika terdapat fungsi tak negatif ),,( 21 xxf sedemikian
hingga
1 2
,),(),( 122121
x x
dtdtttfxxF
untuk semua ,, 21 xx maka 1X dan 2X dikatakan sebagai
variabel acak kontinu bersama. Fungsi ),( 21 xxf adalah fungsi densitas
bersama.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
33
Definisi 2.20
Misalkan 1X dan 2X adalah variabel acak kontinu dengan fungsi probabilitas
bersama ),( 21 xxf maka
1. ,0),( 21 xxf ., 21 xx
2.
.1),( 2121 dxdxxxf
D. Teorema Limit Pusat
Teorema 2.15
Misalkan X dan ,,, 321 XXX adalah variabel acak dengan fungsi pembangkit
momen )(tm dan .),(),(),( 321 tmtmtm Jika
)()(lim tmtmnn
t ℝ
maka fungsi distribusi dari nX konvergen ke fungsi distribusi X saat .n
Bukti:
Bukti terdapat pada buku Williams, David. (1991). Probability With Martingales.
New York: Cambridge University Press. Halaman 185.
Teorema 2.16
Misalkan nXXX ,,, 21 merupakan variabel acak yang berdistribusi independen
dan identik dengan )( iXE dan .)(2 iXV Didefinisikan
,1
n
X
n
nXU
n
i i
n
dengan .1
1 n
i iX
nX
Maka fungsi distribusi dari nU konvergen ke fungsi Distribusi Normal Standar
ketika ,n yaitu
u t
nn
dteuUP ,2
1)(lim 2
2
untuk semua u.
Bukti:
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
34
Misalkan
XnU n
n
i
i nn
Xn
n
11
n
i iX
n
11
n
i iZ
n1
1 dengan .
ii
XZ
Karena variabel acak iX adalah saling bebas dan berdistribusi identik maka ,iZ
ni ,,2,1 juga saling bebas dan berdistribusi identik dengan 0)( iZE dan
,1)( iZV maka fungsi pembangkit momen dari jumlahan variabel acak adalah
perkalian dari masing-masing fungsi pembangkit momennya (Teorema 2.14),
maka
)()()()(21
tmtmtmtmni
zzzZ
.)(1
n
Z tm
Selanjutnya akan dicari fungsi pembangkit momen untuk ,nU
i
n
Zn
t
U eEm
1
in
t
ZeE
n
tm
iZ
.1
n
Zn
tm
Deret Taylor dari )(1
tm z adalah
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
35
2)(")0(')0()(
2
1111
tmtmmtm ZZZZ dengan t 0
1)1()()0( 11
0 EeEm
Z
Z dan ,0)()()0(' 1
0
11
1 ZEeZEm
Z
Z
maka
2)(''1)(
2
11
tmtm ZZ dengan .0 t
Sehingga
n
nZU
n
t
mmn
2
)(''1
2
1
n
nZ
n
tm
2)(''
1
2
1
dengan .0n
t
Saat n maka ,0n sehingga
2)0(''
2)(''
22
11
tm
tm ZnZ
maka .2
))]([)((2
)(22
)0(''2
2
11
22
1
22
1
tZEZV
tZE
ttm Z
Jika bbnn
lim maka .1lim bn
n
ne
n
b
Maka
2
2
2
1 2)(''
1limlim
t
n
nZ
nU
ne
n
tm
mn
2
2t
e merupakan fungsi pembangkit momen bagi distribusi Normal Standar.
Menurut Teorema 2.15 dapat disimpulkan bahwa nU memiliki fungsi
probabilitas yang konvergen ke fungsi probabilitas Normal Standar. ■
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
36
E. Pendugaan Parameter
Tujuan statistika adalah membuat kesimpulan tentang populasi dengan
menggunakan informasi yang terdapat dalam sampel yang diambil dari populasi
tersebut. Setiap populasi memiliki karakteristik yang dinyatakan dengan sebuah
bilangan yang disebut parameter. Tujuan dari penelitian statistis adalah untuk
menduga satu atau lebih parameter yang relevan. Informasi yang terdapat dalam
sampel dapat digunakan untuk menghitung nilai dari dugaan titik, dugaan selang,
atau keduanya.
Definisi 2.21
Sebuah penduga adalah aturan yang biasanya dinyatakan dalam rumus untuk
menghitung nilai dari suatu dugaan berdasarkan pengukuran-pengukuran yang
terkandung dalam sampel.
1. Penduga Titik
Penduga titik adalah penduga yang menghasilkan suatu nilai sebagai hasil
pendugaannya.
Contoh 2.21
Rata-rata sampel yang diperoleh dari nXXX ,,, 21 dinyatakan dalam rumus
n
i
iXn
X1
1
adalah salah satu penduga titik dari rata-rata populasi .
Suatu penduga titik dapat dikatakan sebagai penduga yang baik atau
penduga yang buruk. Penduga yang baik nantinya akan dipilih unruk menduga
suatu nilai dari parameter. Penduga yang baik akan dilihat dari bias dan rata-rata
kuadrat galatnya. Syarat dari penduga untuk suatu parameter dikatakan penduga
yang baik yaitu apabila penduga tersebut merupakan penduga tak bias.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
37
Definisi 2.22
Misalkan ̂ adalah suatu penduga titik untuk sebuah parameter . Jika
)ˆ(E maka ̂ disebut penduga tak bias. Jika )ˆ(E maka ̂ disebut
penduga bias.
Definisi 2.23
Bias dari suatu penduga titik ̂ diberikan oleh .)ˆ()ˆ( EB
Definisi 2.24
Rata-rata kuadrat galat dari suatu penduga titik ̂ adalah .)]ˆ[()ˆ(2 EMSE
Contoh 2.22
Misalkan ̂ adalah suatu penduga untuk parameter dan baE )ˆ(
untuk suatu konstanta a dan b yang taknol. Tentukan )ˆ(B dan *̂ penduga tak
bias bagi .
Jawab:
Dari definisi 2.23 kita dapatkan bias dari suatu penduga titik ̂ adalah
.)1()ˆ()ˆ( babaEB
Dari definisi 2.22 kita tahu bahwa jika )ˆ(E maka ̂ disebut penduga tak
bias, sedemikian hingga
baE )ˆ(
a
bE )ˆ(
)(
)()ˆ(
aE
bEE
.ˆ
a
bE
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
38
Jadi, baB )1()ˆ( dan
a
b
ˆˆ* adalah penduga tak bias bagi .
2. Penduga Selang (Selang Kepercayaan)
Penduga selang lebih dikenal dengan selang kepercayaan yaitu suatu
selang nilai yang dipercaya memuat nilai parameter yang sebenarnya. Setiap
selang kepercayaan memiliki batas atas dan batas bawah. Batas atas dan batas
bawah dari selang kepercayaan disebut dengan limit atas kepercayaan dan limit
bawah kepercayaan. Probabilitas bahwa suatu selang kepercayaan akan dekat
dengan disebut koefisien kepercayaan. Jika L̂ dan Û adalah limit bawah
kepercayaan dan limit atas kepercayaan bagi parameter , maka
,1)ˆˆ( ULP
probabilitas )1( adalah koefisien kepercayaan. Hasil selang penduganya
]ˆ,ˆ[ UL disebut selang kepercayaan dua sisi. Selang kepercayaan juga dapat
berupa selang kepercayaan satu sisi, seperti
,1)ˆ( LP
dengan selang kepercayaan ],ˆ[ L atau
,1)ˆ( UP
dengan selang kepercayaan ].ˆ,[ U
3. Metode Pivot
Metode Pivot merupakan metode yang sangat berguna untuk menentukan
suatu selang kepercayaan. Metode Pivot bergantung pada suatu nilai yang disebut
kuantitas pivot. Kuantitas pivot memiliki dua ciri, yaitu:
a. Merupakan fungsi dari pengamatan sampel dan parameter yang tidak
diketahui.
b. Distribusi probabilitas dari kuantitas pivot tidak bergantung pada parameter .
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
39
Contoh 2.23
Misalkan variabel acak X berdistribusi Normal dengan rata-rata dan variansi
.2 Apakah n
xZ
adalah kuantitas pivot bagi ? Tentukan selang
kepercayaan bagi .
Jawab:
Syarat kuantitas pivot:
a. Z merupakan fungsi dari ix dan .
b. Mencari distribusi probabilitas dari Z:
)()( tZZ eEtm
),( )()(
xcx
n
tt
n
x
eEeEeE dengan n
tc
nxn
cx
n
c
c
xc
cc
xc
eEeEe
eEee
eE
11)(
1
),()(1 '' 1 nxtxtc
eEeEe
dengan n
ct '
n
cc
c
n
n
c
n
c
c
nt
t
ce
ee
ee
e
222
)'('
22
2
2222
111
n
c
e 222
.2222
22
t
n
nt
ee
Fungsi pembangkit momen dari n
xZ
adalah 2
2
)(
t
Z etm yang
merupakan fungsi pembangkit momen dari distribusi Normal standar.
Berdasarkan teorema ketunggalan, n
xZ
berdistribusi Normal standar
dengan rata-rata 0 dan variansi 1.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
40
Fungsi probabilitas dari Z adalah 2
2
1
2
1)(
z
Z eZf
yang tidak bergantung
pada parameter .
Karena dua syarat kuantitas pivot terpenuhi maka n
xZ
adalah kuantitas
pivot bagi .
Akan dibentuk selang kepercayaan bagi .
Karena )1,0(~ NZ maka
Gambar 2.1 Kurva distribusi Normal
1)ˆˆ( ULP
)(1 22 zZzP
221
z
n
xzP
nzx
nzxP
221
Sehingga diperoleh
nzxL
2ˆ dan .ˆ 2
nzxU
4. Selang Kepercayaan untuk Sampel Besar
Saat ukuran sampel semakin besar maka semua penduga titik akan
mendekati distribusi Normal. Jika parameter target adalah ,,, 21 p
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
41
21 pp maka berdasarkan teorema limit pusat, untuk sampel yang besar,
ˆ
ˆ Z
berdistribusi mendekati Normal standar. Oleh karena itu, Z merupakan bentuk
kuantitas pivot dan metode pivot dapat digunakan untuk menghasilkan selang
kepercayaan bagi parameter target .
Contoh 2.24
Misalkan ̂ berdistribusi Normal dengan rata-rata dan standar error .̂
Tentukan selang kepercayaan bagi yang memiliki koefisien kepercayaan sama
dengan ).1(
Jawab:
Kuantitas pivot
ˆ
ˆ Z berdistribusi Normal dengan kurva distribusi Normal
sama seperti pada gambar 2.1.
Dipilih dua nilai, yaitu 2
Z dan 2
Z sehingga
1
22
ZZZP )1.2(
Substitusi Z ke persamaan (2.1), maka diperoleh
1
ˆ
2ˆ2
ZZP
1ˆ ˆ
2
ˆ
2
ZZP
1ˆ ˆ
2
ˆ
2
ZZP
1ˆ ˆ
2
ˆ
2
ZZP
Sehingga diperoleh
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
42
ˆ
2
ˆˆ ZL dan .ˆˆ
ˆ
2
ZU
Contoh 2.25
Waktu berbelanja 64n pelanggan yang dipilih secara acak di sebuah
supermarket lokal telah dicatat. Rata-rata dan variansi dari 64 kali berbelanja
adalah 33 menit dan 256 menit2. Tentukan selang kepercayaan 90% bagi ,
rata-rata waktu berbelanja per pelanggan yang sebenarnya.
Jawab:
Diketahui , sedemikian hingga 33ˆ y dan 2562 untuk sampel
.64n
Selang kepercayaan
ˆ
2
ˆ z
menjadi
nzy
2
Dari tabel distribusi Normal (Lampiran 1) diperoleh ,645.105.02
zz
diperoleh limit bawah kepercayaan dan limit atas kepercayaan
,71.2964
16645.133
2
nzy
.29.3664
16645.133
2
nzy
Jadi, selang kepercayaan 90% bagi adalah (29.71, 36.29).
F. Fungsi Kemungkinan (Likelihood)
Definsi 2.25 Fungsi Kemungkinan dari Sampel
Misalkan nxxx ,,, 21 adalah pengamatan sampel yang berkorespondensi
dengan variabel acak nXXX ,,, 21 yang distribusinya bergantung pada
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
43
parameter . Jika nXXX ,,, 21 adalah variabel acak diskrit maka fungsi
kemungkinan dari sampel adalah
)|,,,()|,,,( 2121 nn xxxpxxxL
atau
).|()|()|()|,,,( 2121 nn xpxpxpxxxL
Definisi 2.26 Metode Kemungkinan Maksimum
Misalkan fungsi kemungkinan bergantung pada k buah parameter .,,, 21 k
Metode kemungkinan maksimum bertujuan memilih penduga nilai-nilai dari
parameter sedemikian hingga memaksimalkan fungsi kemungkinan
).,,,|,,,( 2121 knxxxL
Contoh 2.26
Sebuah eksperimen Binomial terdiri dari n ulangan menghasilkan nxxx ,,, 21
dengan 1ix berarti ulangan ke-i sukses dan 0ix berarti ulangan ke-i gagal.
Tentukan penduga kemungkinan maksimum bagi p.
Jawab:
Fungsi kemungkinan dari sampel adalah probabilitas dari ,,,, 21 nxxx
sehingga
xnx
n pppxxxLpL )1()|,,,()( 21 dengan
n
i
ixx1
.
Jika 0x maka nppL )( dan )( pL akan maksimum ketika .1p
Sekarang dicari penduga kemungkinan maksimum untuk p jika 1,,2,1 nx
dengan .0)(
)(
pd
pdL Untuk mempermudah perhitungan, dilakukan transformasi
ln pada kedua sisi persamaan, sehingga diperoleh:
])1(ln[)](ln[ xnx pppL
)1ln()(ln pxnpx
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
44
p
xn
p
x
dp
pdL
1
)(
01
p
xn
p
x
0)1(
pp
npx
Penyelesaian dari persamaan di atas adalah ,0 npx sehingga .n
xp
Jadi, penduga bagi p adalah .ˆn
xp
Contoh 2.27
Misalkan nYYY ,,, 21 adalah sampel acak dari sebuah distribusi Normal dengan
rata-rata dan variansi .2 Tentukan penduga kemungkinan maksimum
untuk dan .2
Jawab:
Karena nYYY ,,, 21 adalah variabel acak kontinu, ),(2L adalah
probabilitas bersama dari sampel, sedemikian hingga,
).,|,,,(),( 2212 nyyyfL Dalam kasus ini,
),|,,,(),( 2212 nyyyfL
),|(),|(),|( 2222
1 nyfyfyf
2
2
2
2
1
2
)(exp
2
1
2
)(exp
2
1
nyy
.)(2
1exp
2
1
1
2
2
2
2
n
i
i
n
y
Selanjutnya,
.)(2
12ln
2ln
2),(ln
1
2
2
22
n
i
iynn
L
Penduga kemungkinan maksimum untuk dan 2 adalah nilai yang membuat
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
45
),(ln 2L maksimum. Ambil turunan ),(ln 2L terhadap dan ,2 diperoleh
n
i
iyL
12
2
)(1,(ln
(2.2)
dan
n
i
iynL
1
2
422
2
)(2
11
2
,(ln
(2.3)
Buatlah derivatif di atas sama dengan nol, dan dari (2.2) diperoleh
n
i
iy1
2,0)ˆ(
ˆ
1
atau
n
i
iy1
,0)ˆ( dan
n
i
i yyn 1
.1
̂
Substitusi y untuk ̂ pada (2.3) dan selesaikan untuk ,ˆ2 diperoleh
n
i
i yyn
1
2
42,0)(
ˆ
1
ˆ atau .)(
1ˆ
1
22
n
i
i yyn
Dengan demikian, Y dan
n
i
i yyn 1
22 )(1
̂ masing-masing adalah penduga
kemungkinan maksimum untuk dan .2
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
46
BAB III
MODEL REGRESI COX
A. Analisis Regresi
Analisis regresi merupakan teknik statistik untuk menyelidiki dan
membuat model hubungan di antara variabel-variabel. Tujuan dari analisis regresi
yaitu untuk mendapatkan model terbaik yang menggambarkan hubungan antara
variabel respon (variabel tak bebas/variabel dependen) dengan satu atau lebih
variabel penjelas (variabel bebas/variabel independen) (Hosmer dan Lemeshow,
2000). Variabel penjelas adalah variabel yang nilainya dapat ditentukan atau yang
nilainya dapat diamati tetapi tidak dapat dikendalikan. Variabel respon adalah
variabel yang nilainya dipengaruhi oleh perubahan variabel-variabel penjelas. Di
dalam kehidupan nyata begitu banyak teknik statistika yang dapat digunakan
untuk menganalisis suatu masalah. Salah satu teknik statistika yang dapat
digunakan untuk menganalisis data yang berhubungan dengan waktu tahan hidup
adalah analisis ketahanan hidup.
B. Analisis Ketahanan Hidup
Analisis ketahanan hidup (survival analysis) adalah suatu metode untuk
menganalisis data yang berhubungan dengan waktu, mulai dari waktu awal atau
time origin sampai dengan terjadinya suatu kejadian khusus atau end point. Di
dalam riset medis, waktu awal sering digunakan sebagai awal perekrutan individu
dalam suatu studi percobaan, seperti uji klinis untuk membandingkan dua atau
lebih perlakuan. Sedangkan, kejadian khusus merupakan kematian suatu individu
atau pasien, sehingga data yang dihasilkan dinamakan waktu hidup atau survival
time (David Collett, 2003).
Untuk mendapatkan data ketahanan hidup biasanya dilakukan percobaan.
Dalam melakukan percobaan ada beberapa metode yang dilakukan sehingga data
yang dihasilkan juga berbeda dari satu metode ke metode yang lain. Hal yang
membedakan analisis ketahanan hidup dengan analisis-analisis yang lain pada
statistika adalah penyensoran.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
47
C. Data Tersensor
Banyak peneliti menganggap analisis data ketahanan hidup hanya sekedar
penerapan dua metode statistik konvensional untuk jenis masalah khusus:
parametrik jika distribusi waktu ketahanan hidup diketahui normal dan
nonparametrik jika distribusi waktu ketahanan hidup tidak diketahui. Asumsi ini
benar jika waktu ketahanan hidup semua subjek tepat dan diketahui, namun
kenyataannya beberapa waktu ketahanan hidup tidak demikian. Sebagai contoh,
beberapa pasien mungkin masih hidup atau sembuh dari suatu penyakit pada akhir
masa penelitian. Waktu ketahanan hidup yang tepat untuk pasien tersebut tidak
diketahui. Hal ini disebut penelitian yang disensor atau waktu yang disensor dan
juga bisa terjadi ketika individu hilang dari pemeriksaan. Berikut adalah tiga jenis
penyensoran, yaitu:
1. Penyensoran Tipe I
Penelitian pada hewan biasanya dimulai dengan jumlah hewan yang tetap
dengan diberikannya suatu perawatan (treatment). Peneliti sering tidak dapat
menunggu kematian semua hewan karena waktu dan/ atau biaya yang terbatas.
Salah satu pilihan untuk mengatasi hal tersebut adalah melakukan penelitian
untuk jangka waktu tertentu, katakanlah selama enam bulan, setelah itu hewan
yang masih hidup dikorbankan. Waktu ketahanan hidup yang tercatat untuk
hewan yang mati selama jangka waktu penelitian adalah waktu dari awal
penelitian hingga kematian mereka. Hal ini disebut penelitian yang tepat
(exact) atau tidak disensor. Waktu ketahanan hidup hewan yang dikorbankan
tidak diketahui secara pasti tetapi tercatat selama jangka waktu penelitian dan
waktu ketahanan hidup hewan dari awal penelitian sampai pada kematian atau
hilang dari penelitian disebut penelitian yang disensor.
Sebagai contoh, misalkan ada enam tikus telah terkena karsinogen dengan
menyuntikkan sel-sel tumor ke bantalan kaki mereka. Waktu untuk tumor
berkembang dengan ukuran pada ke enam tikus tertentu diamati. Peneliti
memutuskan untuk mengakhiri penelitian setelah 30 minggu.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
48
Gambar 3.1 Plot perkembangan tumor pada enam tikus
Pada gambar 3.1 diketahui bahwa perkembangan tumor pada tikus A, B, dan D
terjadi setelah 10, 15, dan 25 minggu secara berturut-turut. Perkembangan
tumor tidak terjadi pada tikus C dan E sampai pada akhir penelitian; waktu
bebas tumor mereka adalah 30 minggu lebih. Tikus F meninggal secara tidak
sengaja tanpa ada perkembangan tumor setelah 19 minggu pengamatan. Data
ketahanan hidup (waktu bebas tumor) adalah 10, 15, 30+, 25, 30+, dan 19+
minggu. (Tanda + menunjukkan pengamatan yang disensor).
2. Penyensoran Tipe II
Pilihan lain dalam penelitian pada hewan adalah menunggu hingga sebagian
besar hewan mati, katakanlah 80 hewan mati dari 100 hewan, setelah itu hewan
yang masih hidup dikorbankan. Dalam hal ini, penyensoran tipe II, jika tidak
ada kerugian yang tidak disengaja, pengamatan yang disensor sama dengan
pengamatan tanpa sensor terbesar. Misalnya dalam percobaan pada enam tikus
(Gambar 3.2), peneliti dapat memutuskan untuk mengakhiri penelitian setelah
perkembangan tumor terjadi pada empat dari enam tikus. Waktu ketahanan
hidup (waktu bebas tumor) adalah 10, 15, 35+, 25, 35, dan 19+ minggu.
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
49
Gambar 3.2 Plot perkembangan tumor pada enam tikus
3. Penyensoran Tipe III
Di sebagian besar studi klinis dan epidemiologi jangka waktu penelitian adalah
tetap dan pasien memasuki penelitian pada waktu yang berbeda selama jangka
waktu penelitian tersebut. Beberapa pasien dapat meninggal sebelum akhir
penelitian; waktu ketahanan hidup mereka diketahui dengan tepat. Pasien yang
lain mungkin hilang dari pemeriksaan (loss to follow-up) sebelum akhir
penelitian, dan mungkin ada yang masih hidup pada akhir penelitian. Untuk
pasien yang hilang, waktu ketahanan hidupnya adalah setidaknya dari awal
masuk penelitian sampai pasien menghilang dari penelitian. Untuk pasien yang
masih hidup, waktu ketahanan hidup adalah setidaknya dari awal masuk
penelitian sampai pada akhir masa penelitian. Hal tersebut termasuk
pengamatan yang disensor. Karena waktu masuk penelitan masing-masing
pasien tidak bersamaan, waktu yang disensor juga berbeda. Oleh karena itu,
penyensoran tipe III sering disebut penyensoran acak.
Sebagai contoh, misalkan ada enam pasien penyakit leukimia masuk ke dalam
penelitian klinis selama jangka waktu penelitian adalah satu tahun. Misalkan
juga bahwa semua pasien mendapatkan perawatan. Waktu perawatan pasien
penyakit leukimia terdapat pada Gambar 3.3 di bawah ini. Pasien A, C, dan E
mendapat perawatan dan masuk penelitian pada bulan ke 2, 4, dan 9, lalu
penyakitnya kambuh setelah 4,6, dan 3 bulan masing-masing. Pasien B
mendapat perawatan dan masuk penelitan pada bulan ke 3, tetapi hilang dari
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
50
pemeriksaan 4 bulan kemudian; waktu perawatan adalah setidaknya 4 bulan.
Pasien D dan F mendapat perawatan pada bulan ke 5 dan 10, masing-masing,
dan tetap mendapat perawatan sampai pada akhir penelian; waktu perawatan
mereka adalah setidaknya 8 dan 3 bulan masing-masing. Waktu perawatan dari
enam pasien leukimia adalah 4, 4+, 6, 8+, 3, dan 3+ bulan.
Gambar 3. Plot waktu perawatan pasien penyakit leukimia
Dalam analisis ketahanan hidup ada dua macam fungsi yang dapat
memberikan informasi tentang data ketahanan hidup, yaitu fungsi ketahanan
hidup dan fungsi hazard.
D. Fungsi Ketahanan Hidup
Definisi 3.1
Fungsi ketahanan hidup atau survival function yang dilambangkan dengan )(tS
adalah probabilitas variabel acak T, yang merupakan waktu ketahanan hidup,
melebihi suatu waktu t. Secara matematis, fungsi ketahanan hidup dapat ditulis
)()( tTPtS .0t (3.1)
Secara teori, t berada di antara 0 sampai ∞. Fungsi ketahanan hidup bisa
diilustrasikan seperti pada gambar di bawah ini, dengan t sebagai sumbu
horizontal
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
51
Gambar 3.4 Kurva fungsi survival
Semua fungsi ketahanan hidup memenuhi tiga karakteristik, yaitu:
fungsi ketahanan hidup adalah fungsi tak naik, ini berarti bahwa fungsinya
konstan atau turun untuk t yang semakin besar;
saat waktu ,1)0()(,0 StSt ini berarti bahwa awal pengamatan karena
belum ada individu yang mengalami kejadian, maka probabilitas ketahanan
hidupnya adalah 1.
saat waktu ,0)(lim,
tStt
ini berarti bahwa jika waktu pengamatan
bertambah menuju tak terbatas alhasil tidak ada individu yang dapat bertahan
hidup, jadi kurva ketahanan hidup akhirnya harus menuju nol.
Pada kenyataannya, ketika digunakan data yang aktual akan diperoleh fungsi
ketahanan hidup berupa fungsi tangga )(ˆ tS seperti grafik di bawah ini.
Gambar 3.5 Kurva fungsi survival ketika digunakan data yang aktual
(fungsi tangga)
Oleh karena waktu pengamatan tidak pernah sampai takhingga dan mungkin tidak
semua individu yang diamati akan mengalami kejadian yang sama sehingga tidak
semua fungsi ketahanan hidup akan sama dengan nol pada akhir pengamatan.
akhir studi
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
52
E. Fungsi Hazard
Definisi 3.2
Fungsi hazard atau hazard rate yang dilambangkan dengan )(th didefinisikan
sebagai limit dari probabilitas bersyarat bahwa waktu ketahanan hidup individu, T,
terletak pada interval waktu ),( ttt jika diketahui waktu ketahanan hidup T
lebih dari atau sama dengan t. Secara matematis fungsi hazard dapat ditulis
t
tTttTtPth
t
)|(lim)(
0 (3.2)
Dalam istilah matematika, pembilang setelah tanda limit dalam rumus
fungsi hazard ditemukan dalam pernyataan probabilitas. Pernyataan probabilitas
yang dimaksud adalah probabilitas bersyarat karena pembilang dalam rumus
fungsi hazard berbentuk, “P dari kejadian A, jika diketahui kejadian B” atau
)|( BAP , dengan P adalah probabilitas dan garis vertikal di antara A dan B
menunjukkan “diketahui”. Lebih lanjut pengertian )|( tTttTtP
adalah probabilitas bahwa individu gagal dalam interval ],[ ttt jika waktu
ketahanan hidupnya sampai t.
Fungsi hazard suatu waktu disebut tingkat kegagalan bersyarat (conditional
failure rate). Dalam rumus fungsi hazard, ekspresi setelah tanda limit memberi
perbandingan dari dua kuantitas, pembilang merupakan probabilitas bersyarat dan
penyebut adalah t , menyatakan interval waktu t yang kecil. Oleh pembagian
dua kuantitas tersebut, kita memperoleh probabilitas tiap satuan waktu, yang
bukan sekedar probabilitas tetapi tingkat (rate). Khususnya, skala untuk
perbandingan ini bukan 0 sampai 1 seperti pada probabilitas, melainkan berkisar
antara 0 dan takhingga, dan tergantung pada waktu dalam hari, minggu, bulan,
atau tahun, dan lain-lain. Sebagai contoh, jika probabilitas P adalah 31 dan t
adalah setengah hari, maka probabilitas dibagi dengan interval waktu adalah 31
dibagi 21 sama dengan 67,0 tiap hari. Contoh lainnya, misalkan
probabilitasnya sama, yaitu 31 , dan interval waktunya dalam minggu,
sedemikian hingga 21 hari sama dengan 141 minggu, maka probabilitas
PLAGIAT MERUPAKAN TINDAKAN TIDAK TERPUJI
-
53
dibagi dengan interval waktu adalah 31 dibagi 141 sama dengan 67.4 tiap
minggu.
P t ratetP
3
1
2
1
hari
21
31
=0.67 tiap hari
3
1
14
1minggu
141
31
=4.67 tiap minggu
Jadi, ekspresi P dibagi dengan t setelah tanda limit tidak memberikan suatu
probabilitas. Nilai yang diperoleh akan memberikan bilangan yang berbeda
tergantung pada satuan waktu yang digunakan, dan mungkin akan memberikan
bilangan lebih dari satu.
Ketika diambil limit dari ekspresi sebelah kanan tanda limit untuk interval
waktu t menuju nol, didapatkan ekspresi untuk probabilitas instan dari kegagalan
pada waktu t tiap satuan waktu. Cara lain untuk mengatakan bahwa tingkat
kegagalan bersyarat atau fungsi hazard )(th memberikan potensi instan untuk
kegagalan pada waktu t tiap satuan waktu jika diberikan waktu ketahanan
hidupnya sampai t.
Fungsi hazard )(th memenuhi dua karakteristik, yaitu:
Fungsinya taknegatif.
Fungsinya tidak memiliki batas atas.
Kedua karakteristik di atas adalah akibat dari rumus )(th karena probabilitas