subjective and objective measure on ... - digilib.its.ac.id
TRANSCRIPT
Oleh:Oleh:Oleh:Oleh:
ANINTYO ADI NUGROHONRP. 2406 100 039
Oleh:Oleh:Oleh:Oleh:
ANINTYO ADI NUGROHONRP. 2406 100 039
SUBJECTIVE AND OBJECTIVE MEASURE ON SPEECH
INTELLIGIBILITY BY RELEASE OF MASKING PHENOMENON
SUBJECTIVE AND OBJECTIVE MEASURE ON SPEECH
INTELLIGIBILITY BY RELEASE OF MASKING PHENOMENON
NRP. 2406 100 039
Pembimbing:Pembimbing:Pembimbing:Pembimbing:
Dr. Dhany Arifianto S.T, M.EngNIP : 197310071998021001
NRP. 2406 100 039
Pembimbing:Pembimbing:Pembimbing:Pembimbing:
Dr. Dhany Arifianto S.T, M.EngNIP : 197310071998021001
JURUSAN TEKNIK FISIKAFAKULTAS TEKNOLOGI INDUSTRIINSTITUT TEKNOLOGI SEPULUH
NOPEMBERSURABAYA
2010
JURUSAN TEKNIK FISIKAFAKULTAS TEKNOLOGI INDUSTRIINSTITUT TEKNOLOGI SEPULUH
NOPEMBERSURABAYA
2010
+Read verse out loud for pleasure
The juice of lemons makes fine punch+
Read verse out loud for pleasureThe juice of lemons makes fine punch
Read verse out loud for pleasure
12 CHANNEL
???Read verse out loud for pleasure
+12 CHANNEL20 CHANNEL ???
Read verse out loud for pleasure
The juice of lemons makes fine punch+
Read verse out loud for pleasure
Read verse out loud for pleasure
The juice of lemons makes fine punch
+20 CHANNEL2 CHANNEL
+Read verse out loud for pleasure
The juice of lemons makes fine punch+
Read verse out loud for pleasure
TUJUANTUJUAN• Mengetahui peningkatan speech intelligibility akibat
pengaruh fenomena release of masking pada peristiwacocktail party terhadap native speakers pendengar normal
• Mengetahui pengaruh signal enhancement dalammeningkatkan kualitas suara target yang rusak akibatmaskermasker
BATASAN MASALAHBATASAN MASALAH• Menggunakan 17 orang respondennative speakers yang
memiliki pendengaran normal.• Masker yang dipilih sebagai bunyi percakapan latar adalah
suara laki – laki tunggal.• Jumlah Channel yang diaktifkan adalah 20 channel.
• Fenomena Release of Masking dapatmeingkatkan speech intelleigibility, namun
hipotesahipotesa
• Seberapa besar kah pengaruh release of masking terhadap peningkatan speech intelligibility?
• Bagaimana pengaruh terhadappeningkatan speech intelligibility setelahmelalui proses signal enhancement?
PermasalahanPermasalahan
Tes pendengaranTes pendengaranMenuliskan kembali kalimat
hasil tes pendengaranMenuliskan kembali kalimat
hasil tes pendengaran
%correct words%correct words
• Merupakan cara untuk meningkatkan kualitas sinyal suarayang rusak akibat adanya bising latar.
• Yang dikenal sampai saat ini:
1. Spectral Substraction
Minimum Mean Square Error-Short Time Spectral 2. Minimum Mean Square Error-Short Time Spectral Amplitude (MMSE-STSA)
3. Multi-Band Spectral Subtraction
Magnitude
Frekuensi
Magnitude
Frekuensi
Band ke-n
� Adalah nilai SNR Yang dihitung tiap segmen data.
Penentuan Responden
Penelitian ini melibatkan responden native speakers sebanyak 17 orang yang memiliki pendengaran normal dengan rata-rata usia 24,29 tahun
Pemilihan Stimuli
Stimuli merupakan sinyal suara yang akan diujikan kepada responden berupa suara laki-laki dan diperoleh dari database IEEE dengan frekuensi sampling 25 kHz. Jenis masker yang
digunakan adalah suaral aki-laki tunggal.
PemrosesanStimuli
Sinyal suara diproses menggunakan bandpass filter kedalam 2, 8, 12, dan 20 channelmenggunakan Matlab 7.8. Sinyal suara dikombinasikan menggunakan audacity 1.3 dengan
SNR 0 dB dan frekuensi sampling 25 kHz.
Sinyal suara diproses menggunakan bandpass filter kedalam 2, 8, 12, dan 20 channelmenggunakan Matlab 7.8. Sinyal suara dikombinasikan menggunakan audacity 1.3 dengan
SNR 0 dB dan frekuensi sampling 25 kHz.
Penentuan %correct words
Sebanyak 14 responden diperdengarkan 60 kalimat stimuli dengan kombinasi target danmasker (stimuli) yang memiliki perbandingan channel 2 dan 20, 8 dan 20, 12 dan 20, 12 dan 2,
12 dan 8, 12 dan 12, 20 dan 2, 20 dan 12, 20 dan 20. pemutaran stimuli hanya dilakukan satukali dan tidak dapat diulang. Setelah itu responden diharuskan untuk menuliskan ulangkalimat-kalimat stimuli, setelah itu akan dilakukan penghitungan nilai %correct words
Sebanyak 14 responden diperdengarkan 60 kalimat stimuli dengan kombinasi target danmasker (stimuli) yang memiliki perbandingan channel 2 dan 20, 8 dan 20, 12 dan 20, 12 dan 2,
12 dan 8, 12 dan 12, 20 dan 2, 20 dan 12, 20 dan 20. pemutaran stimuli hanya dilakukan satukali dan tidak dapat diulang. Setelah itu responden diharuskan untuk menuliskan ulangkalimat-kalimat stimuli, setelah itu akan dilakukan penghitungan nilai %correct words
30
40
50
60
70
80
90
100
%co
rre
ct w
ord
s (%
)
Grafik %correct words vs stimuli dari percobaan 1
0
10
20
30
2 dan 20 8 dan 20 12 dan 20 20 dan 2 20 dan 12 20 dan 20
stimuli
40
50
60
70
80
90
100
corr
ect
wo
rds
(%)
0
10
20
30
40
12 dan 2 12 dan 8 12 dan 12 12 dan 20 20 dan 2 20 dan 12 20 dan 20
%co
rre
ct w
ord
s (%
)
stimuli
Grafik %correct words vs stimuli dari percobaan 2
Enhancement Stimuli
Campuran stimuli di enhancing dengan algoritmaSSBoll79, SSBerouti79, SSSCalart96, SSMutlibandKamath02, SSPARAB98, MMSECohen2004,
MMSESTSA84, MMSESTSA85 menggunakan software matlab 7.8®.
Campuran stimuli di enhancing dengan algoritmaSSBoll79, SSBerouti79, SSSCalart96, SSMutlibandKamath02, SSPARAB98, MMSECohen2004,
MMSESTSA84, MMSESTSA85 menggunakan software matlab 7.8®.
Penentuan %correct words setelah prosesenhancement
Sebanyak 3 responden diperdengarkan 630 kalimat stimuli dengan kombinasitarget dan masker (stimuli) yang memiliki perbandingan channel 12 dan 2, 12 dan
8, 12 dan 12, 12 dan 20, 20 dan 2, 20 dan 12, 20 dan 20 pemutaran stimuli hanyadilakukan satu kali dan tidak dapat diulang. Setelah itu responden diharuskanuntuk menuliskan ulang kalimat-kalimat stimuli, setelah itu akan dilakukan
penghitungan nilai %correct words
Sebanyak 3 responden diperdengarkan 630 kalimat stimuli dengan kombinasitarget dan masker (stimuli) yang memiliki perbandingan channel 12 dan 2, 12 dan
8, 12 dan 12, 12 dan 20, 20 dan 2, 20 dan 12, 20 dan 20 pemutaran stimuli hanyadilakukan satu kali dan tidak dapat diulang. Setelah itu responden diharuskanuntuk menuliskan ulang kalimat-kalimat stimuli, setelah itu akan dilakukan
penghitungan nilai %correct words
40
50
60
70
80
90
100
%co
rre
ct w
ord
s (%
)
0
10
20
30
12 dan 2 12 dan 8 12 dan 12 12 dan 20 20 dan 2 20 dan 12 20 dan 20
%
stimuli
Grafik %correct words vs stimuli dari percobaan 3
Hasil penelitian pertama yang di tunjukkan pada grafik pertamamenunjukkan hasil nilai %correct words yang berbeda-beda untuktiap campuran stimuli. Pada campuran 2 dan 20, 8 dan 20, 12 dan 20menunjukkan stimuli masker lebih dominan daripada stimuli target.Respoden lebih cenderung mudah memahami stimuli maskerdaripada stimuli target. Pada campuran 20 dan, 20 dan 12, 20 dan 20menunjukkan stimuli target lebih dominan daripada stimulimasker, sehingga responden cenderung lebih mudah memahamistimuli target daripada stimuli masker
Hasil penelitian kedua yang di tunjukkan pada grafik keduamenunjukkan hasil nilai %correct words yang berbeda-beda untuktiap campuran stimuli. Pada campuran 12 dan 2, 12 dan 8, 12 dan 12menunjukkan stimuli target lebih dominan daripada stimulimasker., namun dengan power yang sedang Respoden lebihcenderung mudah memahami stimuli target daripada stimuli masker.Pada campuran 20 dan, 20 dan 12, 20 dan 20 menunjukkan stimulitarget lebih dominan daripada stimuli masker, dengan power stimulitarget lebih kuat sehingga responden cenderung lebih mudahmemahami stimuli target daripada stimuli masker
Hasil penelitian ketiga yang di tunjukkan padagrafik ketiga menunjukkan hasil nilai %correct wordsyang berbeda-beda untuk tiap campuran stimuli. Padacampuran 12 dan 2, 12 dan 8, 12 dan 12 menunjukkanstimuli target lebih dominan daripada stimulimasker, namun dengan power yang sedang Respodenmasker, namun dengan power yang sedang Respodenlebih cenderung mudah memahami stimuli targetdaripada stimuli masker. Pada campuran 20 dan, 20 dan12, 20 dan 20 menunjukkan stimuli target lebih dominandaripada stimuli masker, dengan power stimuli targetlebih kuat sehingga responden cenderung lebih mudahmemahami stimuli target daripada stimuli masker
2
3
4
5
6
7
8
9
10N
ila
i se
gS
NR
(d
B)
Grafik Hasil uji signal enhancement daripercobaan 1 dan 2
0
1
2
signal enhancement
1
1.5
2
2.5
3N
ila
i se
gS
NR
(d
B)
Grafik Hasil uji signal enhancement daripercobaan 3
0
0.5
signal enhancement
Berdasarkan penelitian yang telah dilakukan maka dapatdiambil beberapa kesimpulan yakni:
� Pengaruh release of masking telah menunjukkanpeningkatan pada speech intelligibility, hal ini terlihat darigrafik pertama dan grafik kedua yang menujukkan, campuranstimuli target yang lebih dominan menujukkan nilai %correctwords yang tinggi daripada campuran stimuli masker yangwords yang tinggi daripada campuran stimuli masker yanglebih dominan
� Dari delapan teknik signal enhancement yangdigunakan, teknik Spectral Substraction by Boll (SSBoll79)masih menunjukkan hasil yang paling baik, hal ini terlihatpada grafik “Nilai SegSNR HASILUJI SIGNAL ENHANCEMENT” bahwa teknik SSBoll79menunjukkan nilai tertinggi yakni 8.75566 dB (pada grafikpertama), dan 2.57499 dB (pada grafik kedua)