![Page 1: Intitulé de la thèse : Débruitage de la parole et ses applications](https://reader035.vdocument.in/reader035/viewer/2022062305/56814bf4550346895db8e5d9/html5/thumbnails/1.jpg)
Intitulé de la thèse:
Débruitage de la parole
et ses applications
Débruitage perceptuel de la parole
Asmaa AmehrayeSous l’encadrement de: Dominique Pastor
Journées doctorales du département SC
![Page 2: Intitulé de la thèse : Débruitage de la parole et ses applications](https://reader035.vdocument.in/reader035/viewer/2022062305/56814bf4550346895db8e5d9/html5/thumbnails/2.jpg)
2
Plan de la présentation
Introduction
Points durs
La perception auditive
Le débruitage perceptuel de la parole
Résultats
Conclusion et perspectives
1
2
3
4
5
2/18
6
![Page 3: Intitulé de la thèse : Débruitage de la parole et ses applications](https://reader035.vdocument.in/reader035/viewer/2022062305/56814bf4550346895db8e5d9/html5/thumbnails/3.jpg)
3
Objectifs du débruitage de la parole
• Restituer le signal de parole dans les environnement bruités• Améliorer l’intelligibilité de la parole• Le confort d’écoute de l’auditeur
Applications: Reconnaissance de la paroleTéléphonie mobileTéléphonie main libre…
Processus du débruitage
3/18
![Page 4: Intitulé de la thèse : Débruitage de la parole et ses applications](https://reader035.vdocument.in/reader035/viewer/2022062305/56814bf4550346895db8e5d9/html5/thumbnails/4.jpg)
4
Les méthodes usuelles
Processus du débruitage
Filtrage de Kalman
OndelettesFiltrage de
Wiener
Soustraction spectraleMéthodes à
sous-espaces
.........etc
4/18
![Page 5: Intitulé de la thèse : Débruitage de la parole et ses applications](https://reader035.vdocument.in/reader035/viewer/2022062305/56814bf4550346895db8e5d9/html5/thumbnails/5.jpg)
1- Bruit additif
2- Décorrélation entre bruit b(n) et parole propre s(n).
+s(n)
b(n)
y(n)
Système mono capteur
Hypothèses:
5/18
![Page 6: Intitulé de la thèse : Débruitage de la parole et ses applications](https://reader035.vdocument.in/reader035/viewer/2022062305/56814bf4550346895db8e5d9/html5/thumbnails/6.jpg)
6
Points durs
• Estimation du bruit.
• Détection de l’activité vocale (DAV).
• Artéfacts: Bruit musical et Distorsions du signal après débruitage.
6/18
![Page 7: Intitulé de la thèse : Débruitage de la parole et ses applications](https://reader035.vdocument.in/reader035/viewer/2022062305/56814bf4550346895db8e5d9/html5/thumbnails/7.jpg)
7
Bruit musical?
Bruit musical
Gênant à la perception humaine
Solution:
Tenir compte des propriétés du système auditif humain.
7/18
![Page 8: Intitulé de la thèse : Débruitage de la parole et ses applications](https://reader035.vdocument.in/reader035/viewer/2022062305/56814bf4550346895db8e5d9/html5/thumbnails/8.jpg)
8
Système auditif
Coupe générale de l’oreille
8/18
![Page 9: Intitulé de la thèse : Débruitage de la parole et ses applications](https://reader035.vdocument.in/reader035/viewer/2022062305/56814bf4550346895db8e5d9/html5/thumbnails/9.jpg)
9
L’effet de masquage?
On parle de masquage quand un son est rendu inaudible par un autre.
Le masqueur élève localement le seuil d’audition, le son cible nécessite alors plus d’énergie pour être perçu.
9/18
![Page 10: Intitulé de la thèse : Débruitage de la parole et ses applications](https://reader035.vdocument.in/reader035/viewer/2022062305/56814bf4550346895db8e5d9/html5/thumbnails/10.jpg)
10
Le débruitage perceptuel de la parole
Contexte: Prise en compte des propriétés de l’audition humaine via la modélisation de certaines de ces propriétés déterminantes.
Astuces : Distinction entre ce qui est audible et ce qu’il ne l’est pas.
Outil : Modélisation du phénomène de masquage par le calcul de la courbe de masquage.
Objectif: Diminuer les artéfacts (distorsions, bruit musical,…)
10/18
![Page 11: Intitulé de la thèse : Débruitage de la parole et ses applications](https://reader035.vdocument.in/reader035/viewer/2022062305/56814bf4550346895db8e5d9/html5/thumbnails/11.jpg)
11
Portions inaudibles
11/18
Courbe de masquage
Puissance du signal
![Page 12: Intitulé de la thèse : Débruitage de la parole et ses applications](https://reader035.vdocument.in/reader035/viewer/2022062305/56814bf4550346895db8e5d9/html5/thumbnails/12.jpg)
Deux cas limite de l’estimée de la courbe de masquage:
Le bruit résiduel augmente
Les distorsions du signal augmentent
Besoin d’un compromis
15
Courbe de
masquage idéale
DSP du signal bruité
dB dB
f(Hz) f(Hz)
12/18
![Page 13: Intitulé de la thèse : Débruitage de la parole et ses applications](https://reader035.vdocument.in/reader035/viewer/2022062305/56814bf4550346895db8e5d9/html5/thumbnails/13.jpg)
13
Exemples dans la littérature
Loizou[2] Lin[4]
Tim Haulik[5] (même ordre d’idée que[3])Détection et réduction des tonales musicales: : à partir du signal débruité : à partir du signal bruitéLes composantes spectrales au dessus juste de sont candidates pour être du bruit musical.
)0,max( 22
2
2ibs
s
TH
ii
i
)()()( nbnsny YHS iˆ
2T
1T
2T
)1,min(1b
TH
13/18
![Page 14: Intitulé de la thèse : Débruitage de la parole et ses applications](https://reader035.vdocument.in/reader035/viewer/2022062305/56814bf4550346895db8e5d9/html5/thumbnails/14.jpg)
14
Contribution14/19
![Page 15: Intitulé de la thèse : Débruitage de la parole et ses applications](https://reader035.vdocument.in/reader035/viewer/2022062305/56814bf4550346895db8e5d9/html5/thumbnails/15.jpg)
15
Evaluation objective
MBSD(Modified Bark Spectral Distorsion)
SSNR(Segmental Signal to Noise Ratio)
15/19
![Page 16: Intitulé de la thèse : Débruitage de la parole et ses applications](https://reader035.vdocument.in/reader035/viewer/2022062305/56814bf4550346895db8e5d9/html5/thumbnails/16.jpg)
16
Evaluation subjective
Wiener Loizou Lin Méthode proposée
-5dB
0dB
5dB
10dB
Input-5dB
Input0dB
Input5dB
Input10dB
Tests audio:
She had your dark suit in greasy wash water all year.Don't ask me to carry an oily rag like that
16/18
![Page 17: Intitulé de la thèse : Débruitage de la parole et ses applications](https://reader035.vdocument.in/reader035/viewer/2022062305/56814bf4550346895db8e5d9/html5/thumbnails/17.jpg)
17
Conclusion et perspectives
• L’apport de la psycho-acoustique est net.
• Pour la reconnaissance de la parole, on veut montrer que ce n’est pas juste une
question de SNR.
• L'application de ces approches pour l'amélioration de l'intelligibilité audio et la reconnaissance automatique de la parole pour des applications de téléphonie mobile et de téléphonie main libre.
17/18
![Page 18: Intitulé de la thèse : Débruitage de la parole et ses applications](https://reader035.vdocument.in/reader035/viewer/2022062305/56814bf4550346895db8e5d9/html5/thumbnails/18.jpg)
18
Bibliographie
[1] E Zwicker, R. Feldtkeller, Psychoacoustique:L’oreille, récepteur d’information”, Masson, Paris, 1981.
[2] Y. Hu and P. Loizou, “Incorporating a psychoacoustic model in frequency domain speech enhancement”, IEEE Signal Processing Letters, 11(2), 2004, pp. 270-273.
[3] A.Ben Aicha and S. Ben Jebara, “Utilisation de la courbe de masquage pour la détection des tonales musicales artificielles dans un signal de parole débruité par approche spectrales ”, ISIVC2006, Tunisie.
[4] L. Lin,W. H. Holmes and E. Ambikairajah,“Speech denoising using perceptual modification of Wiener filtering”, IEEE Electronic Letters, vol. 38, no. 23, November 2002, pp. 1486-1487.
[5] T.Haulik, K.Linhard and P.Schrogmeier, “Residual noise suppression using psychoacoustic criteria”, Eurospeech 1997, pp 1395.
Merci pour votre attention
18/18