intitulé de la thèse : débruitage de la parole et ses applications

Intitulé de la thèse:

Débruitage de la parole

et ses applications

Débruitage perceptuel de la parole

Asmaa AmehrayeSous l’encadrement de: Dominique Pastor

Journées doctorales du département SC

Plan de la présentation

Introduction

Points durs

La perception auditive

Le débruitage perceptuel de la parole

Résultats

Conclusion et perspectives

Objectifs du débruitage de la parole

• Restituer le signal de parole dans les environnement bruités• Améliorer l’intelligibilité de la parole• Le confort d’écoute de l’auditeur

Applications: Reconnaissance de la paroleTéléphonie mobileTéléphonie main libre…

Processus du débruitage

Les méthodes usuelles

Processus du débruitage

Filtrage de Kalman

OndelettesFiltrage de

Wiener

Soustraction spectraleMéthodes à

sous-espaces

.........etc

1- Bruit additif

2- Décorrélation entre bruit b(n) et parole propre s(n).

Système mono capteur

Hypothèses:

Points durs

• Estimation du bruit.

• Détection de l’activité vocale (DAV).

• Artéfacts: Bruit musical et Distorsions du signal après débruitage.

Bruit musical?

Bruit musical

Gênant à la perception humaine

Solution:

Tenir compte des propriétés du système auditif humain.

Système auditif

Coupe générale de l’oreille

L’effet de masquage?

On parle de masquage quand un son est rendu inaudible par un autre.

Le masqueur élève localement le seuil d’audition, le son cible nécessite alors plus d’énergie pour être perçu.

Le débruitage perceptuel de la parole

Contexte: Prise en compte des propriétés de l’audition humaine via la modélisation de certaines de ces propriétés déterminantes.

Astuces : Distinction entre ce qui est audible et ce qu’il ne l’est pas.

Outil : Modélisation du phénomène de masquage par le calcul de la courbe de masquage.

Objectif: Diminuer les artéfacts (distorsions, bruit musical,…)

Portions inaudibles

Courbe de masquage

Puissance du signal

Deux cas limite de l’estimée de la courbe de masquage:

Le bruit résiduel augmente

Les distorsions du signal augmentent

Besoin d’un compromis

Courbe de

masquage idéale

DSP du signal bruité

f(Hz) f(Hz)

Exemples dans la littérature

Loizou[2] Lin[4]

Tim Haulik[5] (même ordre d’idée que[3])Détection et réduction des tonales musicales: : à partir du signal débruité : à partir du signal bruitéLes composantes spectrales au dessus juste de sont candidates pour être du bruit musical.

)0,max( 22

)()()( nbnsny YHS iˆ

)1,min(1b

Contribution14/19

Evaluation objective

MBSD(Modified Bark Spectral Distorsion)

SSNR(Segmental Signal to Noise Ratio)

Evaluation subjective

Wiener Loizou Lin Méthode proposée

Input-5dB

Input0dB

Input5dB

Input10dB

Tests audio:

She had your dark suit in greasy wash water all year.Don't ask me to carry an oily rag like that

Conclusion et perspectives

• L’apport de la psycho-acoustique est net.

• Pour la reconnaissance de la parole, on veut montrer que ce n’est pas juste une

question de SNR.

• L'application de ces approches pour l'amélioration de l'intelligibilité audio et la reconnaissance automatique de la parole pour des applications de téléphonie mobile et de téléphonie main libre.

Bibliographie

[1] E Zwicker, R. Feldtkeller, Psychoacoustique:L’oreille, récepteur d’information”, Masson, Paris, 1981.

[2] Y. Hu and P. Loizou, “Incorporating a psychoacoustic model in frequency domain speech enhancement”, IEEE Signal Processing Letters, 11(2), 2004, pp. 270-273.

[3] A.Ben Aicha and S. Ben Jebara, “Utilisation de la courbe de masquage pour la détection des tonales musicales artificielles dans un signal de parole débruité par approche spectrales ”, ISIVC2006, Tunisie.

[4] L. Lin,W. H. Holmes and E. Ambikairajah,“Speech denoising using perceptual modification of Wiener filtering”, IEEE Electronic Letters, vol. 38, no. 23, November 2002, pp. 1486-1487.

[5] T.Haulik, K.Linhard and P.Schrogmeier, “Residual noise suppression using psychoacoustic criteria”, Eurospeech 1997, pp 1395.

Merci pour votre attention

intitulé de la thèse : débruitage de la parole et ses applications

signal de parole

bruit bn

bruit musicalgnant

bruit additif2

courbe de masquage

signal dbruit

masquage idaledsp

reconnaissance de la

Documents

thèse télésurveillance finale - dumas

thÈse - theses.fr

thèse atomic

intitulé de la thèse : débruitage de la parole et ses...

tutorial intitulé ''power-aware testing and test strategies...

thèse finale iaina 52.docx

thèse professionnelle : multimédia et éducation

thèse dimitri boekhoorn - tel

thèse - pepite-depot.univ-lille.fr

thèse biophysique elhasnaoui khalid &

cote : pp 963 intitulé : authier (famille) ·...

rapport de thèse - tel

thèse touil

thèse de khalaf - univ-lorraine.fr

thèse gabapentine (marketing pharmaceutique)

thÈse - hal.archives-ouvertes.fr

alison accarie / 2 ème année de thèse directeur de...

thèse unsaturated soil

c:/users/wabouf/dropbox/thèse/articles de la thèse/cviu

thèse walczack bitumes 2000