quantile based noise estimation for spectral subtraction
Post on 13-Apr-2018
227 Views
Preview:
TRANSCRIPT
-
7/26/2019 Quantile Based Noise Estimation for Spectral Subtraction
1/4
Q U A N T I L E B A S E D N O I S E E S T I M A T I O N F O R
S P E C T R A L S U B T R A C T I O N A N D W I E N E R F I L T E R I N G
V o l k e r S t a h l , A l e x a n d e r F i s c h e r a n d R o l f B i p p u s
P h i l i p s R e s e a r c h L a b o r a t o r i e s
W e i s s h a u s s t r a s s e 2 , D - 5 2 0 6 6 A a c h e n , G e r m a n y
e m a i l : f v s t a h l , a f i s c h e r , b i p p u s g @ p f a . r e s e a r c h . p h i l i p s . c o m
A B S T R A C T
E l i m i n a t i o n o f a d d i t i v e n o i s e f r o m a s p e e c h s i g n a l i s a f u n -
d a m e n t a l p r o b l e m i n a u d i o s i g n a l p r o c e s s i n g . I n t h i s p a p e r
w e r e s t r i c t o u r c o n s i d e r a t i o n s t o t h e c a s e w h e r e o n l y a s i n g l e
m i c r o p h o n e r e c o r d i n g o f t h e n o i s y s i g n a l i s a v a i l a b l e . T h e
a l g o r i t h m s w h i c h w e i n v e s t i g a t e p r o c e e d i n t w o s t e p s : F i r s t ,
t h e n o i s e p o w e r s p e c t r u m i s e s t i m a t e d . A m e t h o d b a s e d o n
t e m p o r a l q u a n t i l e s i n t h e p o w e r s p e c t r a l d o m a i n i s p r o p o s e d
a n d c o m p a r e d w i t h p a u s e d e t e c t i o n a n d r e c u r s i v e a v e r a g -
i n g . T h e s e c o n d s t e p i s t o e l i m i n a t e t h e e s t i m a t e d n o i s e
f r o m t h e o b s e r v e d s i g n a l b y s p e c t r a l s u b t r a c t i o n o r W i e n e r
l t e r i n g . T h e d a t a b a s e u s e d i n t h e e x p e r i m e n t s c o m p r i s e s
6 0 3 4 u t t e r a n c e s o f G e r m a n d i g i t s a n d d i g i t s t r i n g s b y 7 7 0
s p e a k e r s i n 1 0 d i e r e n t c a r s . W i t h o u t n o i s e r e d u c t i o n , w e
o b t a i n a n e r r o r r a t e o f 1 1 . 7 % . Q u a n t i l e b a s e d n o i s e e s t i -
m a t i o n a n d W i e n e r l t e r i n g r e d u c e t h e e r r o r r a t e t o 8 . 6 % .
S i m i l a r i m p r o v e m e n t s a r e a c h i e v e d i n a n e x p e r i m e n t w i t h
a r t i c i a l , n o n - s t a t i o n a r y n o i s e .
1 . I N T R O D U C T I O N
T h e e r r o r r a t e o f s p e e c h r e c o g n i t i o n s y s t e m s i n c r e a s e s d r a -
m a t i c a l l y i n t h e p r e s e n c e o f n o i s e . I t i s t h e r e f o r e i n e v i t a b l e
t o p r o v i d e s o m e m e a n s o f n o i s e r e d u c t i o n i n t h e f r o n t e n d o f
s p e e c h r e c o g n i z e r s w h i c h o p e r a t e u n d e r a d v e r s e c o n d i t i o n s .
A p a r t i c u l a r l y n o i s y b u t i m p o r t a n t a p p l i c a t i o n d o m a i n o f
s p e e c h r e c o g n i t i o n i s t h e c a r e n v i r o n m e n t 3 , 4 , 5 , 2 , 8 , 9 ] .
I n t h i s p a p e r w e i n v e s t i g a t e d i e r e n t n o i s e r e d u c t i o n m e t h -
o d s a n d c a r r y o u t e x p e r i m e n t s o n a l a r g e s p e e c h d a t a b a s e
w h i c h h a s b e e n r e c o r d e d i n t h e c a r .
T h e p a p e r i s s t r u c t u r e d a s f o l l o w s : I n S e c t i o n 2 w e g i v e
a b r i e f d e s c r i p t i o n o f t h e s p e e c h r e c o g n i t i o n s y s t e m a n d t h e
d a t a b a s e u s e d f o r t h e e x p e r i m e n t s . M o d e l a s s u m p t i o n s o n
t h e s p e e c h a n d n o i s e s i g n a l a r e s t a t e d i n S e c t i o n 3 . I n S e c -
t i o n 4 w e d i s c u s s t w o m e t h o d s t o e s t i m a t e t h e n o i s e p o w e r
s p e c t r u m . T h e r s t m e t h o d i s b a s e d o n f r a m e w i s e s p e e c h /
n o n - s p e e c h c l a s s i c a t i o n a n d r e c u r s i v e a v e r a g i n g o v e r n o n -
s p e e c h f r a m e s . A s p a u s e d e t e c t i o n i n n o i s y e n v i r o n m e n t s
i s a d i c u l t p r o b l e m , w e p r o p o s e a s e c o n d m e t h o d , w h i c h
d o e s n o t d e p e n d o n a c l a s s i e r . T h e n o i s e i s e s t i m a t e d a s a
t e m p o r a l q u a n t i l e i n t h e p o w e r s p e c t r a l d o m a i n . A c c o r d i n g
t o a n e x p e r i m e n t a l c o m p a r i s o n , q u a n t i l e b a s e d n o i s e e s t i -
m a t i o n p e r f o r m s s i g n i c a n t l y b e t t e r , e s p e c i a l l y u n d e r n o n -
s t a t i o n a r y n o i s e . I n S e c t i o n 5 w e a p p l y s p e c t r a l s u b t r a c t i o n
a n d W i e n e r l t e r i n g t o e l i m i n a t e t h e e s t i m a t e d n o i s e f r o m
t h e i n p u t s i g n a l . T h e r e s u l t s a r e s u m m a r i z e d i n S e c t i o n 6 .
2 . D A T A B A S E A N D S P E E C H R E C O G N I T I O N
S Y S T E M
T h e e x p e r i m e n t a l r e s u l t s r e p o r t e d i n t h i s p a p e r a r e b a s e d
o n t h e G e r m a n d i g i t s t r i n g s u b s e t o f t h e M o T i V d a t a b a s e
7 ] . T h e c o r p u s c o m p r i s e s 6 0 3 4 u t t e r a n c e s ( 4 4 3 6 f o r t r a i n -
i n g a n d 1 5 9 8 f o r e v a l u a t i n g t h e e r r o r r a t e ) b y 7 7 0 s p e a k e r s
i n 1 0 c a r s a t v a r i o u s d r i v i n g s i t u a t i o n s . T r a i n i n g a n d e v a l u -
a t i o n i s a l w a y s d o n e o n t h e m a t c h e d s c e n a r i o , i . e . t h e s a m e
n o i s e e l i m i n a t i o n m e t h o d s a r e a p p l i e d d u r i n g t r a i n i n g a n d
e v a l u a t i o n .
T h e s p e e c h r e c o g n i z e r i s a c o n t i n u o u s m i x t u r e d e n s i t y
h i d d e n M a r k o v m o d e l ( H M M ) s y s t e m w h o s e p a r a m e t e r s
a r e e s t i m a t e d b y V i t e r b i t r a i n i n g . E a c h m i x t u r e c o n s i s t s
o f 8 G a u s s i a n d e n s i t i e s w i t h d e n s i t y s p e c i c , d i a g o n a l c o -
v a r i a n c e m a t r i c e s . T h e s y s t e m u s e s t w o H M M s f o r e a c h
d i g i t , o n e f o r m a l e a n d o n e f o r f e m a l e s p e a k e r s . T h e s i g n a l
a n a l y s i s i s a s f o l l o w s : T h e o b s e r v e d s p e e c h s i g n a l i s s u b d i -
v i d e d i n t o o v e r l a p p i n g , 1 6 m s s p a c e d f r a m e s o f 3 2 m s l e n g t h .
F o r e a c h f r a m e t h e p o w e r s p e c t r u m i s e s t i m a t e d t h r o u g h a
H a m m i n g w i n d o w e d F F T f o l l o w e d b y a l t e r b a n k w i t h 1 5
m e l s p a c e d t r i a n g u l a r k e r n e l s . A f t e r a d i s c r e t e c o s i n e t r a n s -
f o r m o f t h e l o g a r i t h m i c l t e r b a n k o u t p u t s w e o b t a i n 1 2 m e l
f r e q u e n c y c e p s t r a l c o e c i e n t s , w h i c h , a u g m e n t e d b y 1 2 r e -
g r e s s i o n c o e c i e n t s , a r e p a s s e d t o t h e r e c o g n i z e r . I n t h i s
p a p e r w e e x p e r i m e n t w i t h a n a d d i t i o n a l p r e p r o c e s s i n g s t e p
i n t h e p o w e r s p e c t r a l d o m a i n i n o r d e r t o r e d u c e a d d i t i v e
n o i s e i n t h e s i g n a l .
3 . N O T A T I O N A N D A S S U M P T I O N S
W e a s s u m e t h a t t h e o b s e r v e d n o i s e s i g n a l i s a r e a l i z a t i o n
o f a w i d e s e n s e s t a t i o n a r y p r o c e s s 1 1 ] . T h e m a j o r p a r t
o f t h i s p a p e r d e a l s w i t h t h e e s t i m a t i o n o f i t s p o w e r s p e c -
t r u m N ( ! ) . A s t h e e s t i m a t i o n i s m o r e r e l i a b l e i f m o r e d a t a
i s a v a i l a b l e , w e u s e t h e n o t a t i o n N ( ! t ) t o d e n o t e a n e s -
t i m a t i o n o f N ( ! ) u s i n g a l l f r a m e s f r o m t h e b e g i n n i n g o f
t h e u t t e r a n c e u p t o f r a m e t . F u r t h e r , w e a s s u m e t h a t t h e
c l e a n s p e e c h s i g n a l w i t h i n e a c h f r a m e t i s a n i n s t a n c e o f a
w i d e s e n s e s t a t i o n a r y p r o c e s s w i t h p o w e r s p e c t r u m S ( ! t )
F o r t h e s a k e o f n o t a t i o n a l s i m p l i c i t y w e d o n o t d i s t i n g u i s h
b e t w e e n p o w e r s p e c t r a a n d p e r i o d i g r a m b a s e d p o w e r s p e c -
t r u m e s t i m a t i o n s . A s t h e s p e e c h a n d n o i s e s i g n a l a r e a s -
s u m e d t o b e a d d i t i v e a n d i n d e p e n d e n t , t h e p o w e r s p e c t r u m
o f t h e o b s e r v e d s i g n a l i s X ( ! t ) = S ( ! t ) + N ( ! ) T h e
p o w e r s p e c t r u m X ( ! t ) i s e s t i m a t e d b y m a g n i t u d e s q u a r e d
-
7/26/2019 Quantile Based Noise Estimation for Spectral Subtraction
2/4
F o u r i e r c o e c i e n t s o f t h e o b s e r v e d s i g n a l i n f r a m e t . T h e
c l e a n s p e e c h s i g n a l p o w e r s p e c t r u m c a n t h e r e f o r e b e e s t i -
m a t e d a s S ( ! t ) = X ( ! t ) ; N ( ! t )
4 . E S T I M A T I O N O F T H E N O I S E S P E C T R U M
A c r u c i a l s t e p i n n o i s e s u p p r e s s i o n m e t h o d s l i k e W i e n e r l -
t e r i n g o r s p e c t r a l s u b t r a c t i o n i s t h e e s t i m a t i o n o f t h e n o i s e
s p e c t r u m . T h e r e a r e a p p l i c a t i o n s w h e r e t h i s t a s k i s s i m -
p l i e d b y s o m e p r i o r k n o w l e d g e o f t h e n o i s e s p e c t r u m o r
b y m u l t i c h a n n e l r e c o r d i n g s . H o w e v e r , i n t h i s p a p e r w e a s -
s u m e t h a t t h e r e i s o n l y a s i n g l e m i c r o p h o n e a n d a l l w e k n o w
a b o u t t h e n o i s e s i g n a l i s t h a t i t i s m o r e o r l e s s s t a t i o n a r y ,
i n d e p e n d e n t o f t h e s p e e c h s i g n a l a n d a d d i t i v e .
A c o m m o n l y u s e d m e t h o d f o r n o i s e s p e c t r u m e s t i m a -
t i o n i s t o a v e r a g e o v e r s e c t i o n s i n t h e i n p u t s i g n a l w h i c h d o
n o t c o n t a i n s p e e c h ( S e c t i o n 4 . 1 ) . H o w e v e r , t h i s a p p r o a c h
r e q u i r e s t h a t n o n - s p e e c h s e c t i o n s c a n b e d e t e c t e d r e l i a b l y ,
w h i c h i s d i c u l t e s p e c i a l l y u n d e r n o i s y c o n d i t i o n s . M o r e -
o v e r , i t r e l i e s o n t h e f a c t t h a t t h e r e a c t u a l l y e x i s t s a s u -
c i e n t a m o u n t o f n o n - s p e e c h i n t h e s i g n a l . I n o r d e r t o a v o i d
t h e s e p r o b l e m s , w e p r o p o s e a m e t h o d t o e s t i m a t e t h e n o i s e
s p e c t r u m w i t h o u t e x p l i c i t f r a m e w i s e s p e e c h / n o n - s p e e c h
c l a s s i c a t i o n ( S e c t i o n 4 . 2 ) . T h e i d e a i s t o e s t i m a t e t h e n o i s e
e n e r g y i n e a c h f r e q u e n c y b a n d b y t e m p o r a l q u a n t i l e s i n t h e
p o w e r s p e c t r a l d o m a i n .
4 . 1 . N o i s e S p e c t r u m E s t i m a t i o n B a s e d o n F r a m e
W i s e S p e e c h / N o n - S p e e c h C l a s s i c a t i o n
I f t h e s i g n a l t o n o i s e r a t i o i s n o t t o o l o w , a s i m p l e m e t h o d
t o d e t e c t s p e e c h i s b a s e d o n t h e s i g n a l e n e r g y . A s t h e n o i s e
s i g n a l i s a s s u m e d t o b e s t a t i o n a r y , t h e s i g n a l e n e r g y i n t h e
e n t i r e u t t e r a n c e i s g r e a t e r o r e q u a l t h e n o i s e e n e r g y . I f
t h e e n e r g y i n a f r a m e i s s i g n i c a n t l y l a r g e r t h a n t h e e s -
t i m a t e d n o i s e e n e r g y , t h e n t h e f r a m e i s l i k e l y t o c o n t a i n
s p e e c h . O t h e r w i s e i t i s a p u r e n o i s e f r a m e a n d i s u s e d t o
u p d a t e t h e c u r r e n t n o i s e e s t i m a t i o n . L e t X ( ! t ) b e t h e
p o w e r s p e c t r u m a t f r e q u e n c y ! i n t h e t - t h f r a m e o f t h e
i n p u t s i g n a l a n d N ( ! t ) b e t h e p o w e r s p e c t r u m o f t h e e s -
t i m a t e d n o i s e e n e r g y a t f r e q u e n c y ! i n f r a m e t . A s i m p l e
r e c u r s i v e f o r m u l a t o e s t i m a t e t h e n o i s e e n e r g y N ( ! t ) i s a s
f o l l o w s :
N ( ! t ) =
N ( ! t ; 1 ) i f X N R ( t ) >
( 1 ; ) N ( ! t ; 1 ) + X ( ! t ) e l s e
( 1 )
X N R ( t ) =
P
!
X ( ! t )
P
!
N ( ! t ; 1 )
f o r a l l ! . T h e r e c u r s i o n i s i n i t i a l i z e d b y N ( ! 0 ) = X ( ! 0 ) ,
w h i c h r e e c t s t h e a s s u m p t i o n t h a t t h e r s t f r a m e o f a n u t -
t e r a n c e d o e s n o t c o n t a i n s p e e c h . N o t e t h a t e a c h f r a m e i s
c l a s s i e d a s e i t h e r p u r e n o i s e o r s p e e c h p l u s n o i s e . E q u a -
t i o n ( 1 ) h a s t w o p a r a m e t e r s a n d w h i c h d e p e n d o n t h e
s p e e c h d a t a u n d e r c o n s i d e r a t i o n . P a r a m e t e r i s r e l a t e d
t o t h e s i g n a l t o n o i s e r a t i o . P a r a m e t e r d e t e r m i n e s t h e
a d a p t a t i o n s p e e d o f t h e n o i s e e s t i m a t i o n . A c c o r d i n g t o e x -
p e r i m e n t a l r e s u l t s = 1 8 a n d = 0 0 3 p e r f o r m w e l l f o r
t h e M o T i V c o r p u s . T h e e s t i m a t e d n o i s e N ( ! t ) i s r e m o v e d
f r o m t h e i n p u t s i g n a l X ( ! t ) b y m e a n s o f a W i e n e r l t e r ,
s e e S e c t i o n 5 . W i t h t h i s n o i s e e l i m i n a t i o n m e t h o d w e o b -
t a i n a w o r d e r r o r r a t e o f 1 0 . 3 % . W i t h o u t n o i s e e l i m i n a t i o n
t h e w o r d e r r o r r a t e i s 1 1 . 7 % , i . e . t h e r e l a t i v e i m p r o v e m e n t
i s 1 2 % .
F r a m e w i s e s p e e c h / n o n { s p e e c h c l a s s i c a t i o n u n d e r
n o i s y c o n d i t i o n s i s a d i c u l t p r o b l e m f a r f r o m b e i n g s o l v e d
s a t i s f a c t o r i l y . T h e f r a m e e r r o r r a t e o f t h e s p e e c h / n o n -
s p e e c h c l a s s i e r d e s c r i b e d a b o v e i s a r o u n d 1 6 % o n t h e M o -
T i V c o r p u s . I n t h e n e x t s e c t i o n w e d e s c r i b e a m e t h o d f o r
e s t i m a t i n g t h e n o i s e s p e c t r u m w h i c h d o e s n o t r e q u i r e e x -
p l i c i t s p e e c h / n o n - s p e e c h c l a s s i c a t i o n .
4 . 2 . Q u a n t i l e B a s e d N o i s e S p e c t r u m E s t i m a t i o n
I n 1 0 ] a n a l g o r i t h m f o r n o i s e e s t i m a t i o n b a s e d o n m i n i -
m u m s t a t i s t i c s h a s b e e n p r o p o s e d . A s t h e m i n i m u m i s s e n -
s i t i v e t o o u t l i e r s w e u s e a q u a n t i l e d i e r e n t f r o m m i n i m u m .
T h e a l g o r i t h m p r o p o s e d i n t h i s s e c t i o n i s s o m e w h a t s i m p l e r
a n d h a s f e w e r p a r a m e t e r s t h a n t h e o n e i n 1 0 ] b u t i s c o m -
p u t a t i o n a l l y m o r e e x p e n s i v e . A s i m i l a r m e t h o d h a s b e e n
d e s c r i b e d i n 2 ] .
I t i s w e l l k n o w n t h a t e v e n i n s p e e c h s e c t i o n s o f t h e i n p u t
s i g n a l n o t a l l f r e q u e n c y b a n d s a r e p e r m a n e n t l y o c c u p i e d
w i t h s p e e c h . I n f a c t , a s i g n i c a n t p e r c e n t a g e o f t h e t i m e
t h e e n e r g y i n e a c h f r e q u e n c y b a n d i s o n t h e n o i s e l e v e l .
T h i s o b s e r v a t i o n c a n b e u s e d t o e s t i m a t e a n o i s e p o w e r
s p e c t r u m N ( ! ) f r o m t h e o b s e r v e d s p e e c h s i g n a l X ( ! t )
b y t a k i n g t h e q - t h q u a n t i l e o v e r t i m e i n e v e r y f r e q u e n c y
b a n d . M o r e p r e c i s e l y , f o r e v e r y ! t h e f r a m e s o f t h e e n -
t i r e u t t e r a n c e X ( ! t ) , t = 0 : : : T a r e s o r t e d s u c h t h a t
X ( ! t
0
) X ( ! t
1
) X ( ! t
T
) T h e q - q u a n t i l e n o i s e
e s t i m a t i o n i s d e n e d a s
N ( ! ) = X ( ! t
b q T c
) ( 2 )
F o r e x a m p l e , q = 0 y i e l d s t h e m i n i m u m , q = 1 t h e
m a x i m u m a n d q = 0 5 t h e m e d i a n . T h i s a p p r o a c h i s b a s e d
o n t h e a s s u m p t i o n t h a t e a c h f r e q u e n c y b a n d c a r r i e s a t l e a s t
t h e q - t h f r a c t i o n o f t i m e o n l y n o i s e , e v e n d u r i n g s p e e c h
s e c t i o n s . O b v i o u s l y t h i s i s t r u e f o r v e r y s m a l l v a l u e s o f
q b u t i n o r d e r t o o b t a i n a r o b u s t e s t i m a t i o n o f t h e n o i s e
s p e c t r u m , w h i c h i s n o t s e n s i t i v e t o o u t l i e r s , w e h o p e t h a t q
i s s o m e w h e r e n e a r t h e m e d i a n , i . e . q 0 5
300 Hz
1500 Hz
3000 Hz
N()
q 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
F i g u r e 1 : Q u a n t i l e s o f t h e e n e r g y d i s t r i b u t i o n i n t h e o b -
s e r v e d s i g n a l X a t 3 0 0 H z , 1 5 0 0 H z a n d 3 0 0 0 H z f o r a t y p i c a l
u t t e r a n c e o f t h e M o T i V c o r p u s .
-
7/26/2019 Quantile Based Noise Estimation for Spectral Subtraction
3/4
F i g u r e 1 s h o w s N ( ! ) a c c o r d i n g t o ( 2 ) i n d e p e n d e n c e o f
q f o r 3 d i e r e n t f r e q u e n c i e s ! a n d a t y p i c a l 7 d i g i t u t t e r a n c e
t a k e n f r o m t h e M o T i V c o r p u s . R o u g h l y i n 8 0 - 9 0 % o f t h e
f r a m e s t h e s i g n a l e n e r g y i n t h e f r e q u e n c y b a n d s i s l o w , i . e .
c l o s e t o t h e n o i s e e n e r g y l e v e l a n d o n l y i n 1 0 - 2 0 % o f t h e
t i m e t h e f r e q u e n c y b a n d c a r r i e s h i g h e n e r g y , v o i c e d s p e e c h .
N o t e t h a t t h e c u r v e s a l s o d e p e n d o n t h e d u r a t i o n o f t h e
p a u s e s e c t i o n s i n t h e s i g n a l . H o w e v e r , t h e m a j o r p a r t o f
t h e u t t e r a n c e i n F i g u r e 1 w a s s p e e c h . F o r t h e M o T i V c o r -
p u s t h e o p t i m a l v a l u e f o r q w a s d e t e r m i n e d e x p e r i m e n t a l l y .
T h e e s t i m a t e d n o i s e N ( ! ) w a s e l i m i n a t e d f r o m t h e s i g n a l
b y a W i e n e r l t e r , s e e S e c t i o n 5 . T h e r e s u l t i n g w o r d e r r o r
r a t e s ( W E R ) a r e s u m m a r i z e d i n T a b l e 1 . T h e w o r d e r r o r
r a t e w i t h o u t a n y n o i s e r e d u c t i o n m e t h o d i s 1 1 . 7 % , i . e . t h e
r e l a t i v e r e d u c t i o n i s 2 6 % f o r t h e o p t i m a l c h o i c e q = 0 5 5
W i t h a 5 9 0 9 w o r d s t e s t s e t w e o b t a i n u n d e r c e r t a i n s i m p l i -
f y i n g a s s u m p t i o n s a c o n d e n c e i n t e r v a l o f 0 . 8 % o n t h e 9 5 %
s i g n i c a n c e l e v e l f o r t h e b a s e l i n e e r r o r r a t e 1 1 . 7 % . E r r o r
r a t e s b e l o w 1 0 . 9 % a r e t h e r e f o r e s i g n i c a n t i m p r o v e m e n t s .
q 0 . 2 0 . 3 0 . 4 0 . 5 0 . 5 5 0 . 6 0 . 7
W E R 1 1 . 3 1 0 . 8 1 0 . 1 8 . 9 8 . 6 8 . 8 9 . 7
T a b l e 1 : W o r d e r r o r r a t e w i t h W i e n e r l t e r a n d n o i s e e s t i -
m a t i o n N ( ! ) a c c o r d i n g t o ( 2 ) .
C a u s a l i t y . N o t e t h a t t h e e s t i m a t i o n o f t h e n o i s e s p e c -
t r u m d e p e n d s o n t h e e n t i r e u t t e r a n c e X ( ! t ) f o r a l l t =
0 : : : T . A n o i s e s u p p r e s s i o n l t e r b a s e d o n t h i s a p p r o a c h
i s t h e r e f o r e n o t c a u s a l . H o w e v e r , i f w e d e n e N ( ! t ) a s t h e
q - q u a n t i l e o f X ( ! ) f o r = 0 : : : t , w e o b t a i n a c a u s a l
l t e r . T a b l e 2 s u m m a r i z e s t h e r e s u l t s o f t h e s a m e e x p e r i -
m e n t s a s i n T a b l e 1 b u t t h i s t i m e w e u s e d a c a u s a l n o i s e
e s t i m a t i o n . T h e e r r o r r a t e s a c h i e v e d b y t h e c a u s a l l t e r
a r e s l i g h t l y h i g h e r t h a n f o r t h e n o n - c a u s a l c a s e . T h e r e a s o n
i s t h a t t h e n o i s e e s t i m a t i o n a t t h e b e g i n n i n g o f t h e s i g n a l
i s v e r y u n r e l i a b l e b e c a u s e f e w d a t a i s a v a i l a b l e t o e s t i m a t e
N ( ! t ) f o r s m a l l t
q 0 . 2 0 . 3 0 . 4 0 . 5 0 . 5 5 0 . 6 0 . 7
W E R 1 1 . 5 1 0 . 8 1 0 . 0 8 . 8 8 . 9 9 . 1 1 0 . 2
T a b l e 2 : S a m e e x p e r i m e n t a s i n T a b l e 1 b u t w i t h c a u s a l
n o i s e e s t i m a t i o n .
E c i e n c y . T h e c o m p u t a t i o n a l c o s t a n d m e m o r y c o n -
s u m p t i o n f o r e s t i m a t i n g N ( ! t ) g r o w s w i t h t . T h i s i s p r o b -
l e m a t i c f o r r e a l t i m e a n d l o w r e s o u r c e i m p l e m e n t a t i o n s . A s
a c o n s e q u e n c e w e i n v e s t i g a t e d a p p r o x i m a t e m e t h o d s f o r t h e
q u a n t i l e c o m p u t a t i o n w h i c h a r e m o r e e c i e n t i n t e r m s o f
t i m e a n d s p a c e . T h e i d e a i s t o s t o r e t h e o b s e r v a t i o n s X ( ! t )
f o r t = 0 1 : : : i n a b u e r w i t h x e d l e n g t h . S e p a r a t e
b u e r s a r e u s e d f o r e a c h f r e q u e n c y ! . I f a b u e r i s f u l l , t h e n
t h e l a r g e s t a n d t h e s m a l l e s t e l e m e n t a r e r e m o v e d f r o m t h e
b u e r . T h e q u a n t i l e i s d e t e r m i n e d b y c o n s i d e r i n g o n l y t h e
e l e m e n t s i n t h e b u e r . T h e o b v i o u s q u e s t i o n n o w i s h o w
l a r g e t h e b u e r s h o u l d b e a n d h o w m u c h t h e r e c o g n i t i o n
e r r o r r a t e i n c r e a s e s w i t h a n i t e l e n g t h b u e r . R e s u l t s o f
e x p e r i m e n t s w i t h d i e r e n t b u e r l e n g t h s a n d q = 0 5 a r e
r e p o r t e d i n T a b l e 3 . A s e x p e c t e d , t h e e r r o r r a t e i n c r e a s e s
f o r s m a l l b u e r s i z e s a n d a c h i e v e s a s y m p t o t i c a l l y t h e e r r o r
r a t e o f t h e e x a c t q u a n t i l e c o m p u t a t i o n . A n o t h e r m e t h o d t o
3 5 1 0 2 0 4 0 6 0 1 0 0
W E R 1 0 . 6 1 0 . 2 9 . 3 9 . 1 9 . 3 9 . 2 8 . 9
T a b l e 3 : S a m e e x p e r i m e n t a s i n T a b l e 2 f o r q = 0 5 b u t
w i t h l i m i t e d b u e r l e n g t h f o r t h e q u a n t i l e c o m p u t a t i o n .
i m p r o v e e c i e n c y i s t o i n t e g r a t e s e v e r a l a d j a c e n t f r e q u e n -
c i e s a n d d o a b a n d w i s e n o i s e e s t i m a t i o n 6 ] .
N o n - s t a t i o n a r y N o i s e . W e o b s e r v e d t h a t t h e c l a s s i -
e r b a s e d m e t h o d i n S e c t i o n 4 . 1 p e r f o r m s q u i t e p o o r l y i f
t h e n o i s e e n e r g y i n c r e a s e s a b r u p t l y , s a y a t t i m e
t . T h e r e a -
s o n i s t h a t t h e e s t i m a t e d n o i s e N ( !
t ) a t t i m e
t i s s m a l l
c o m p a r e d t o s u b s e q u e n t i n p u t f r a m e s X ( ! t ) f o r t >
t ,
e s p e c i a l l y i f f r a m e X ( ! t ) d o e s n o t c o n t a i n s p e e c h . T h e r e -
f o r e , a c c o r d i n g t o ( 1 ) , a l l f r a m e s a f t e r
t a r e c l a s s i e d a s
s p e e c h a n d h e n c e t h e n o i s e e s t i m a t i o n w i l l n o t b e u p d a t e d
a n y m o r e a f t e r t i m e
t , i . e . N ( ! t ) = N ( !
t ) f o r a l l t >
t
I n o t h e r w o r d s , t h e n o i s e e s t i m a t i o n d o e s n o t c o n v e r g e t o
t h e o b s e r v e d n o i s e . T h e q u a n t i l e b a s e d m e t h o d p r e s e n t e d
i n t h i s s e c t i o n d o e s n o t s u e r f r o m t h i s p r o b l e m a n d s e e m s
t h e r e f o r e a d v a n t a g e o u s f o r n o n - s t a t i o n a r y n o i s e . I n o r d e r
t o v e r i f y t h i s t h e o r e t i c a l c o n s i d e r a t i o n b y a n e x p e r i m e n t ,
w e i n s e r t e d 0 . 5 s e c o n d s o f c a r n o i s e f r o m a B M W 5 4 0 a t 5 0
k m / h b e f o r e t h e b e g i n n i n g o f e a c h s o u n d l e o f t h e t e s t s e t .
T h e c o l u m n s o f T a b l e 4 c o n t a i n t h e w o r d e r r o r r a t e s f o r t h e
c a s e s n o n o i s e r e d u c t i o n , n o i s e e s t i m a t i o n b y t h e c l a s s i e r
b a s e d m e t h o d a n d n o i s e e s t i m a t i o n b y t h e q u a n t i l e b a s e d
m e t h o d f o r q = 0 5 a n d b u e r s i z e s 1 0 , 2 0 , 6 0 , a n d u n l i m i t e d
r e s p e c t i v e l y . I n e a c h s c e n a r i o t h e e r r o r r a t e i s s i g n i c a n t l y
h i g h e r t h a n i n t h e c o r r e s p o n d i n g c a s e w i t h o u t i n s e r t e d c a r
n o i s e . T h e d e t e r i o r a t i o n f o r t h e c l a s s i e r b a s e d n o i s e e s -
t i m a t i o n m e t h o d , h o w e v e r , i s m u c h m o r e s e v e r e t h a n f o r
t h e q u a n t i l e b a s e d m e t h o d a n d i s e v e n w o r s e t h a n f o r t h e
c a s e w i t h o u t n o i s e e l i m i n a t i o n . T h e a d a p t a t i o n t i m e t o a
c h a n g i n g n o i s e s i g n a l i n t h e q u a n t i l e b a s e d m e t h o d i s p r o -
p o r t i o n a l t o t h e b u e r l e n g t h , w h i c h e x p l a i n s w h y i n t h i s
e x p e r i m e n t s h o r t e r b u e r l e n g t h s g i v e b e t t e r r e s u l t s .
M e t h o d n o n e c l a s s i e r q u a n t i l e = 1 0 2 0 6 0 1
W E R 1 3 . 7 1 8 . 5 1 0 . 1 1 0 . 5 1 0 . 6 1 1 . 7
T a b l e 4 : W o r d e r r o r r a t e i f 0 . 5 s e c o n d s l o w e n e r g y c a r n o i s e
a r e a d d e d t o t h e b e g i n n i n g o f t h e s o u n d l e s o f t h e t e s t s e t .
5 . E L I M I N A T I O N O F T H E N O I S E F R O M T H E
S P E E C H S I G N A L
I n t h e p r e v i o u s s e c t i o n w e d i s c u s s e d m e t h o d s f o r e s t i m a t -
i n g t h e n o i s e p o w e r s p e c t r u m N ( ! t ) . I n t h i s s e c t i o n w e
r e v i e w a p p r o a c h e s f o r e l i m i n a t i n g t h e e s t i m a t e d n o i s e f r o m
t h e o b s e r v e d s i g n a l . I f w e h a d c o m p l e t e i n f o r m a t i o n a b o u t
t h e n o i s e s p e c t r u m , i . e . m a g n i t u d e a n d p h a s e , t h e n o i s e
e l i m i n a t i o n w o u l d a m o u n t t o a s i m p l e s u b t r a c t i o n o f t h e
c o m p l e x F o u r i e r c o e c i e n t s . U n f o r t u n a t e l y w e h a v e n o
p h a s e i n f o r m a t i o n o f t h e n o i s e . H e n c e w e a p p l y s p e c t r a l
s u b t r a c t i o n a n d W i e n e r l t e r i n g f o r t h e n o i s e e l i m i n a t i o n .
T h e F I R W i e n e r l t e r i s d e n e d a s t h e l i n e a r l t e r w h i c h
m i n i m i z e s t h e m e a n s q u a r e e r r o r i n t h e t i m e d o m a i n . S p e c -
t r a l s u b t r a c t i o n r e l i e s o n t h e f a c t t h a t t h e p o w e r s p e c t r u m
o f t h e s u m o f t w o i n d e p e n d e n t r a n d o m s i g n a l s i s t h e s u m
o f t h e p o w e r s p e c t r a . T h e n o i s e e l i m i n a t i o n r u l e o f s p e c t r a l
-
7/26/2019 Quantile Based Noise Estimation for Spectral Subtraction
4/4
s u b t r a c t i o n i s t h e r e f o r e s i m p l y t o s u b t r a c t t h e p o w e r s p e c -
t r u m o f t h e e s t i m a t e d n o i s e f r o m t h e p o w e r s p e c t r u m o f t h e
o b s e r v e d s i g n a l . S u r p r i s i n g l y t h e f o r m u l a e f o r t h e W i e n e r
l t e r a n d s p e c t r a l s u b t r a c t i o n a r e q u i t e s i m i l a r . L e t
H ( ! t ) = ( X ( ! t ) ; N ( ! t ) ) = X ( ! t ) ( 3 )
T h e n o i s e r e d u c e d s i g n a l S ( ! t ) b y W i e n e r l t e r i n g i s
S ( ! t ) = H ( ! t )
2
X ( ! t )
n o i s e r e d u c t i o n b y s p e c t r a l s u b t r a c t i o n i s d e n e d a s
S ( ! t ) = X ( ! t ) ; N ( ! t ) = H ( ! t ) X ( ! t )
S o m e t i m e s t h e l o n g t e r m e s t i m a t e d n o i s e p o w e r s p e c t r u m
N ( ! t ) c a n b e l a r g e r t h a n t h e i n s t a n t a n e o u s o b s e r v e d p o w e r
s p e c t r u m X ( ! t ) . I n t h i s c a s e w e w o u l d e x p e c t t h a t t h e
n o i s e r e d u c e d p o w e r s p e c t r u m S ( ! t ) s h o u l d b e z e r o . T h e r e -
f o r e ( 3 ) i s u s u a l l y m o d i e d a s
H ( ! t ) = m a x ( X ( ! t ) ; N ( ! t ) 0 ) = X ( ! t )
E x p e r i m e n t a l e x p e r i e n c e i n d i c a t e s t h a t b e t t e r r e c o g n i t i o n
r e s u l t s a r e a c h i e v e d i f a s m a l l f r a c t i o n o f t h e n o i s e p o w e r
i s l e f t i n t h e s i g n a l 1 , 1 0 ] . H e n c e , t h e e n e r g y o f t h e n o i s e
r e d u c e d s i g n a l S ( ! t ) w h i c h i s p a s s e d t o t h e r e c o g n i z e r i s
S
( ! t ) = m a x ( S ( ! t ) N ( ! t ) )
w h e r e = 0 0 4 h a s b e e n c h o s e n e x p e r i m e n t a l l y .
A n e x p e r i m e n t a l c o m p a r i s o n o f s p e c t r a l s u b t r a c t i o n a n d
W i e n e r l t e r i n g f o r = 0 0 4 i s g i v e n i n T a b l e 5 . T h e n o i s e
p o w e r s p e c t r u m N ( ! t ) h a s b e e n e s t i m a t e d a s i n T a b l e 2 .
q 0 . 2 0 . 3 0 . 4 0 . 5 0 . 6 0 . 7 0 . 8
W i e n e r 1 1 . 5 1 0 . 8 1 0 . 0 8 . 8 9 . 1 1 0 . 2 1 2 . 1
S u b t r . 1 1 . 7 1 1 . 4 1 0 . 9 1 0 . 1 9 . 9 9 . 6 1 1 . 6
T a b l e 5 : E x p e r i m e n t a l c o m p a r i s o n o f t h e w o r d e r r o r r a t e s
o f W i e n e r l t e r i n g a n d s p e c t r a l s u b t r a c t i o n .
A s s u g g e s t e d i n 1 ] t h e p e r f o r m a n c e o f s p e c t r a l s u b t r a c -
t i o n c a n b e i m p r o v e d b y s u b t r a c t i n g a n o v e r e s t i m a t i o n o f
t h e n o i s e p o w e r s p e c t r u m , i . e .
S
( ! t ) = m a x ( X ( ! t ) ; N ( ! t ) N ( ! t ) )
I n o u r e x p e r i m e n t s w e f o u n d a n o p t i m u m f o r = 2 5 , w h i c h
g i v e s a w o r d e r r o r r a t e o f 9 . 2 % f o r q = 0 5
6 . C O N C L U S I O N
W e i n v e s t i g a t e d m e t h o d s t o r e m o v e a d d i t i v e n o i s e f r o m a
s p e e c h s i g n a l w h i c h h a s b e e n r e c o r d e d i n t h e c a r e n v i r o n -
m e n t b y a s i n g l e m i c r o p h o n e . T h e e r r o r r a t e o f a s p e e c h
r e c o g n i z e r h a s b e e n r e d u c e d b y u p t o 2 6 % r e l a t i v e b y q u a n -
t i l e b a s e d n o i s e e s t i m a t i o n i n t h e p o w e r s p e c t r a l d o m a i n
a n d W i e n e r l t e r i n g . T h e m e t h o d s p r o c e e d i n t w o s t e p s :
E s t i m a t i o n o f t h e n o i s e s i g n a l a n d e l i m i n a t i o n .
N o i s e E s t i m a t i o n . W e s t u d i e d t w o n o i s e e s t i m a t i o n
m e t h o d s : T h e r s t o n e i s b a s e d o n f r a m e w i s e s p e e c h / n o n -
s p e e c h c l a s s i c a t i o n a n d r e c u r s i v e s m o o t h i n g o v e r n o n - s p e e c h
f r a m e s ( S e c t i o n 4 . 1 ) , t h e s e c o n d m e t h o d e s t i m a t e s t h e n o i s e
b y q u a n t i l e s i n t h e p o w e r s p e c t r a l d o m a i n ( S e c t i o n 4 . 2 ) .
T h e q u a n t i l e b a s e d n o i s e e s t i m a t i o n m e t h o d g i v e s s i g n i -
c a n t l y b e t t e r r e s u l t s b u t i s m o r e e x p e n s i v e i n t e r m s o f c o m -
p u t i n g t i m e a n d m e m o r y . A n a p p r o x i m a t i o n a l g o r i t h m f o r
i m p r o v i n g t h e e c i e n c y o f t h e q u a n t i l e b a s e d m e t h o d h a s
b e e n p r o p o s e d . T h e c l a s s i e r b a s e d m e t h o d r e q u i r e s p r i o r
k n o w l e d g e a b o u t t h e s i g n a l t o n o i s e r a t i o , w h i c h i s n o t t h e
c a s e f o r t h e q u a n t i l e b a s e d m e t h o d . H o w e v e r , t h e q u a n -
t i l e b a s e d m e t h o d r e l i e s o n a s s u m p t i o n s o n e n e r g y d i s t r i b u -
t i o n s o f h u m a n s p e e c h i n t h e t i m e { f r e q u e n c y d o m a i n , w h i c h
n e e d t o b e v e r i e d b y m o r e e x p e r i m e n t s . F i n a l l y , t h e q u a n -
t i l e b a s e d m e t h o d s e e m s t o w o r k b e t t e r f o r c e r t a i n k i n d s o f
n o n - s t a t i o n a r y n o i s e t h a n t h e c l a s s i e r b a s e d m e t h o d .
N o i s e E l i m i n a t i o n . T w o m e t h o d s f o r r e m o v i n g t h e
e s t i m a t e d n o i s e h a v e b e e n i n v e s t i g a t e d , n a m e l y s p e c t r a l
s u b t r a c t i o n a n d W i e n e r l t e r i n g . T h e l a t t e r s e e m s s u p e r i o r
a c c o r d i n g t o e x p e r i m e n t a l e v i d e n c e ( S e c t i o n 5 ) . I f s p e c t r a l
s u b t r a c t i o n i s m o d i e d s u c h t h a t a n a p p r o p r i a t e o v e r e s t i -
m a t i o n o f t h e n o i s e i s s u b t r a c t e d , t h e n t h e a c h i e v e d e r r o r
r a t e c o m e s c l o s e t o t h e W i e n e r l t e r .
7 . R E F E R E N C E S
1 ] M . B e r o u t i , R . S c h w a r t z , a n d J . M a k h o u l , \ E n h a n c e -
m e n t o f S p e e c h C o r r u p t e d b y A c o u s t i c N o i s e , " i n P r o c .
I C A S S P , ( W a s h i n g t o n , U S A ) , p p . 2 0 8 { 2 1 1 , A p r . 1 9 7 9 .
2 ] H . G . H i r s c h a n d C . E h r l i c h e r , \ N o i s e E s t i m a t i o n
T e c h n i q u e s f o r R o b u s t S p e e c h R e c o g n i t i o n , " i n P r o c .
I C A S S P , p p . 1 5 3 { 1 5 7 , 1 9 9 5 .
3 ] J u a n g , B . H . \ S p e e c h R e c o g n i t i o n i n A d v e r s e E n v i r o n -
m e n t s " , C o m p u t e r S p e e c h a n d L a n g u a g e 5 : p p . 2 7 5 -
2 9 4 , 1 9 9 1 .
4 ] J u n q u a , J . - C . , H a t o n , J . P . \ R o b u s t n e s s i n A u t o m a t i c
S p e e c h R e c o g n i t i o n : F u n d a m e n t a l s a n d A p p l i c a t i o n s " ,
K l u w e r , B o s t o n , 1 9 9 6 .
5 ] P . L o c k w o o d a n d J . B o u d y , \ E x p e r i m e n t s w i t h a
N o n l i n e a r S p e c t r a l S u b t r a c t o r ( N S S ) , H i d d e n M a r k o v
M o d e l s a n d t h e p r o j e c t i o n , f o r r o b u s t s p e e c h r e c o g n i -
t i o n i n c a r s , " S p e e c h C o m m u n i c a t i o n , v o l . 1 1 , p p . 2 1 5 {
2 2 8 , 1 9 9 2 .
6 ] L . S i n g h a n d S . S r i d h a r a n , \ S p e e c h E n h a n c e m e n t u s -
i n g C r i t i c a l B a n d S p e c t r a l S u b t r a c t i o n , " i n P r o c . I C -
S L P , ( S y d n e y , A u s t r a l i a ) , N o v . 1 9 9 8 .
7 ] D . L a n g m a n n , T . S c h n e i d e r , R . G r u d s z u s , A . F i s c h e r ,
T . C r u l l , H . P t z i n g e r , M . W e s t p h a l , a n d U . J e k o s c h ,
\ C S D C - T h e M o T i V C a r - S p e e c h D a t a C o l l e c t i o n , " i n
F i r s t I n t e r n a t i o n a l C o n f e r e n c e o n L a n g u a g e R e s o u r c e s
a n d E v a l u a t i o n , ( G r a n a d a , S p a i n ) , M a y 1 9 9 8 .
8 ] A . F i s c h e r a n d V . S t a h l , \ S u b w o r d U n i t b a s e d S p e e c h
R e c o g n i t i o n i n C a r E n v i r o n m e n t s , " i n P r o c . I C A S S P ,
( S e a t t l e , U S A ) , p p . 2 5 7 { 2 6 1 , M a y 1 9 9 8
9 ] A . F i s c h e r a n d V . S t a h l , \ D a t a b a s e a n d O n l i n e A d a p t a -
t i o n f o r i m p r o v e d S p e e c h R e c o g n i t i o n i n C a r E n v i r o n -
m e n t s , " i n P r o c . I C A S S P , ( P h o e n i x , U S A ) , p p . 4 4 5 {
4 4 9 , M a r c h 1 9 9 9
1 0 ] R . M a r t i n , \ S p e c t r a l S u b t r a c t i o n b a s e d o n M i n i m u m
S t a t i s t i c s , " P r o c . E u r o p e a n S i g n a l P r o c e s s i n g C o n f e r -
e n c e , p p . 1 1 8 2 { 1 1 8 5 , S e p 1 9 9 4 .
1 1 ] M . H . H a y e s , \ S t a t i s t i c a l D i g i t a l S i g n a l P r o c e s s i n g a n d
M o d e l i n g , " J o h n W i l e y & S o n s , I n c . , 1 9 9 6 .
top related