codelco 11 junio 2008 [modo de compatibilidad]

37
I+D+I en biometría por voz en el I+D+I en biometría por voz en el LPTV LPTV Nestor Nestor Becerra Yoma, Becerra Yoma, Ph.D. Ph.D. Speech Processing and Transmission Laboratory Speech Processing and Transmission Laboratory Department of Electrical Engineering Department of Electrical Engineering Universidad de Chile, Santiago, Chile Universidad de Chile, Santiago, Chile [email protected] [email protected] Telefono: +56 Telefono: +56-2-978 4205 978 4205 Fax: +56 Fax: +56-2-695 3881 695 3881

Upload: others

Post on 16-Oct-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Codelco 11 junio 2008 [Modo de compatibilidad]

I+D+I en biometría por voz en el I+D+I en biometría por voz en el LPTVLPTV

NestorNestor Becerra Yoma, Becerra Yoma, Ph.D.Ph.D.

Speech Processing and Transmission LaboratorySpeech Processing and Transmission LaboratoryDepartment of Electrical EngineeringDepartment of Electrical EngineeringUniversidad de Chile, Santiago, ChileUniversidad de Chile, Santiago, Chile

[email protected]@ing.uchile.clTelefono: +56Telefono: +56--22--978 4205978 4205 Fax: +56Fax: +56--22--695 3881695 3881

Page 2: Codelco 11 junio 2008 [Modo de compatibilidad]

Motivación del LPTV

! Realizar investigación, desarrollo e innovación en el marco de tecnologías de voz (speech technology) aplicada a las telecomunicaciones.

! Nivel: clase internacional dado por la investigación.

Page 3: Codelco 11 junio 2008 [Modo de compatibilidad]

Estrategia

! Cerrar el ciclo desde la investigación, pasando por el desarrollo y llegando a la innovación.

! Dominar todas las etapas

! Buscar la autosuficiencia tecnológica (i.e. selfreliance) es un tema de soberanía.

Page 4: Codelco 11 junio 2008 [Modo de compatibilidad]

Convergencia: un nuevo paradigma

! Fusión de redes de datos con las de telecomunicaciones! Stack de protocolos abierto TCP/IP (e.g. Internet)

Page 5: Codelco 11 junio 2008 [Modo de compatibilidad]

Tecnologías abordadas

! Reconocimiento de Voz! Verificación del hablante o de locutor! Enseñanza de segundo idioma! Codificación! QoS! Protocolos para tiempo real

Page 6: Codelco 11 junio 2008 [Modo de compatibilidad]

Reconocimiento de Voz (ficción)

Page 7: Codelco 11 junio 2008 [Modo de compatibilidad]

Verificación del hablante o locutor (ficción)

Page 8: Codelco 11 junio 2008 [Modo de compatibilidad]

Reconocimiento de voz (LPTV)

Page 9: Codelco 11 junio 2008 [Modo de compatibilidad]

Verificación del hablante o de locutor(LPTV)

Page 10: Codelco 11 junio 2008 [Modo de compatibilidad]

Enseñanza de inglés

Page 11: Codelco 11 junio 2008 [Modo de compatibilidad]
Page 12: Codelco 11 junio 2008 [Modo de compatibilidad]
Page 13: Codelco 11 junio 2008 [Modo de compatibilidad]

Enseñanza de inglés

B ro w s e rA p p le t

u su a r io

W eb S e rve r

IP

u s u ar io

IPIP

IP

W e b s e rv e r s e c o m u n ic a c o n e l A S R y v ic e v e rs a

A S R

B ro w s e rA p p le t

B r ow s e rA p p le t

C o m u n ic a c ió n p u e r to : 8 0A p p le t s e c om u n ic a c o n e l

w eb s e rv e r

Sistema distribuido para enseñanza de idioma

Page 14: Codelco 11 junio 2008 [Modo de compatibilidad]

Biometría

! Biometría" Estudio de métodos para el reconocimiento de

humanos basado en rasgos conductuales o físicosúnicos de cada individuo

Huella dactilar Rostro Iris Voz Escritura

Page 15: Codelco 11 junio 2008 [Modo de compatibilidad]

Biometría

En verificación de identidad, todo sistema biométrico se define por sus curvas de falsa aceptación (FA) o de falso rechazo (FR) para un cierto umbral de decisión.

FA corresponde a aceptar un impostor.

FR denota el rechazar equivocadamente la identidad correcta del usuario.

La intersección de las curvas se denomina EER (Equal Error Rate) y se usa generalmente como criterio de comparación de exactitud.

Page 16: Codelco 11 junio 2008 [Modo de compatibilidad]

Biometría

-0.2 -0.15 -0.1 -0.05 0 0.05 0.1 0.15 0.20

10

20

30

40

50

60

70

80

90

100

110EER = 1.25%

Umbral

Erro

r rat

e (%

)

FAFR

Ejemplo de curvas de FA y FR

Page 17: Codelco 11 junio 2008 [Modo de compatibilidad]

Biometría

La huella dactilar (o fingerprint):Tasa de error entre 0.1% a 2%.

Dependiente de los factores como la edad, heridas y de la actividad laboral (por ejemplo, el uso intensivo de teclado en PCs perjudica la calidad de la huella), entre otros factores.

Considerando a toda la población, esta exactitud se vería dramáticamente degradada.

la penetración de puntos de acceso para capturar la huella es aún limitada.

Vulnerable: limpieza y fragilidad del vidrio la hace vulnerable a ciertas condiciones de operación y a sabotajes.

Page 18: Codelco 11 junio 2008 [Modo de compatibilidad]

Biometría por voz

Ventajas con respecto a otras modalidades

• Medio de identificación natural y económico• No requiere presencia• Medio de captura de fácil acceso (teléfono fijo o

móvil)• La señal de validación es fácilmente

almacenada y audible para supervisión.

Page 19: Codelco 11 junio 2008 [Modo de compatibilidad]

Biometría por voz

Aplicaciones

Control de acceso

Password por voz

Aplicaciones forense

Page 20: Codelco 11 junio 2008 [Modo de compatibilidad]

Biometría por voz en telefonía

Page 21: Codelco 11 junio 2008 [Modo de compatibilidad]

Marco tecnológico de la huella de voz

Tracto bocal y las cuerdas vocales

Page 22: Codelco 11 junio 2008 [Modo de compatibilidad]

Marco tecnológico de la huella de voz

Modelo de producción de la voz

Page 23: Codelco 11 junio 2008 [Modo de compatibilidad]

Marco tecnológico de la huella de voz

• Se modela el tracto bocal

• La excitación de las cuerdas vocales se puedeimitar. En general no se usa.

Page 24: Codelco 11 junio 2008 [Modo de compatibilidad]

Marco tecnológico de la huella de voz

Modelamiento del acústico fonético con HMM (Hidden Markov Models):

a12 a23 a a a a a34 45 56 67 782 3 4 5 6 7 8

a22 a 33 a44 a55 a66 a77

1

Modelo deMarkov

Page 25: Codelco 11 junio 2008 [Modo de compatibilidad]

Marco tecnológico de la huella de voz

Page 26: Codelco 11 junio 2008 [Modo de compatibilidad]

Marco tecnológico de la huella de voz

Page 27: Codelco 11 junio 2008 [Modo de compatibilidad]

Marco tecnológico de la huella de voz

Enrolling con números

Verificación

Tecnología transferible

Page 28: Codelco 11 junio 2008 [Modo de compatibilidad]

Aplicaciones de la huella de voz

Page 29: Codelco 11 junio 2008 [Modo de compatibilidad]

Aplicaciones de la huella de voz

Page 30: Codelco 11 junio 2008 [Modo de compatibilidad]

Aplicaciones de la huella de voz

Page 31: Codelco 11 junio 2008 [Modo de compatibilidad]

Marco tecnológico de la huella de voz

Señales!deverificación

Pre-procesamiento

Señales!deenrolamiento

Extracción deparámetros

Modelo del locutor Speaker Dependent

Modelo universalSpeaker Independent

Comparación de parámetros

Pre-procesamiento Extracción deparámetros

Aceptado

Rechazado

Umbral

Page 32: Codelco 11 junio 2008 [Modo de compatibilidad]

Marco tecnológico de la huella de voz

Enrolling con números

Verificación

Tecnología transferible

Page 33: Codelco 11 junio 2008 [Modo de compatibilidad]

Marco tecnológico de la huella de voz

-0.2 -0.15 -0.1 -0.05 0 0.05 0.1 0.15 0.20

10

20

30

40

50

60

70

80

90

100

110EER = 1.25%

Umbral

Erro

r rat

e (%

)

FAFR

Teléfono fijo, matched

Page 34: Codelco 11 junio 2008 [Modo de compatibilidad]

Marco tecnológico de la huella de voz

Teléfono celular, matched

-0.2 -0.15 -0.1 -0.05 0 0.05 0.1 0.15 0.20

10

20

30

40

50

60

70

80

90EER = 2%

Umbral

Erro

r rat

e (%

)

FAFR

Page 35: Codelco 11 junio 2008 [Modo de compatibilidad]

Marco tecnológico de la huella de voz

Page 36: Codelco 11 junio 2008 [Modo de compatibilidad]

Impacto internacional y nacional (Logros y reconocimiento)

• Publicaciones en los journals y congresos más importantes del área (state of the art)

• Proyección internacional (e.g. www.il-sig.org)

• PI en 2 Fondef y 3 Fondecyt, además de colaboración internacional (US$750.000 a US$1.000.000 en 8 años)

• Colaboración con empresas

• Transferencia tecnológica (Movistar Argentina)

Page 37: Codelco 11 junio 2008 [Modo de compatibilidad]

Potencial colaboración entre la industria minera y el LPTV/UCh

• Al parecer, la industria minera estaría interesada en desarrollo e innovación de punta en el área de las infocomunicaciones.

• El LPTV/UCh está interesado en investigación, desarrollo e innovación de punta y de clase mundial en el área de procesamiento de voz y de señales

• Posibilidad de fondos concursables, entre otras opciones