control de dispositivos por comandos de voz por: buenrostro mariz jesús antonio héctor manuel...

25
“Control de dispositivos por comandos de voz” Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo M. en C. Fuentes Covarrubias Andrés Gerardo

Upload: maricela-orrantia

Post on 07-Mar-2015

14 views

Category:

Documents


8 download

TRANSCRIPT

Page 1: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

“Control de dispositivos por comandos de voz”

Por: Buenrostro Mariz Jesús AntonioHéctor Manuel Viera García

Asesores: M. en C. Fuentes Covarrubias RicardoM. en C. Fuentes Covarrubias Andrés Gerardo

Page 2: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

ÍndiceIntroducción.

Antecedentes.

Estado del arte.

Procesamiento del lenguaje natural.o Aparato fonador

Entorno de desarrollo Arduino.

Robot Mitsubishi rv-m1

Circuito del control Veear.

Conclusiones.

Bibliografía.

Page 3: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

Introducción En la actualidad se busca la automatización de todos los procesos de la vida diaria,

mejorando de esta manera la calidad de vida de las personas. La finalidad de este

proyecto es controlar dispositivos por comandos de voz, de tal manera que

cualquiera pueda comunicarse con estos.

El proyecto consistió en el diseño y la implementación del controlador encargado

de manejar el posicionamiento del brazo del robot Mitsubishi rv-m1 aplicando

técnicas del lenguaje natural por medio del speech recognition kit SR-06/sr-07, así

como la utilización del entorno Arduino para programar la interfaz entre la tarjeta

de voz y el brazo de robot.

Nuestros objetivos planteados al inicio de la investigación fueron:

Diseñar la interfaz entre el speech recognition kit y el brazo de robot Mitsubishi rv-

m1 con la ayuda del entorno Arduino.

Desarrollar la tabla de posiciones del brazo del robot.

Adaptar el hardware del brazo robótico con la tarjeta de voz.

Page 4: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

Antecedentes En el año 1870 Alexander Graham Bell quería construir un

sistema/dispositivo que hiciera el habla visible a las personas con problemas

auditivos donde el resultado fue el teléfono.

En el año 1880 Tihamir Nemes solicita permiso para desarrollar un sistema

de transcripción automática que identificara secuencias de sonidos y los

imprimiera (texto), pero fue rechazado como "Proyecto no Realista". Treinta

años después AT&T Bell Laboratories construye la primera máquina capaz de

reconocer voz. Requería extenso reajuste a la voz de una persona, pero una

vez logrado tenía un 99% de certeza. Por lo tanto surge la esperanza de que

el reconocimiento de voz sea simple y directo.

A mediados de los 60's la mayoría de los investigadores reconoce que era un

proceso mucho más intrincado y sutil de lo que habían anticipado. Por lo

tanto empiezan a reducir los alcances y se enfocan a sistemas más

específicos como:

Dependientes del Locutor.

Flujo discreto de habla (con espacios / pausa entre palabras).

Vocabulario pequeño (menor o igual a 50 palabras).

Page 5: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

Después, IBM y CMV trabajan en reconocimiento de voz continuo pero no se ven resultados

hasta los 70's. A principios de ellos se produce el 1er Producto de reconocimiento de voz, el

VIP100 de Threshold Technology Inc. (utilizaba un vocabulario pequeño, dependiente del

locutor, y reconocía palabras discretas). Gana el U.S. National Award en 1972. Más tarde nace

el interés de ARPA del U.S. Department of Defense, y gracias al lanzamiento de grandes

proyectos de investigación y financiamiento por parte del gobierno, se precipita la época de

la inteligencia artificial.

El proyecto financiado por ARPA busca el reconocimiento de habla continua de un vocabulario

extenso, impulsando a los investigadores a que se enfoquen en el entendimiento del habla.

Los sistemas empiezan a incorporar módulos de:

Análisis léxico (conocimiento léxico).

Análisis sintáctico (Estructura de Palabras).

Análisis semántico (Significado).

Análisis pragmático (Intención).

Estos proyectos terminan en 1976 con el resultado de que CMU, SRI y MIT crearon sistemas

para el proyecto ARPA SUR (Speech Understanding Research).

De los 80's a los 90's surgen los sistemas de vocabulario amplio, que ahora son la norma

(más de 1000 palabras). Adicionalmente bajan los precios de estos sistemas.

Page 6: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

Estado del arteEl uso del lenguaje natural utilizado como

medio de comunicación entre humano-máquina ha tenido un impacto muy importante en los últimos años, ya que la tecnología busca facilitar su uso y aplicación, de tal manera que una persona no necesite ser un experto en el área para interactuar con algún dispositivo inteligente, que es el objetivo de la quinta generación de computadoras.

Page 7: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

Procesamiento del lenguaje natural Gracias a la inteligencia artificial se han simulado

diferentes funciones del cuerpo humano como la voz,

brazos, piernas, vista, oídos, etc. Es por medio de esta

misma ciencia que estudiamos el sistema de la

comunicación por señales de voz, el cual es la emisión y

recepción de señales fonéticas de forma oral, para de

esta manera comprenderlo y traducirlo al lenguaje

máquina, con el propósito de que un conjunto de

circuitos pueda comprender el lenguaje natural y realizar

una reacción conforme al mensaje emitido.

Page 8: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

Aparato fonador La complejidad del cuerpo humano nos permite producir una gran variedad de

sonidos que modulamos para formar las palabras con las que nos comunicamos,

dentro de los componentes que intervienen en el proceso de la producción del habla

se encuentran: la glotis que constituye el verdadero órgano de fonación humano y

está ubicada dentro de la laringe, pulmones, dos pares de cuerdas vocales, las

cavidades de la cabeza relacionadas con el sistema respiratorio y nasofaríngeo, entre

otros. El mecanismo brevemente resumido de dicho proceso es el siguiente:

El diafragma empuja los pulmones, haciendo que se expulse el aire.

El aire circula por la tráquea y laringe, pasando por las cuerdas vocales y haciendo

que vibren con un tono fundamental.

El tono fundamental producido por las cuerdas vocales pasa, a través de la laringe, a

la caja de resonancia que forman las cavidades nasales y orales.

Algunas frecuencias entran en resonancia en las cavidades nasales y orales, saliendo

hacia el exterior como la información más importante del habla.

Page 9: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

Aparato fonador

Page 10: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

Entorno de desarrollo Arduino Para poder comunicar la tarjeta de reconocimiento de

voz con la computadora que controla el robot Mitsubishi

es necesario tener un dispositivo que nos facilite el

trabajo por eso decidimos trabajar con Arduino.

“Arduino es una plataforma de electrónica abierta

(open source) para la creación de prototipos basada en

software y hardware flexibles y fáciles de usar. Se creó

para artistas, diseñadores, aficionados y cualquiera

interesado en crear entornos u objetos interactivos”

Page 11: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

Tarjeta Arduino

Page 12: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

Arduino permite capturar información por medio de sensores gracias a sus

pines y puede manifestarse por medio de motores, luces o actuadores, en

nuestro caso por medio del robot Mitsubishi.

El entorno cuenta con su propio lenguaje de programación llamado “lenguaje

de programación Arduino”, basado en wiring y un entorno de desarrollo,

basado en processing, con la gran ventaja de ser código abierto esto quiere

decir que pudimos desarrollar sin comprar licencia y modificar los archivos sin

problemas.

Lo primero que hicimos después de tener la placa Arduino fue la instalación

de los drivers de este a nuestra computadora para eso conectamos la placa al

puerto USB y Windows instalo automáticamente, después cargamos el

software, es muy importante saber la versión del Arduino, nosotros ocupamos

el IDE 0022 de acuerdo con nuestro microcontrolador atmega328.

Para comprobar que funcionó correctamente abrimos un ejemplo de los que

ya vienen incluidos, conectamos el Arduino, seleccionamos el modelo de la

placa, el puerto serie COM1 o COM2 dependiendo de nuestra configuración

preferente y finalmente cargamos el archivo, mediante motores o luces

(diodos) se observa el comportamiento del programa.

Page 13: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

Antecedentes del RobotRobot viene de la República Checa usada por

primera vez por el escrito Karel Capek en su

obra R.U.R. (Rossum’s Universal Robots) en

1917, la utilizó para referirse en sus libros, a

máquinas con forma humanoide. Después en

1940, Isaac Asimov la uso para referirse a lo

mismo. Robot significa “labor forzada” o

bien esclavo.

Robot Mitsubishi rv-m1

Page 14: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

Hoy en nuestros días el significado no es tomado por

las tendencias del pasado, surge de nuestras

necesidades, agricultura, la industria, etc. Después de

la revolución industrial el término robot cubría ya la faz

de la tierra.

En nuestro caso llamamos robot a un brazo mecánico

capaz de realizar trabajos precisos y del área de la

industria.

El robot Mitsubishi RV-M1 posee 5 grados de

movimiento se representan en la siguiente imagen de

J1 hasta J5. Los movimientos son permitidos por el

cable de señal que recibe los datos y un cable

potencia.

Page 15: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

Anatomía del robot

Page 16: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

La unidad motora que se encarga del control del robot y de alimentarlo. Se muestra a continuación con sus componentes.

Page 17: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

Vista trasera

Page 18: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

Caja de enseñanza

La caja de enseñanza es un control manual para el robot, se conecta a la unidad motora en el puerto teaching box. Sirve para programar las rutinas, realizar los movimientos, guardarlos y borrarlos con sus respectivos comandos.

Page 19: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo
Page 20: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

Circuito del control Veear La línea de productos Veear incluye una serie de productos

hardware y software diseñados para ayudarle en el desarrollo e

implementación de capacidades de reconocimiento de voz para

muchas aplicaciones donde la capacidad de comando de voz es

deseada y conveniente.

El circuito utilizado para el proyecto es el “EasyVR Arduino Shield”

por ser una tarjeta multipropósito diseñada para fácilmente añadir

capacidades de reconocimiento de voz en varios lenguajes de

programación, de una manera eficaz, versátil, robusta y rentable

para cualquier aplicación desarrollada en la plataforma Arduino.

Page 21: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

Easy Veear

Page 22: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

Sensory quickSynthesis 5

Page 23: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

EasyVR GUI v2.1.8

Page 24: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

conclusiones A partir de la revolución industrial los robots han tomado un gran papel en muchas

áreas de trabajo y en la industria. Son utilizados desde juguetes hasta máquinas de

trabajo forzado ciertamente sin recibir un sueldo. De aquí partió nuestra visión de

crear soluciones a problemas diarios y facilitar las labores humanas.

La industria, el comercio, la agricultura, etc. Son áreas indispensable e

inmediatamente obligatorias para el desarrollo económico del país. Nuestro trabajo

de investigación viene a facilitar y reforzar lo antes ya establecido, aportando una

solución viable, utilizar el brazo de robot Mitsubishi rv-m1 controlado mediante

comandos voz, para realizar labores pesadas o peligrosas sin la intervención directa

con un ser humano.

Al finalizar nuestra investigación y llevarlo a la práctica hemos obtenido los

resultados esperados de nuestro análisis, logrando así aportar una visión más clara

y concreta de los que la inteligencia artificial con la ayuda de algo elemental como

lo es el lenguaje natural, pueden hacer por nuestra vida diaria.

Page 25: Control de dispositivos por comandos de voz Por: Buenrostro Mariz Jesús Antonio Héctor Manuel Viera García Asesores: M. en C. Fuentes Covarrubias Ricardo

bibliografía Ingrid Kirschning Tlatoa [2005], “Reconocimiento de Voz”.

Documento electrónico consultado el 02/03/2013 en la página de la Universidad de las Américas Puebla: http://ict.udlap.mx/people/ingrid/Clases/IS412/

Bernal Bermúdez Jesús; Bobadilla Sancho Jesús; Gómez Vilda Pedro. Reconocimiento de voz y fonética acústica. Primera edición. México, D.F.: Alfaomega, 2000. ISBN 970-15-0541-7.

  Arduino [2010], “Arduino”. Documento electrónico

consultado el 24/04/2013 en: http://www.arduino.cc/es/

Robot [19 de enero de 2006], “Robot”. Página web consultada 20/05/2013 en: http://www.xatakaciencia.com/robotica/el-origen-de-la-palabra-robot