incidencia de la dilatación pupilar como variable predictiva del

UNIVERSIDAD DE CHILEFACULTAD DE CIENCIAS FISICAS Y MATEMATICASDEPARTAMENTO DE INGENIERIA INDUSTRIAL

INCIDENCIA DE LA DILATACION PUPILAR COMO VARIABLEPREDICTIVA DEL COMPORTAMIENTO DE LOS USUARIOS EN UNA

PAGINA WEB ANTES DE TOMAR UNA DECISION

MEMORIA PARA OPTAR AL TITULO DE INGENIERO CIVILINDUSTRIAL

JOAQUIN NICOLAS JADUE MUSALEM

PROFESOR GUIA:JUAN DOMINGO VELASQUEZ SILVA

MIEMBROS DE LA COMISION:PEDRO MALDONADO ARBOGASTALBERTO CABEZAS BULLEMORE

SANTIAGO DE CHILEMARZO 2014

Resumen Ejecutivo

El objetivo general del presente trabajo es la implementacion de metodologıas para estu-diar la incidencia de la dilatacion pupilar como variable predictiva de la toma de decisionde usuarios que navegan a traves de sitios web. Esta memoria busca encontrar patrones decomportamiento de la pupila en usuarios web al momento de tomar una decision, utilizandoherramientas de Data Mining, Eye-Tracking y Dilatacion Pupilar.

Este estudio es un apoyo al proyecto FONDEF adjudicado por la Universidad de Chile,titulado Plataforma informatica basada en web-intelligence y herramientas de analisis de ex-ploracion visual para la mejora de la estructura y contenido de sitios web (AKORI: AdvancedKernel for Ocular Research and web Intelligence), el cual busca paquetizar una metodologıade mejoramiento de sitios web.

La metodologıa a utilizar en este trabajo, es el metodo cientıfico, apoyado por el analisisKnowledge Discovery in Databases (KDD) de minerıa de datos. La hipotesis a validar es:

“Los cambios del diametro de la pupila en el tiempo son una variable predictiva depen-diente relevante en las tomas de decision proximas”.

Se realiza un experimento en el cual se presentan distintos objetos de valencia neutros dela base de datos IAPS, organizados ene 90 categorıas distintas, y el sujeto de prueba de elegiruno de los objetos haciendo click con el mouse. No hay un criterio de de decision impuestoen la instruccion. La instruccion es: Se le presentara un set de 9 imagenes en una grilla de3x3. Haciendo click con el mouse, elija una de las imagenes....

Para validar la hipotesis planteada, se realiza un experimento en que usuarios web naveganpor un sitio, dada una instruccion y a traves de herramientas de eye-tracking y dilatacionpupilar, se obtienen medidas periodicamente del diametro de la pupila, y la coordenada en lapantalla el cual el sujeto esta mirando. Se utilizan distintos metodos de minerıa de datos paravalidar la hipotesis, buscando la relacion entre la data y la toma de decision. Se define unatoma de decision como el momento en que el sujeto de prueba hace un click en la pantalla.

El experimento revela resultados favorables, validando la hipotesis con una confianza del95%. Se genera un clasificador utilizando herramientas de minerıa de datos. Se utilizanlos metodos de clasificacion binaria: Support Vector Machine; Accuracy de 72%, RegresionLogıstica; Accuracy de 75%, y Redes Neuronales; Accuracy de 82%. Se concluye que ladilatacion pupilar muestra patrones de comportamiento marcados en relacion con las tomasde decisiones.

i

RESUMEN DE LA MEMORIA

PARA OPTAR AL TITULO DEINGENIERO CIVIL INDUSTRIALPOR : JOAQUIN JADUE MUSALEMFECHA: 17/03/2014

PROF. GUIA: SR. JUAN VELASQUEZ

A mis padres por su confianza de aceroA mis amigos por su apoyo incondicional

Agradecimientos

Me gustarıa agradecer en primer lugar a mis padres, ya que sin ellos, no podrıa estardonde hoy en dıa estoy. A mis companeros de Ingenierıa, desde primer ano hasta los quecontinuaron conmigo hasta el ultimo ano, por su apoyo y carino.

Quiero agradecer al profesor Juan Velasquez por toda la confianza y paciencia que siempreentrega. Agradecer tambien por permitirme entrar al proyecto AKORI y al grupo de WI.Pero en especial, quiero agradecer por su apoyo constante en todo tipo de situaciones y sucarino como mentor y amigo.

Quiero agradecer a todo el equipo de La Salita por estar siempre apoyando cada una demis locuras. Agradecer tambien a todo el equipo del Laboratorio de Neurosistemas de laFacultad de Medicina, por la confianza y apoyo que me entregaron, en especial a el profesorEnzo Brunneti por todo su tiempo dedicado a mi trabajo, a Kristofher Munoz por apanarsiempre y por ultimo al profesor Pedro Maldonado por su excelente feedback y apoyo.

Finalmente, un gran Gracias para todos los que me acompanaron en este largo caminode la universidad.

Joaquın Nicolas Jadue Musalem

iii

Tabla de ContenidoResumen Ejecutivo i

Agradecimientos iii

1 Introduccion 11.1 Antecedentes Generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Descripcion del proyecto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.3 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3.1 Objetivo General . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.3.2 Objetivos Especıficos . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.4 Metodologıa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41.5 Contribuciones de la Memoria . . . . . . . . . . . . . . . . . . . . . . . . . . 61.6 Alcance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61.7 Estructura de la Memoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2 Marco Teorico 92.1 Dilatacion Pupilar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.1.1 Sistema Visual y Oculomotor . . . . . . . . . . . . . . . . . . . . . . 92.1.2 Pupila . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122.1.3 Sistema de Medicion . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.1.4 Dilatacion Pupilar y Procesos Cognitivos . . . . . . . . . . . . . . . . 172.1.5 International Affective Picture System (IAPS) . . . . . . . . . . . . . 17

2.2 Proceso KDD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182.2.1 Data Mining . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202.2.2 Tecnicas de Clasificacion . . . . . . . . . . . . . . . . . . . . . . . . . 212.2.3 Evaluacion de Metodos de Clasificacion [1] . . . . . . . . . . . . . . . 27

3 Experimento 303.1 Diseno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

3.1.1 Instrumentacion y Software . . . . . . . . . . . . . . . . . . . . . . . 303.1.2 Sitio Web e Imagenes . . . . . . . . . . . . . . . . . . . . . . . . . . . 333.1.3 Grupo Experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . 343.1.4 Protocolo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353.1.5 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3.2 Implementacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393.2.1 Sitio Web e Imagenes . . . . . . . . . . . . . . . . . . . . . . . . . . . 393.2.2 Grupo Experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . 413.2.3 Protocolos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 413.2.4 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4 Analisis y Resultados 444.1 Proceso KDD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4.1.1 Seleccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454.1.2 Pre-Procesamiento y Transformacion . . . . . . . . . . . . . . . . . . 474.1.3 Minerıa de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.2 Mapas de Calor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

iv

5 Conclusiones 585.1 Trabajo futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

Bibliografıa 61

v

Indice de Tablas

3.1 Caracterısticas SR Research Eyelink 1000. . . . . . . . . . . . . . . . . . . . 313.2 Lista de categorıa de objetos utilizados en el experimento con valencia netra

segun IAPS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4.1 Resultados clasificador binario. . . . . . . . . . . . . . . . . . . . . . . . . . 54

vi

Indice de Figuras

2.1 Detalle de componentes del globo ocular . . . . . . . . . . . . . . . . . . . . 102.2 Imagen de una pupila vista por una camara infrarroja . . . . . . . . . . . . . 122.3 Dilatacion pupilar en estudio de Bradley 2008 . . . . . . . . . . . . . . . . . 132.4 Tobii Eye-Tracker incorporada a un LCD . . . . . . . . . . . . . . . . . . . . 142.5 Scanpaths de 100 usuarios viendo un carrito de compras . . . . . . . . . . . 152.6 SAM: Self-Assessment Manikin . . . . . . . . . . . . . . . . . . . . . . . . . 182.7 Pasos del proceso Knowledge Discovery in Databases . . . . . . . . . . . . . 202.8 Esquema de los paradigmas de la minerıa de datos . . . . . . . . . . . . . . . 212.9 Ejemplo de arbol de decision. . . . . . . . . . . . . . . . . . . . . . . . . . . 222.10 Estructura de redes neuronales. . . . . . . . . . . . . . . . . . . . . . . . . . 242.11 Transformacion del hiperplano separador a traves de una funcion Kernel . . 27

3.1 Servidor anfitrion ejecutando software de calibracion. . . . . . . . . . . . . . 333.2 Ejemplo de pagina de eleccion para la categorıa bancas . . . . . . . . . . . . 363.3 Pagina de bienvenida de experimento . . . . . . . . . . . . . . . . . . . . . . 403.4 Sujeto de prueba conectado al eye-tracker realizando experimento. . . . . . . 42

4.1 Senal extraıda de mediciones con EyeLink . . . . . . . . . . . . . . . . . . . 454.2 Zoom a intervalo de un mosaico en senal extraıda . . . . . . . . . . . . . . . 464.3 Clusters formados por posicion (x,y) de experimento para sujeto 14 . . . . . 464.4 Correccion de artefactos producidos por parpadeos. . . . . . . . . . . . . . . 474.5 Eliminacion de offsets producidos por sacadas . . . . . . . . . . . . . . . . . 484.6 Zoom a la senal pupilar al aplicar filtro de altas frecuencias . . . . . . . . . . 494.7 Comportamiento donde se ve patron de sacada-fijacion asociado al id del objeto 494.8 Orden de asignacion de identificador a grilla de objetos en experimento . . . 514.9 Promedio inter-sujeto para curvas de decision y no decision de dilatacion

pupilar normalizada versus tiempo . . . . . . . . . . . . . . . . . . . . . . . 524.10 Promedio de todos los sujetos para curvas decision y no decision de dilatacion

pupilar normalizada versus tiempo . . . . . . . . . . . . . . . . . . . . . . . 534.11 Curva ROC del experimento utilizando redes neuronales como clasificador . . 554.12 Mapa de calor de fijaciones promedio de todos los sujetos para la categorıa

vestidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 564.13 Mapa de calor de dilatacion pupilar promedio de todos los sujetos para la

categorıa vestidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

vii

1 Introduccion

En este capıtulo se introduce al lector los distintos aspectos de este trabajo de tıtulo. Se

presentan los antecedentes generales del trabajo. Consiguiente se describe el proyecto, con

respecto al experimento, contexto y motivacion de su realizacion. Se describe el objetivo

general del trabajo, los objetivos especıficos necesarios para alcanzar el objetivo general y la

hipotesis a validar. Luego se detalla la metodologıa a utilizar y los resultados esperados en

base al alcance del proyecto. Finalmente, se muestra la estructura del informe de memoria.

1.1 Antecedentes Generales

¿Que tan importante es entender el comportamiento humano en los sitios Web? ¿Cuales

son las herramientas que tenemos a mano para analizar este comportamiento? ¿Cual es la

forma ideal de obtener estos datos tan abstractos? Las respuestas a estas preguntas nos

beneficiaran de distintas maneras. Primero, la compresion de los cambios del fenomeno Web

es esencial para poder reaccionar de forma eficiente a las distintas necesidades de los usua-

rios. Segundo, El uso correcto de distintas herramientas de analisis, permite tener distintos

enfoques que se puedan adaptar a distintas situaciones. Y por ultimo, un correcto analisis

permite tomar decisiones claves en la definicion de la estructura y el contenido de los sitios

Web. En particular, un mejor entendimiento del comportamiento del usuario nos permitira

realizar inferencias mas exactas acerca de como debemos estructurar los sitios y su contenido.

Si comenzamos con el analisis de datos web, un area de estudios en particular es la que

toma relevancia: Web Mining, que estudia las distintas maneras de extraer informacion de la

data generada por la Web . Esta area nace de la aplicacion de herramientas de Data Mining

al contenido originado en la Web, con el fin de obtener informacion valiosa para mejorar

la estructura, diseno y contenido de los sitios [2]. Para poder aplicar tecnicas de Data

Mining al contenido, en [3] son definidos los Web Objects como “cualquier grupo de palabras

estructuradas o un recurso multimedia, presente en una pagina web, que tenga metadata

que describa su contenido” y dentro de estos, los Website KeyObjects, definidos por [2],

que capturan la atencion de los usuarios y caracteriza el contenido de un sitio Web. El

reconocimiento de los Website KeyObjects permite redisenar el contenido y estructura de los

sitios con el fin de su mejoramiento continuo. Para esto, en [4] se define una metodologıa

para el reconocimiento de estos Website KeyObjects, pero, para aplicar la metodologıa, surge

1

la necesidad de reconocer el tiempo de permanencia de los usuarios en cada Web Object, por

lo que es necesario implementar herramientas para el reconocimiento de estos tiempos.

En [4] se propone el uso de encuestas y el proceso de Sesionalizacion, que permite recon-

struir las sesiones de usuario, donde las sesiones, son secuencias de paginas Web visitadas

por un usuario mientras navega por un sitio. Con estas dos herramientas, es posible estimar

el tiempo de permanencia en cada Web Object. Hoy en dıa, gracias al acceso a los archivos

de web log, no es difıcil reconstruir las sesiones, por lo que se logra estimar el tiempo de

permanencia en cada Web Object, pero las encuestas a usuarios, en las cuales se les pide

asignar puntaje a los Web Object dentro del sitio con el fin de definir su importancia, siguen

siendo subjetivas y poco fiables, por lo que las estimaciones no son muy exactas. Es por esto

que en [4] se ha sustituido las encuestas con el analisis de pupila a traves de la herramienta de

Eye-Tracking. La tecnologıa de Eye-tracking permite saber lo que la persona esta mirando en

funcion del tiempo [5], por lo que si asociamos lo que la persona esta mirando, a Key Objects,

podemos medir con mayor exactitud el tiempo de permanencia, sin depender de encuestas,

para luego identificar los Website KeyObjects con la metodologıa propuesta, logrando hasta

un 20% de mejora en la informacion encontrada utilizando un Eye-Tracker [2].

Lo ultimo abre nuevas posibilidades de aplicar distintas herramientas para la recoleccion

de datos de comportamiento humano para el analisis del comportamiento de los usuarios

en los sitios web. Dentro de estas herramientas se encuentra la aplicacion de un Electroen-

cefalograma mientras el usuario navega el sitio y combinar la informacion obtenida por la

Sesionalizacion, la aplicacion del Eye-Tracking y el Electroencefalograma, para ası detectar

con aun mayor precision la importancia de cada Website KeyObjects a traves de Web Mi-

ning. Por otro lado, existe la posibilidad de guardar en cada instante la dilatacion actual de

la pupila, otorgando informacion extra, antes nunca utilizada para el mejoramiento de sitios

web.

De ahı nace AKORI (de la sigla en ingles “Advanced Kernel for Ocular Research and

web Intelligence”), un proyecto FONDEF que se adjudico la Universidad de Chile, que tiene

como fin desarrollar una plataforma informatica basada en Web Intelligence y herramientas

de analisis de exploracion visual para la mejora de la estructura y contenido de sitios web.

Este proyecto une profesores, memoristas y alumnos de la Facultad de Ciencias Fısicas y

Matematicas (en particular el departamento de industrias) y la Facultad de Medicina (Centro

de Neurociencias Integradas), de la Universidad de Chile. El area de desarrollo es Tecnologıas

de la Informacion y Comunicacion, en conjunto con el area de Neurociencias.

Dada la metodologıa definida en [4], se propone en este trabajo de tıtulo, reconocer tomas

2

de decision a traves de la dilatacion pupilar, lo que, si es que existe una correlacion entre la

dilatacion pupilar y las tomas de decisiones, puede aportar con informacion relevante sobre

la importancia que puede tener un Web Object, con el fin de mejorar el ranking de estos

y ser mas eficaces para definir los Web Key Objects. Es por esto que, dado el objetivo del

proyecto AKORI de generar una metodologıa que permita el mejoramiento de paginas web

y los esfuerzos que se estan haciendo en conjunto con la Facultad de Medicina, el hecho de

mejorar la metodologıa de mejoramiento de sitios web, es clave para el resultado del proyecto.

El proyecto AKORI tiene el apoyo docente e instalaciones de la Facultad de Ciencias

Fısicas y Matematicas (FCFM) y del Centro de Neurociencias Integradas (CENI). Tambien

se adjudico un concurso de ciencia aplicada del programa IDeA de FONDEF-CONICYT

2012, otorgando $115.000.000 para cubrir costos de los experimentos, compra de maquinas y

sueldos. Con estos fondos son realizados los experimentos necesarios para validar las hipotesis

planteadas dentro del proyecto.

1.2 Descripcion del proyecto

Esta memoria tiene como objetivo aportar al proyecto AKORI, en el ambito de la toma

de decisiones de las personas, al momento de navegar por un sitio web, utilizando herramien-

tas de Eye-Tracking, dilatacion pupilar, estadıstica y minerıa de datos. Se busca detectar

una toma de decision antes de hacer un click en un sitio web, con el fin de aportar en los

conocimientos sobre el comportamiento de las personas.

Esta memoria analiza los cambios en la dilatacion de la pupila de sujetos de prueba,

mientras navegan a traves de paginas web. Mide en cada instante, a traves de herramientas

de Eye-Tracking y dilatacion de pupila, el punto el cual esta mirando el sujeto y el diametro

de su pupila. Se busca a traves de esto, aislar los cambios del diametro de la pupila que

predigan tomas de decisiones. Se define una toma de decision para esta memoria, como:

El acto visible en el cual el sujeto hace un click, en un instante de tiempo, sobre una de las

opciones presentadas, dada una instruccion previa de inspeccion visual libre y eleccion.

En base a los experimentos a realizar, se busca establecer una correlacion entre la toma de

decision y la pupila como marcador fisiologico, todo asociado al proceso de toma de decision,

ya que, en el caso de que la dilatacion pupilar sea una clase de marcador fisiologico, entonces

la dilatacion pupilar es util como predictor del evento. Finalmente la hipotesis a validar es

que:

3

“Los cambios del diametro de la pupila en el tiempo son una variable predictiva dependiente

relevante en las tomas de decision proximas.”

1.3 Objetivos

Este trabajo persigue los siguientes objetivos:

1.3.1 Objetivo General

El objetivo general del proyecto es:

Desarrollar una funcion clasificadora de tomas de decisiones, que permita encontrar pa-

trones de comportamiento de la pupila en usuarios web al momento de tomar una decision,

utilizando herramientas de estadıstica, Data Mining, Eye-Tracking y Dilatacion Pupilar.

1.3.2 Objetivos Especıficos

Los objetivos especıficos de este trabajo de tıtulo se listan a continuacion:

1. Recopilar y procesar informacion sobre el estado del arte del comportamiento de la

dilatacion de la pupila de usuarios web.

2. Analizar el estado del arte de los sistemas de eye-tracking.

3. Analizar el estado del arte del analisis de la dilatacion pupilar.

4. Desarrollar experimentos que permita encontrar patrones de comportamiento de la

pupila al tomar decisiones.

5. Definir la dilatacion pupilar como marcador fisiologico y variable predictiva en el tiempo

de la toma de decision.

6. Proponer metodologıa de mejoramiento de sitios web, dada la informacion obtenida y

procesada.

7. Analizar y concluir basado en los resultados y proponer investigacion futura.

1.4 Metodologıa

Busca alcanzar paulatinamente los objetivos especıficos recientemente planteados. Como

primer alcance se revisa los contenidos existentes sobre dilatacion pupilar, toma de decisiones

y los modelos de comportamiento del usuario web.

4

Como segundo paso, se utilizara el metodo cientıfico y analisis KDD [2.2]:

1. Formular hipotesis a validar: la fase donde se define el concepto que se quiere

revisar, utilizando el conocimiento y las herramientas que se poseen.

2. Comprension de los datos: esta etapa es donde se analizan los datos con el fin de

llegar a un entendimiento completo. Es tambien donde los requisitos de informacion

necesarios son definidos a desarrollar el experimento.

3. Disenar y proponer experimentos tentativos para validar la hipotesis: el

experimento se desarrolla con el fin de validar la hipotesis.

4. Hacer analisis de KDD a la datos

(a) Seleccion, limpieza, transformacion y procesamiento de datos obtenidos en experi-

mentos: en esta etapa se extrae la data obtenido por a traves del experimento, para

luego ser pre-procesada, limpiada y transformada. Dentro de la transformacion se

puede deducir nueva informacion a traves de la combinacion de variables.

(b) Aplicar proceso de minerıa de datos: esta etapa se aplican modelos de clasificacion

de una variable objetivo. En este caso la variable objetivo es la toma de decision.

(c) Interpretacion y evaluacion de los datos: en esta etapa se evaluan los resultados

del modelo aplicados en la etapa anterior, siempre en contexto de la validacion de

la hipotesis.

(d) Transformacion de datos/informacion a conocimiento: etapa de interpretacion y

evaluacion donde el conocimiento es descubierto.

5. Validar de la hipotesis: dado el conocimiento descubierto, se procede a validar la

hipotesis a traves de metodos estadısticos.

6. Generar conclusiones y propuestas de mejoramiento de sitios web.

Debido a que en este trabajo se utiliza una mezcla de metodologıas, los ajustes necesarios

para la metodologıa seran:

Primero entender cuales son los objetivos del proyecto para compararlos con los resultados

esperados. Tambien definir cual es el ambiente en el cual se deben desarrollar algoritmos y

experimentos, entiendo que tecnologıas y conocimientos se necesitan.

Luego, se realiza el experimento para capturar la data, tomando en cuenta los sujetos de

prueba que pueden participar de este, el tipo y cantidad de datos de salida y las herramientas

necesarias para el pre-procesamiento y tratamiento de los datos.

5

La siguiente etapa es el pre-procesamiento de los datos. Esto incluye la limpieza, selec-

cion y transformacion de variables. Luego, el analisis de los registros y la identificacion de

los outliers. Dentro de la limpieza de los datos, incluye el reconocimiento y extraccion de

los errores por parpadeos, fijaciones de mirada fuera de la pantalla, errores causados por

hardware, entre otros.

Lo siguiente es aplicar transformaciones a las series de tiempo de la dilatacion pupilar,

para rescatar mayor informacion de cada ensayo y definir las observaciones a utilizar.

Por ultimo, utilizando metodos de validacion estadıstica y minerıa de datos, se procede

a evaluar, comparar y concluir con la informacion rescatada, usando distintas estrategias

propuestas.

1.5 Contribuciones de la Memoria

Los resultados esperados de este trabajo de tıtulo son:

1. Obtencion de un estado del arte sobre el comportamiento de las personas asociado a

la dilatacion pupilar, sistemas de eye-tracking y metodos de clasificacion de minerıa de

datos.

2. Validacion de la hipotesis, es decir, conclusion que la dilatacion pupilar es un marcador

fisiologico de tomas de decisiones definidas en [1.2]

3. Generar reportes estadısticos y resultados de minerıa de datos, de los datos obtenidos

en los experimentos hechos.

4. Entregar informacion util al proyecto AKORI, sobre el estudio de dilatacion pupilar

y generar resultados con el fin de aportar en desarrollar una nueva metodologıa de

mejoramiento de paginas web.

5. Una discusion que detalle el analisis hecho y de los resultados obtenidos y propuestas

futuras.

1.6 Alcance

El alcance de este proyecto de tesis es desarrollar completamente la validacion de la

hipotesis planteada. El resultado de la validacion de la hipotesis esta sujeto al experimento

que se realizara. Es decir, se utilizara solo una fuente experimental para obtener datos a

estudiar, por lo que queda abierto a otros estudios para poder revalidar la hipotesis.

6

Por otro lado, se utilizaran 3 metodos de minerıa de datos de clasificacion, con el fin de

comparar y llegar a un resultado mas robusto. Esto, debido a que el tiempo de procesamiento

y limpieza de datos es extenso y complejo para cada metodo distinto de validacion y obtencion

de resultados.

Cabe destacar que no se esta estudiando el proceso cognitivo detras de una toma de

decision, sino que se esta utilizando un marcador fisiologico para predecir el comportamiento

del sujeto en la exploracion. No se esta haciendo biologıa ni se quiere entender el proceso

de una toma de decision, simplemente, se debe mostrar que la pupila se comporta distinto

cuando la gente toma decisiones.

Por otro lado, no se esta estudiando el criterio por el cual los sujetos tomaran las decisio-

nes, se esta analizando la toma de decision de hacer click. Todas las razones de la decision

ensucian el predictor, sin embargo al mezclar todas las posibles razones por la cual las perso-

na decide, en el caso que se obtenga un resultado positivo, se logra un factor comun generico

de la decision de click. Esto, en base a que los criterios de decision, como factores, se toman

como parte de la varianza, donde en un numero suficiente de registros, se anula.

Tambien se considera que se deja fuera las componentes emocionales, a traves de la

construccion correcta del experimento.

Por ultimo, en el ambito tecnico, hay que destacar que los datos y la informacion relacio-

nada a la tecnologıa de eye-tracking y analisis se obtendra utilizando el equipo proporcionada

por la Universidad de Chile. Equipos externos son necesarios dependiendo de los recursos

disponibles para el proyecto. Por esta razon, este proyecto de memoria tiene como objetivo

validar la hipotesis planteada que utilizando no solo tecnologıa de punta, sino que tambien

las que esten disponibles para uso de los estudiantes.

1.7 Estructura de la Memoria

El resto del documento se estructura de la siguiente manera. En primer lugar, en el

Capıtulo 2 se explica el marco conceptual del proyecto de tıtulo. Se entrega las definiciones

y explicaciones necesarias usadas durante el desarrollo de este documento y que son usadas

mas adelante en la lectura de los siguientes capıtulos. Entre los conceptos que se explican son

el movimiento ocular, estımulos visuales, respuesta pupilar, tomas de decisiones, sistemas de

eye-tracking, proceso KDD y tecnicas de clasificacion de minerıa de datos.

Luego en el capıtulo 3, el diseno y requerimientos del experimento seran explicados, y

todas las componentes necesarias para reproducirlo. El equipo tecnico necesario, el desarrollo

7

del experimento a nivel web e imagenes, se caracteriza el grupo experimental deseado, el

protocolo a utilizar y la naturaleza de los datos de salida. A continuacion se explica en

profundidad la implementacion del experimento en base a lo disenado. Se revisaran conceptos

sobre el conjunto de sujetos de prueba habilitados para ser parte del experimento.

El capıtulo 4 detalla el pre-procesamiento, limpieza y transformacion de los datos, previo

a analisis y uso de modelos de minerıa de datos o estadısticos. Tambien resultados obtenidos

a traves del experimento, validacion de la hipotesis y desarrollo de un clasificador a traves

del proceso KDD.

Finalmente, en el capıtulo 5 se presentan las conclusiones del proyecto, basado en los

resultados obtenidos y en la previa investigacion hecha. Tambien se plantean nuevos enfoques

para continuar los estudios sobre el tema y como es posible mejorar este experimento.

8

2 Marco Teorico

Este capıtulo busca entregar al lector una explicacion clara de los conceptos basicos y

esenciales para los cuales esta desarrollado este trabajo de tıtulo. Esto involucra un breve

resumen de los conceptos centrales y definiciones, que son utilizados en la lectura. La pri-

mera seccion hace referencia a la dilatacion pupilar, los componentes del ojo y los metodos

de medicion de este. A continuacion se relata sobre la base de datos de IAPS (Internatio-

nal Affective Picture System), para terminar con el proceso KDD (Knowledge Discovery in

Databases).

2.1 Dilatacion Pupilar

La principal caracterıstica que estudia este trabajo de tıtulo, son los cambios de dilatacion

pupilar en los sujetos mientras realizan tareas asociadas a tomas de decision. Es por esto que

esta seccion desarrolla el sistema donde ocurre la dilatacion de la pupila. Primero describe

los componentes del sistema visual, comportamiento de la pupila, los sistemas de medicion

pupilar y por ultimo la relacion entre la dilatacion pupilar y las tomas de decisiones.

2.1.1 Sistema Visual y Oculomotor

El sistema visual esta compuesto por el bulbo ocular (globo ocular), los anexos oculares, la

cavidad orbitaria, y la vıa optica comprendida desde el ojo hasta la corteza y sus respectivas

areas de asociacion [6]. En particular, dado el interes de este trabajo sobre la dilatacion

pupilar, esta seccion se centra en el globo ocular y los anexos oculares. A continuacion se

presentan los componentes principales del ojo [7]:

1. Globo Ocular: Es una estructura semiesferica, cavitadad. Esta compuesto principal-

mente por tres capas concentricas: Tunica fibrosa, la Tunica vascular o uvea y Tunica

nerviosa o retina.

2. Cornea: Es el principal poder dioptrico del bulbo ocular, siendo su diametro horizontal

ligeramente mayor al vertical. Su forma es prolata, es decir mas curva en el centro que

en la periferia, y su espesor central es menor que hacia la periferia. Es transparente y

refracta la luz que pasa a traves de ella.

9

3. Esclera: Membrana de aspecto blanco nacarado, de poca elasticidad, escasamente

celular. Es la encargada de dar la forma y proteger los componentes internos del globo

ocular.

4. Coroides: Membrana ubicada desde el margen del disco optico por posterior y la ora

serrata por anterior. Su funcion es proveer nutrientes a los componentes del globo

ocular y mantener la temperatura constante.

5. Pupila: Esta ubicada en el centro del iris, por lo que permite que entre la luz al globo

ocular. Es una estrucutra que puede dilatarse y contraerse, por lo que su funcion es

regular la cantidad de luz que recibe la retina.

6. Cuerpo Ciliar: comprendido entre la ora serrata por posterior y la raız del iris por

anterior. Esta constituido por el musculo ciliar, los procesos ciliares y la zonula ciliar.

7. Iris: corresponde a un verdadero diafragma que regula el paso de la luz hacia la retina,

a traves de un orificio central llamado pupila. Se inserta a traves de la llamada raız del

iris en el espolon escleral y el cuerpo ciliar.

8. Retina: Se extiende desde los margenes del disco optico o papila (punto de salida del

nervio optico del bulbo ocular) hasta la ora serrata por anterior. Desde la ora serrata

hasta la golilla pigmentaria solo continua el EPR, constituyendo la llamada retina no

visiva, la cual reviste internamente al cuerpo ciliar y al iris. La luz que llega a la retine

crea ua secuencia de fenomenos quımicos y electricos que son enviados como impulsos

al cerebro a traves del nervio optico.

La ubicacion de estas componentes son descritas en la figura 2.1.

Figuras 2.1: Detalle de componentes del globo ocularFuente: Imagen de [6].

10

Para tratar un objeto especıfico o la posicion en un estımulo visual, las personas tienen

que mover sus ojos, por cuanto la agudeza de la retina del ojo humano cae rapidamente cae

con el diametro de la fovea, que es la parte central y mas sensible de la retina directamente

en frente de la lente, con una alta concentracion de celulas fotorreceptoras sensibles al color.

Esto hace interesante estudiar movimientos de ojo como los indicadores de comportamiento

de adquisicion de la informacion [8].

Cabe destacar que aun cuando el sistema visual esta compuesto por dos organos receptores

(ambos ojos), el sistema solo recibe una unica imagen. Esto se consigue haciendo que ambos

ojos miren un mismo objeto. Los ojos se mueven al unısono en la orbita debido a un fino y

delicado mecanismo oculomotor [9].

Dado que se esta buscando metodologıas de recoleccion de informacion sobre el com-

portamiento humano, en particular de los usuarios Web, si los ojos nos pueden otorgar la

informacion de cuando se toma la decision de dejar de tomar atencion a un Web Object,

se vuelve bastante interesante el estudio del movimiento ocular, para estimar tiempos de

permanencia en cada estımulo. Dado que cada Web Object esta limitado por un grupo de

pixeles, podemos saber, con gran exactitud, cuanto tiempo un usuario web ha visualizado

parte de la pagina [2].

Segun [10] los movimientos en nuestros ojos son dos componentes bastante distintas:

Fijaciones y Sacadas. Las sacadas son saltos rapidos de nuestros ojos, que duran cerca de 20

a 40 ms, que sirven para proyectar lugares especıficos de una escena en la fovea, de hecho,

las sacadas son los movimientos mas rapidos en el cuerpo humano y se hacen hasta siete mil

de ellos al dıa. Las fijaciones, en cambio, son los momentos en que el ojo esta relativamente

quieto. Estas detenciones duran hasta 500 milisegundos [11]. Durante una fijacion, parte

de la escena es proyectada en la fovea para su procesamiento. Las fijaciones se pueden ver

como muchas fotos que el cerebro procesa y las une formando una especie de video, dando

la sensacion de continuidad visual.

Dado un momento en el tiempo, solo el 8% del campo visual es proyectado en la fovea y

disponible para un procesamiento en detalle. Sin embargo, aunque se envıe mas informacion

de la que el cerebro puede procesar, el ser humano ha evolucionado mecanismos de atencion

para procesar solo un subconjunto de informacion relevante para un mejor procesamiento.

En otras palabras, una vez que el cerebro elige un objeto o lugar de interes, todo el resto

es automaticamente excluido del procesamiento, para alivianar el proceso. Es por esto que,

algunos estımulos visuales pueden influenciar mas la atencion. De esta manera, un objeto

o estımulo visual aparece instantaneamente en la primera fijacion visual, si es que en el

11

pre-procesamiento de la atencion, hubo alguna caracterıstica perceptual que resalto frente

a las demas. Dentro de estas caracterısticas basicas perceptuales, se encuentran los colores,

esquinas, luces, formas y tamanos en la escena. Debido al pre-procesamiento que el cerebro

realiza, la percepcion de estas caracterısticas es involuntaria, es decir, inevitable.

2.1.2 Pupila

El diametro de la pupila y su dinamismo es controlado por dos caminos sinergicos que ope-

ran en los suaves musculos de la pupila: El camino parasimpatico es regulado por el complejo

oculomotor Edinger Westphal en el cerebro medio e inerva el esfınter que es el musculo circu-

lar responsable de su constriccion. El camino simpatico, regulado por el hipotalamo, inerva

el musculo dilatador radial del iris responsable de su dilatacion. Excitaciones simpaticas son

causadas por la dilatacion pupilar [12].

Tambien esta vastamente documentado que procesos cognitivos inhiben el nucleo Edinger

Westphal causando la relajacion del musculo esfınter, contribuyendo a la dilatacion de la

pupila [13]. Informacion sensorial visceral, somatica y asociada al olfato, estan todas relacio-

nadas con el hipotalamo y convergen en el sistema de fibra somatico eferente. Es sabido por

decadas que producen una dilatacion pupilar. En la figura 2.2 se como la pupila es vista a

traves de una camara infraroja.

Figuras 2.2: Imagen de una pupila vista por una camara infrarrojaFuente: Imagen de [14].

El comportamiento de la pupila ha demostrado estar correlacionada con diversos estados

12

del ser humano, tales como estres, valencias emocionales y tomas de decisiones ası como

tambien estımulos comunes como variaciones de luminancia del entorno [15] [16]. Se puede

ver en investigaciones recientes que el tamano de la pupila y conductas asociadas generan un

marcador fisiologico interesante que manifiesta de manera externa diversas variables internas

de un ser humano, pero esto a la vez es un arma de doble filo ya que son tantos los estımulos

que influyen en la respuesta pupilar que se debe ser cuidadoso al momento de experimentar y

formular hipotesis respecto a su conducta: se debe asegurar que cada experimento aısle de la

mejor manera posible el o los estımulos a estudiar y evitar la contaminacion de la respuesta

por estımulos ajenos. En la figura 2.3 se como la pupila reacciona distinto frente a varios

niveles de luminancia.

Figuras 2.3: Dilatacion pupilar en estudio de Bradley 2008Fuente: Imagen adaptada de [17].

Dentro de las caracterısticas tıpicas de la respuesta pupilar frente a estımulos: primero

cabe notar que esta suele ser una respuesta relativamente lenta a estımulos, del orden de

los segundos, lo cual limita en parte su estudio debido a que estımulos cercanos rapidos

no producen figuras separadas. En segundo lugar se puede notar que existe una tıpica

contraccion para un tiempo cercano a 1 [s] que luego se va atenuando en el tiempo, este

comportamiento es la tıpica reaccion frente a estımulos para la pupila [18].

13

2.1.3 Sistema de Medicion

Funcionamiento

Dado un estımulo, una combinacion de fijaciones y sacados se le llama un Scanpath [19].

El Eye-Tracker graba los Scanpath que los sujetos de prueba ejecutan, dado un estımulo

visual. El Eye-Tracker mas tıpico para propositos comerciales, es el que usa la metodologıa

de la reflexion infrarroja de la cornea, que mide la distancia y el angulo de reflexion de

luz infrarroja del centro de la pupila a un determinado punto de fijacion de una persona,

claramente, despues de haberlo calibrado [20].

Figuras 2.4: Tobii Eye-Tracker incorporada a un LCDFuente: Imagen de [21].

Desde camaras incorporadas a LCDs 2.4 a estructuras donde el usuario no puede mover

libremente la cabeza, son los sistemas de Eye-Tracking. Entre las caracterısticas mas impor-

tantes que definen la calidad de un Eye-Tracker son: costo, libertad de movimiento de cabeza,

tiempo de calibracion, condiciones de exposicion natural, diferencias de luz, posibilidad de

utilizacion con anteojos, output de datos, software asociado, entre otras [22].

14

Figuras 2.5: Scanpaths de 100 usuarios viendo un carrito de comprasFuente: Imagen de [14].

Tecnicas de Eye-Tracking

Segun [2], se han desarrollado 3 tecnicas distintas para la obtencion de los datos de un

Eye-Tracker.

Electrooculografıa: En los 1950s, segun [23] la electrooculografıa era la tecnica de eye-

tracking mas usada. Estaba basada en la medicion de los cambios de potencial electrico en

la piel a traves del uso de electrodos localizados alrededor de los ojos. Esto es posible ya

que la cornea se mantiene algunas decimas de mV mas positiva que la retina, lo que produce

la diferencia de potencial que es medida, y que varıa de acuerdo al movimiento de los ojos.

Este tecnica mide la posicion relativa de los ojos con respecto a la cabeza; por lo tanto, no

es apropiado para calcular el punto de atencion [24]

Lentes de Contacto Esclerales: Esta tecnica consiste en adjuntar una fuente optica

o mecanica, a unos lentes de contacto para ser usados directamente en los ojos. Es necesario

que el lente de contacto sea particularmente grande, por lo que se extiende sobre la cornea

y la esclerotica, una membrana de color blanco, gruesa, resistente, rica en fibras de colageno

15

que cubre al ojo, ya que ası reduce la posibilidad de moverse a traves del ojo [25]. Diferentes

tipos de fuentes de lentes de contacto han sido utilizadas, siendo la mas comun un pequeno

rollo, el cual puede colocarse externamente, aplicando un campo electromagnetico. Mientras

que es una de las tecnicas mas precisas para medir los movimientos oculares, tambien es la

mas invasiva, por lo que causa molestias mientras se esta usando.

Reflexion de la Cornea y Centro de la Pupila en Video: Esta es la tecnica de

Eye-Tracking que mas se usa en estos dıas. Consiste en un computador de escritorio estandar

con una camara infrarroja montada debajo del monitor, con un software de procesamiento

de imagenes para localizar e identificar la reflexion de la cornea y el centro de la pupila. Con

estas caracterısticas, es posible disociar movimientos oculares de la posicion de la cabeza, lo

que hace posible calcular los puntos de atencion de los usuarios [26].

Representacion de los Datos

En terminos generales, una vez que el Eye-Tracker ha rastreado la data de la retina, el

software crea un vector de informacion con un conjunto de los parametros medidos. La data

que se obtiene con el Eye-Tracker se puede resumir como lo siguiente:

1. Timestamp: Fecha y hora en milisegundos cuando la data fue reunida.

2. Gaze Point X Left: Posicion horizontal en la pantalla que el ojo izquierdo esta

observando.

3. Gaze Point Y Left: Posicion vertical en la pantalla que el ojo izquierdo esta obser-

vando.

4. CamX Left: La ubicacion horizontal de la pupila izquierda en la imagen de la camara.

5. CamY Left: La ubicacion vertical de la pupila izquierda en la imagen de la camara.

6. Distance Left: Distancia en milımetros desde el Eye-Tracker al ojo izquierdo.

7. Pupil Left: Diametro del ojo izquierdo en milımetros.

8. Gaze Point X Right: Posicion horizontal en la pantalla que el ojo derecho esta

observando.

9. Gaze Point Y Right: Posicion vertical en la pantalla que el ojo derecho esta obser-

vando.

10. CamX Right: La ubicacion horizontal de la pupila derecha en la imagen de la camara.

11. CamY Right: La ubicacion vertical de la pupila derecha en la imagen de la camara.

12. Distance Right: Distancia en milımetros desde el Eye-Tracker al ojo derecho.

16

13. Pupil Right: Diametro del ojo derecho en milımetros.

2.1.4 Dilatacion Pupilar y Procesos Cognitivos

No solo los estımulos luminosos, como reflejo de sistema parasimpatico resultan con una

dilatacion o contraccion pupilar. Tambien, muchos procesos cognitivos resultan en el cambio

del diametro pupilar [27]. A medida que la tarea se hace mas demandante en trabajo y

tiempo, el diametro de la pupila aumenta. Mas aun, si las demandas de procesamiento por

parte del sujeto son continuas, la dilatacion pupilar se mantendra [28]. Tales dilataciones

son asociadas a regiones del cerebro que tienen la habilidad de mantener la atencion sobre la

tarea y el procesamiento de informacion [29].

En base a los experimentos hechos por [30], un aumento en la complejidad de la tarea,

esta asociado a una mayor dilatacion pupilar. En particular, esto se intensifica, al aumentar

la cantidad de luz, debido a que el sistema parasimpatico esta mas activo. Lo contrario

sucede bajo una intensidad lumınica menor, ya que el sistema parasimpatico se inhibe.

Las dilataciones pupilares ocurren en pequenas latencias, al comienzo del proceso co-

gnitivo y disminuyen rapidamente a medida que el proceso termina. Se puede utilizar la

dilatacion pupilar como forma de medicion de el esfuerzo mental que se hace para realizar

un tarea cognitiva [27]. Por otro lado, se puede explicar que la dilatacion sea mas fuerte

en tareas mas difıciles que en tareas faciles, debido a la necesidad inmediata de la actividad

cerebral de prepararse para realizar una operacion mental.

2.1.5 International Affective Picture System (IAPS)

El International Affective Picture System (IAPS) es una base de datos compuestas por

distintas imagenes categorizadas por rango de emociones. Fue desarrollada por el Instituto

Nacional de Salud Mental para la Atencion y Emociones en la Universidad de Florida. Esta

base de datos normalmente se utiliza para realizar estudios de medidas fisiologicas o neu-

rologicas. Consta con una gama variable de tipo de imagenes, tales como muebles, animales

o personas mutiladas.

La base de datos IAPS fue construida con el fin de normalizar los estımulos emociona-

les para experimentos e investigaciones sobre la atencion y emocionalidad. Segun [31], la

existencia de este registro permite:

1. Permitir mejor control experimental en la seleccion de estımulos emocionales

17

2. Facilitar la comparacion de resultados de distintos estudios realizados en el mismo o

distinto laboratorio.

3. Alentar y permitir replicas exactas dentro y a lo largo de laboratorios de investigacion

que evaluan problemas basicos aplicados en la ciencia psicologica.

Esta base de datos fue desarrollada a traves de una tarea que consistıa en clasificar 1000

imagenes distintas. Las imagenes son presentadas a distintos sujetos, y a traves del metodo

SAM (Self-Assessment Manikin) [32], califican cada imagen en una escala de 1 a 9 ordenada

por niveles de valencia y excitacion emocional.

Figuras 2.6: SAM: Self-Assessment ManikinFuente: Imagen adaptada de [32].

2.2 Proceso KDD

El proceso de extraccion de informacion de fuentes gigantes de datos es conocido como

Knowledge Discovery in Databases(KDD) y fue definido por [33] como el proceso no trivial

de identificar patrones validos, originales, utiles y entendibles sobre los datos. El proceso

KDD segun [1], es definido como un proceso iterativo, pero secuencial, que involucra varios

pasos, los cuales es posible ir y volver de un paso, de ser necesario.

Dado este proceso, se puede relacionar pasos que tienen relacion con el pre-procesamiento

de los datos, es decir, preparar y limpiar los datos a utilizar, y el post-procesamiento, que

involucra la evaluacion e interpretacion de los datos, obtenidos por los distintos modelos de

minerıa de datos, el paso central del proceso KDD. La aplicacion de la minerıa de datos,

18

permite encontrar patrones de interes, tales como clusters, outliers, reglas de clasificacion,

arboles de decision, reglas de asociacion, regresiones, entre otras.

A continuacion se presentan los distintos pasos del proceso KDD:

1. Seleccion de los Datos: En esta etapa se elijen los datos a estudiar, siendo general-

mente un muestra del universo de datos disponibles. Para hacer la eleccion de datos, es

necesario analizar los requerimientos y objetivos del proyecto desde el punto de vista de

un experto del negocio, ya que una mala decision puede llevar a resultados de prueba

erroneos.

2. Pre-Procesamiento de Datos: Un procesamiento de los datos es hecho a traves de

software de limpieza efectuar reduccion del ruido, manejar valores faltantes, mantener

la varianza, etc. Despues de este proceso de limpieza, se obtiene un conjunto de datos

limpios.

3. Transformacion: Es el proceso de transformacion de variables con el fin de estanda-

rizar los datos y generar nueva informacion de estos. Es posible a traves de metodos

de categorizacion o aplicar funciones logarıtmicas para disminuir el orden de variables

numericas. A traves de la transformacion se puede lograr generar nuevas variables, a

traves de la combinacion de ella. La salida de esta etapa es una base de datos refinada,

lista para ser aplicado un modelo.

4. Minerıa de Datos: Es la etapa donde se aplican los modelos de minerıa de datos

sobre la base de datos limpia y transformada. Esta etapa es el centro del proceso

KDD la aplicacion de modelos permite el descubrimiento de patrones en los datos.

Desde de definir objetivo en el proceso, diferentes algoritmos pueden ser aplicados para

encontrar informacion y patrones relativos a los objetivos previamente planteados. La

seleccion de los algoritmos es clave para el exito de esta etapa, por lo que depende

directamente de los objetivos del proyecto, siendo unos objetivos, mas importantes que

otros. Estos algoritmos permiten diferentes funciones ser aplicadas a los datos tales

como agrupaciones de datos, clasificacion, regresiones, predicciones, entre otras. En

esta etapa tambien es comun aplicar pruebas de rendimiento de los modelos aplicados,

con el fin de comparar precision entre los distintos modelos aplicados y verificar los

resultados.

5. Interpretacion y Analisis: Aca es donde los resultados del proceso anterior son

obtenidos. Estos resultados son los que permiten descubrir conocimiento a traves de

los datos brutos iniciales. En esta etapa la opinion de una experto del rubro es esencial

para validar los resultados, ya que el es el mas adecuado para revisarlos y verificar la

utilidad y la validez del conocimiento generado.

19

En la figura 2.7 se describe graficamente cada uno de los pasos del proceso KDD.

Figuras 2.7: Pasos del proceso Knowledge Discovery in DatabasesFuente: Imagen de [33].

2.2.1 Data Mining

Para elegir que tipo de minerıa de datos se debe utilizar, es necesario tomar en cuenta en

las metas que se propusieron al utilizar el proceso KDD y en los pasos previos a la utilizacion

de minerıa de datos. Existen 2 grandes metas al momento de descubrir a traves de la minerıa

de datos: prediccion y descripcion. La prediccion normalmente es asociada a los metodos

supervisados de minerıa de datos, mientras que la minerıa de datos descriptiva, hace referencia

a los metodos no supervisados y a la visualizacion. La mayorıa de los metodos de minerıa

de datos se basan en el aprendizaje inductivo, donde los modelos son construidos a traves de

entrenamiento con datos, con el fin de que los modelos desarrollados, sean aplicables a casos

futuros [1].

En esta seccion se centra en los distintos metodos supervisados de minerıa de datos. En

particular, los metodos que se especializan en la clasificacion de observaciones.

Los metodos supervisados son metodos que intentan descubrir la relacion entre los atribu-

tos de entrada (variables dependientes) y un atributo objetivo (variable independiente). La

relacion encontrada se representa a traves de una estructura llamada modelo. Los metodos

supervisados se utilizan y son implementados en varias areas tales como marketing, finanzas

o inteligencia de negocios.

Los dos principales modelos de los metodos supervisados son los modelos de clasificacion

(clasificadores) y los modelos de regresion. Los modelos de regresion, se especializan en

mapear la entrada de los datos, en base a sus caracterısticas, en un dominio real (variables

20

continuas). En cambio, los modelos de clasificacion, permiten mapear la entrada de datos, en

un espacio con clases pre-definidas (variable objetivo discreta). Debido a la gran aplicabilidad

de los clasificadores, estos modelos son los mas estudiados [1].

En cuanto a los modelos de clasificacion, se puede encontrar un set de tecnicas como

clasificadores, tales como support vector machines (SVM), arboles de decision, regresio-

nes logısticas, funciones algebraicas, entre otras. Un clasificador, se entrena a traves de

aprendizaje inductivo, con un set de datos con el fin de luego predecir datos futuros.

Figuras 2.8: Esquema de los paradigmas de la minerıa de datosFuente: Imagen adaptada de [1].

2.2.2 Tecnicas de Clasificacion

Esta seccion explica las tecnicas principales de minerıa de datos para los modelos de

clasificacion.

Arboles de decision [1]

Los arboles de decision son clasificadores expresados como una particion recursiva de la

del espacio de datos. Se compone por distintos tipos de nodos, que componen a un arbol

con raıces. Es un arbol direccionado, donde tiene un nodo raız que no tiene otros nodos que

le apunten. Todos los demas nodos tienen solo 1 nodo que apunten a ellos. Los nodos que

21

apuntan a otros, fuera del nodo raız, son llamados nodos internos. Todos los demas nodos

son llamados nodos hoja.

Los nodos internos dividen el espacio en 2 o mas sub-espacios, reduciendo la dimensio-

nalidad del problema, en una funcion discreta de los valores de los atributos de entrada.

Cada division del espacio, generalmente particiona acorde al valor del atributo. En el caso

de atributos numericos, es posible utilizar rangos para la particion.

Los nodos hoja estan asociados a cada clase y representan al valor de la caracterıstica

objetivo mas apropiada. Tambien es posible asignar a cada nodo hoja, un vector de probabi-

lidad indicando la probabilidad de un atributo de tomar cierto valor. Las nuevas instancias

para ser clasificadas, deben recorrer el arbol desde el nodo raız, hasta una de los nodos hoja,

que representa una de las clases. En la figura 2.9 se puede observar un ejemplo de un arbol

de decision.

Figuras 2.9: Ejemplo de arbol de decision.Fuente: Imagen adaptada de [1].

Los arboles de decision incluyen tanto atributos nominales como atributos numericos, ya

que cada particion al pasar por un nodo interno hara un test que consultara a que camino

debe seguir. En base a este clasificador, los analistas pueden predecir los comportamientos de

cada observacion, utilizando sus distintas caracterısticas y recorriendo el arbol desde arriba

hacia abajo. Cada nodo interno del arbol de decision, es etiquetado con el atributo que

prueba y las ramas del arbol son etiquetadas con los valores correspondientes.

Los algoritmos que construyen modelos de clasificacion basado en arboles de decisiones,

tienen como objetivo minimizar el error generalizado, a traves del orden correcto de los test

de los nodos internos, es decir, de la estructura del arbol. Tambien es posible definir la

estructura del arbol, en base a otros objetivos, tales como definir una cierta cantidad de

22

nodos, minimizar esa cantidad, minimizar la profundidad del arbol completo, entre otras

maneras.

Un tıpico algoritmo de entrenamiento de modelos de arboles de decision, de arriba hacia

abajo, es la utilizacion del metodo de crecimiento y poda. Estos algoritmos son construidos

de manera recursiva, a traves del metodo de dividir y conquistar. En cada iteracion, el

algoritmo considera el resultado de la funcion discreta de los atributos de entrada, elige la

mejor y selecciona en una particion apropiada. Esto se repite hasta que las nuevas particiones

no generen una ganancia o hasta algun tipo de criterio de detencion, predefinido.

El modelo debe elegir cual es el mejor atributo para particionar el arbol y ası elegir la

mejor estructura de clasificacion, en base a las metas del clasificador. En [1] se describe el

algoritmo de arriba hacia abajo para el entrenamiento del modelo de arboles de decision.

Redes Neuronales [1]

Las redes neuronales son modelos de computo para procesar informacion y son utiles para

identificar las relaciones fundamentales dentro de un set de variables o patrones en los datos.

Las redes neuronales pueden ser utilizadas como clasificadores debido a su gran capacidad

de modelar y reconocer patrones. Las redes neuronales se adaptan muy bien a los problemas

reales, debido a que son modelos no lineales, permiten resolver problemas que tienen patrones

imprecisos o tienen datos incompletos o existe demasiada informacion.

En cuanto a clasificacion, nos centraremos en las redes neuronales MLP (multi-layer

perceptron), que son las mas utilizadas y estudiadas. Las MLP son ideales para modelar

relaciones entre un set de variables de entrada y una o mas variables de salida.

Las MLP es una red compuesta por un gran numero de unidades interconectadas llamadas

neuronas. Estas neuronas estan organizadas en capas. Cada neurona dentro de una capa,

realiza un tarea simple en base a la informacion que recibe desde las neuronas conectadas a

su entrada y entrega los datos procesados a traves de su salida.

El conocimiento obtenido en el proceso de entrada y salida para cada neurona en las

distintas capas, es guardada en los pesos asociados a cada neurona. Aunque cada neurona

implementa su funcion de forma lenta e imperfecta, la red neuronal en conjunto puede realizar

tareas difıcil de forma rapida y eficiente.

Una red neuronal se compone por distintas capas, las cuales estan ordenadas en capas de

entrada, capas escondidas y capas de salida 2.10:

23

1. Las neuronas que se encuentran en la capa de entrada, corresponden a cada una de

las caracterısticas de los datos de entrenamiento. Estas neuronas son pasivas, es decir,

no hacen procesamiento, pero estan encargadas de recibir los patrones de los datos y

entregarlos a las siguientes neuronas de las capas escondidas.

2. Las neuronas que se encuentran en la capa escondida, estan conectadas a las neuronas

de las capas de entrada y de salida. El objetivo principal de estas neuronas intermedias,

es aprender los patrones y mapear la relacion entre los datos de entrada y lo de salida.

Es posible tener mas de 1 capa intermedia, para problemas con patrones mas complejos.

3. Las neuronas que se encuentra en la capa de salida, representan cada una de las clases a

clasificar. En general no entregan retroalimentacion a las capas anteriores, pero existen

metodos de retro-alimentacion que permiten mejorar los modelos.

Figuras 2.10: Estructura de redes neuronales.Fuente: Imagen adaptada de [1].

Las neuronas de las capas escondida y capas de salida, procesan la informacion que

reciben a traves de dos pasos. Primero la informacion de entrada que recibe cada neurona,

es combinada a traves de una suma ponderada de los valores de entrada con los pesos de las

neuronas conectadas, utilizando la ecuacion 2.1 para obtener el valor de salida de la neurona

n.

Salidan = f(∑i

wixi) (2.1)

24

El siguiente paso es transformar ese valor de salida a traves de una funcion de transferen-

cia. Las funciones de transferencia mas utilizadas son la sigmoideal 2.2, la hiperbolica 2.3, la

del seno o coseno 2.4 y la lineal 2.5:

f(x) =1

1 + exp−x (2.2)

f(x) =expx− exp−x

expx + exp−x (2.3)

f(x) = sinx

f(x) = cos x(2.4)

f(x) = x (2.5)

A continuacion, se deben entrenar los parametros de los nodos de la red. Los valores

iniciales de la red son elegidos al azar y a traves del entrenamiento de cada iteracion, cambian

estos valores. Este entrenamiento es conocido como backpropagation.

La idea de este metodo es darle direccion al entrenamiento, con el fin de disminuir el error

de la red en cada iteracion, hasta llegar a un error mınimo. Cada iteracion tiene el nombre

de epoca. En general, en base a la cantidad de nodos y el tamano de la red, son necesarias

varias epocas para llegar a un error deseado.

Regresiones Logısticas [34]

Las regresiones logısticas son un metodo supervisado de minerıa de datos, similar a las

regresiones lineares multiples, pero permiten trabajar con variables dependientes categoricas.

El proposito de este analisis es estimar la probabilidad de pertenecer a cada clase. Por otro

lado, permite determinar que variables pesan mas en la determinacion de la clase.

En los casos de clasificacion binaria, si la probabilidad de una instancia de estar en una

clase es superior al 50%, entonces se asigna esa clase a esa instancia. Las regresiones logısticas

suponen que la variable dependiente es lineal en los coeficiente de las variables independientes.

25

Sea x ∈ <n el vector que denota las variables explicativas de cierto conjunto de datos

y sea y ∈ {−1,+1} el valor asociado a la clase binaria a clasificar. El modelo de regresion

logıstica esta definido por 2.6:

f(x) =1

1 + exp−βτx(2.6)

donde βτ el vector de parametros de la regresion logıstica. Si el valor de f(x) es mayor a

0.5, entonces y = 1 si no, y = −1.

La regresion logıstica se basa en entrenar los parametros βτ a traves de una funcion de

costo definida en 2.7. Es comun encontrar que la regresion logıstica se sobre-ajusta a los

datos de entrenamiento, por lo que es usual utilizar un parametro de regularizacion λ para

evitar este sobre-ajuste, como se puede observar en la ecuacion 2.8.

J(θ) = − 1

m[m∑i=1

y(i)loghθ(x(i)) + (1− y(i))log(1− hθ(x(i)))] (2.7)

J(θ) = − 1

m[m∑i=1

y(i)loghθ(x(i)) + (1− y(i))log(1− hθ(x(i))) +

λ

2m

n∑j=1

θ2j ] (2.8)

Support Vector Machine [1]

Support Vector Machine (SVM), al igual que las regresiones logısticas, es un modelo de

minerıa de datos supervisado, potente y preciso, aplicable tanto para problemas de regresion

o clasificacion, el cual es avalado debido a su fuerte fundacion teorica.

El metodo de SVM se basa en el marco de aprendizaje estadıstico, en que la maquina de

aprendizaje debe estimar una funcion que se adapte y minimice el riesgo. En SVM, se utiliza

un hiperplano para dividir y clasificar los datos.

SVM elige la funcion de hiperplano que maximice el margen entre los datos de entrena-

miento separados y, al mismo tiempo, que maximice la distancia a los datos ejemplos mas

cercanos al hiperplano. La funcion de la ecuacion 2.9, que del hiperplano, esta definida por

el producto punto entre el vector de entrada x y un vector de pesos w y el parametro b,

llamado bias. En base a la evaluacion de 2.10, permite clasificar a que clase pertenece.

26

f(x) = 〈w · x〉+ b (2.9)

yi =

{1 si 〈w · x〉+ b ≥ 0,

−1 si 〈w · x〉+ b ≤ 0.(2.10)

No siempre los datos son separables a traves de un hiperplano. Esto se puede observar en

la mayorıa de los casos reales en que los problemas no son linealmente separables, por lo que

es necesario utilizar algun tipo de tecnica para transformar los datos, a un espacio en que sı

sean separables.

Esto se puede hacer a traves de la utilizacion de un Kernel. La funcion Kernel transforma

el espacio original de los datos, en un espacio linealmente separable por un hiperplano, tal

como se puede apreciar en la figura 2.11.

Figuras 2.11: Transformacion del hiperplano separador a traves de una funcion KernelFuente: Imagen adaptada de [35].

2.2.3 Evaluacion de Metodos de Clasificacion [1]

Existen diversos metodos de evaluacion e interpretacion de las tecnicas de clasificacion

antes mencionadas:

1. Accuracy: Es la habilidad del modelo clasificador de predecir correctamente la clase

en cual datos nuevos son clasificados.

2. Velocidad: Se refiere a los costos computacionales en procesamiento y tiempo para

entrenar el modelo.

3. Robustez: Es la habilidad del modelo a manejar ruido o valores faltantes en los datos

y hacer predicciones correctas.

27

4. Escalabilidad: La habilidad del modelo de entrenar el clasificar de forma eficiente

para un set de datos mas grande.

5. Interpretabilidad: Se refiere al nivel de entendimiento o informacion que entrega el

modelo construido.

Las tecnicas mas comunes para evaluar el Accuracy de un clasificador son:

1. Metodo hold-out: Separar los datos en datos de entrenamiento y datos de prueba a

traves de un muestreo, entrenar con los datos de entrenamiento y calcular el Accuracy

con los datos de prueba. Luego repetir este procedimiento con k distintos datos de

entrenamiento y datos de prueba. El Accuracy se obtiene promediando los Accuracy

de cada iteracion.

2. k-fold cross-validation: Se separa los datos en k folds. Luego se itera k veces toman-

do, en la iteracion i, el fold i como datos de prueba y todos los demas como datos de

entrenamiento. El Accuracy se obtiene promediando los Accuracy de cada iteracion.

3. Bootstraping: Es un k-fold cross-validation, pero en la siguiente iteracion, se quita el

fold utilizado.

En ciertas condiciones, la evaluacion del Accuracy puede no ser aceptable. Es por esto

que existen alternativas al ratio de Accuracy. Si se asume un clasificador que clasifica datos

en positivos y negativos, a continuacion se presentan las alternativas mas utilizadas:

La Sensitivity evalua que tan bien el clasificador reconoce a las muestras positivas y es

definido como:

Sensitivity =verdaderos positivos

positivos(2.11)

donde verdaderos positivos corresponde al numero de las muestras positivas verdaderas y

positivos es el numero de muestras positivas totales.

La Specificity mide que tan bien reconoce las muestras negativas y esta definido como:

Specificity =verdaderos negativos

negativos(2.12)

28

donde verdaderos negativos corresponde al numero de las muestras negativas verdaderas y

negativos es el numero de muestras negativas totales.

La medida de evaluacion que el porcentaje de muestras clasificadas como positivas que

realmente son positivas, es conocida como Precision y esta definida como:

Precision =verdaderos positivos

verdaderos positivos+ verdaderos negativos(2.13)

En base a las definiciones de 2.11 y 2.12, el ratio de Accuracy puede ser definido por:

Accuracy = Sensitivity · positivos

positivos+ negativos+Specificity · negativos

positivos+ negativos(2.14)

Existen casos en que los datos de muestra no pertenecen a solo una clase, si no que pueden

pertenecer a mas de una clase. Es por esto que es necesario trabajar con clasificadores difusos,

que entregan una probabilidad de pertenecer a cada clase.

29

3 Experimento

Ciertos requerimientos son necesarios para lograr el objetivo planteado. Estos requeri-

mientos estan relacionados con el hecho de trabajar con seres humanos y los datos que se

obtienen a traves de ellos. Por otro lado, estan relacionados con el proceso de recopilacion

de los datos, ya que es una de los procesos claves para probar la hipotesis a validar. La

idea principal es trabajar con datos limpios, en un ambiente controlado, para disminuir al

mınimo errores ocurridos por variables distorsionadas. En este capıtulo desarrollara el diseno

e implementacion del experimento para lograr obtener datos limpios acorde al objetivo de

este trabajo.

3.1 Diseno

Esta seccion explica el diseno del experimento para validar la hipotesis. Para esto es

necesario desarrollar un experimento que permita probar las diferencias fısicas observables

en la pupila mientras una persona toma una decision o no. Con esta informacion, sera posible

comparar ambos escenarios y poder validar la hipotesis antes planteada.

Primero, se detallan los instrumentos y el software a utilizar, segundo se desarrollan los

requisitos en cuanto al formato y caracterısticas del sitio web que mantiene al experimento

para aislar el evento a estudiar y las imagenes de los objetos a utilizar, tercero son explicadas

las caracterısticas necesarias del grupo de prueba, luego se define el protocolo del experimento

para su replicacion y por ultimo se detalla la captura de datos a traves de los resultados.

3.1.1 Instrumentacion y Software

En la actualidad, la mayorıa de los sistemas de Eye-Tracking en el mercado tienen la

precision suficiente para este tipo de experimento, por lo que el real problema es el costo de

obtenerlos. Para este estudio es necesario un sistema de Eye-Tracking que permita obtener

toda la informacion necesaria para el experimento. Dentro de la informacion necesaria, se

encuentra la posicion en cada instante de la mirada de la persona, la precision de captura y

el diametro de la pupila, para cada ojo.

Para capturar los movimientos oculares y medir la dilatacion pupilar se utilizo un Eye-

30

Tracker de cuarta categorıa, lo que corresponde a un sistema que usa combinacion de pupila

basado en video y reflexion de cornea. Este tipo de equipos son los mas avanzados para medir

este tipo de movimientos de acuerdo al grado de precision obtenido con ellos.

En particular el equipo utilizado corresponde a un Eye-Tracker modelo Eyelink 1000,

desarrollado por ST Reseaeach company. Este dispositivos esta compuesto por una pantalla

principal con una camara de alta velocidad y un emisor infrarrojo, conectado a un computador

anfitrion. Esto permite al investigador obtener los datos del experimento de una manera

mas facil. Tambien muestra en tiempo real los estımulos que los sujetos de prueba estan

observando. La preparacion de cada experimento toma entre 5 a 10 minutos, dependiendo

de la calibracion.

Las especificaciones tecnicas del eye-tracker se pueden observar en la tabla 3.1.

Tasa de Sampleo 2000 Hz Monocular / 1000 Hz BinocularPrecision 0.25o - 0.5o precision promedioResolucion 0.01o RMS, resolucion de micro sacadas de 0.05o

Acceso a Datos en tiempo real 1.4 msec (SD < 0.4 msec) @ 2000 Hz

Tablas 3.1: Caracterısticas SR Research Eyelink 1000.Fuente: Tabla adaptada de [36].

Como antes fue mencionado, este equipo pertenece a la Facultad de Medicina de la Univer-

sidad de Chile, donde ellos proveyeron toda la informacion necesaria sobre sus componentes

y su utilizacion.

Las principales herramientas y software a utilizar en este trabajo de tıtulo son:

1. Sistema Operativo Microsoft Windows 7: Windows es un sistema operativo ba-

sado en ventanas. La primera version se lanzo en 1985 y comenzo a utilizarse de forma

generalizada gracias a su interfaz grafica de usuario (GUI, Graphical User Interface).

2. HTML: siglas de HyperText Markup Language, hace referencia al lenguaje de marcado

para la elaboracion de paginas web. Es un estandar que, en sus diferentes versiones,

define una estructura basica y un codigo (denominado codigo HTML) para la definicion

de contenido de una pagina web, como texto, imagenes, etc.

3. PHP: es un lenguaje de programacion de uso general de codigo del lado del servidor

originalmente disenado para el desarrollo web de contenido dinamico. Fue uno de los

primeros lenguajes de programacion del lado del servidor que se podıan incorporar

directamente en el documento HTML en lugar de llamar a un archivo externo que

procese los datos. Soporta ser corrido en diferentes sistemas operativos para Windows,

Mac o Linux. Algunas de sus caracterısticas son:

31

(a) Orientado al desarrollo de aplicaciones web dinamicas con acceso a informacion

almacenada en una base de datos.

(b) Es considerado un lenguaje facil de aprender, ya que en su desarrollo se simpli-

ficaron distintas especificaciones, como es el caso de la definicion de las variables

primitivas.

(c) El codigo fuente escrito en PHP es invisible al navegador web y al cliente, ya que

es el servidor el que se encarga de ejecutar el codigo y enviar su resultado HTML

al navegador. Esto hace que la programacion en PHP sea segura y confiable.

(d) Capacidad de conexion con la mayorıa de los motores de base de datos que se

utilizan en la actualidad, destaca su conectividad con MySQL y PostgreSQL.

(e) Posee una amplia documentacion en su sitio web oficial, entre la cual se destaca

que todas las funciones del sistema estan explicadas y ejemplificadas en un unico

archivo de ayuda.

(f) Es libre, por lo que se presenta como una alternativa de facil acceso para todos.

(g) No requiere definicion de tipos de variables aunque sus variables se pueden evaluar

tambien por el tipo que esten manejando en tiempo de ejecucion.

(h) Debido a su flexibilidad ha tenido una gran acogida como lenguaje base para las

aplicaciones WEB de manejo de contenido, y es su uso principal.

4. MySQL: es un sistema de administracion de bases de datos relacional, multi-hilo y

multi-usuario con mas de seis millones de instalaciones en el mundo, de codigo abierto.

Esta disponible para muchas plataformas como Windows, Linux o Mac OS. Este sistema

fue elegido debido a la facilidad de su uso y debido a lo acotado del problema.

5. CSS: lenguaje de hojas de estilos usado para describir la presentacion semantica (el

aspecto y formato) de un documento escrito en lenguaje de marcas. Su aplicacion mas

comun es dar estilo a paginas webs escritas en lenguaje HTML.

6. Matlab: Es un ambiente de computacion numerica desarrollado por MathWords

Company con un lenguaje de programacion propietario. Este sistema permite tra-

baja con datos numerico de forma sencilla, permitiendo graficar funciones, datos e

implementacion de algoritmos.

Por otro lado, el experimento consta con 3 servidores fısicos. El primero es el que el

usuario ve y tiene al frente y esta encargado de la visualizacion del experimento hacia el

sujeto de prueba, tal como se puede apreciar en la ilustracion 6. El segundo es una copia

de la pantalla que ve el usuario y se encuentra el servidor web con el experimento. Este se

encarga de recopilar y registrar todos los datos. Por ultimo, el servidor anfitrion donde se

32

aloja el software del Eye-Tracker y permite con facilidad analizar los datos. El software de

calibracion se encuentra dentro del servidor anfitrion y se puede observar en la figura 3.1.

Figuras 3.1: Servidor anfitrion ejecutando software de calibracion.Fuente: Computador Host CENI.

3.1.2 Sitio Web e Imagenes

Sitio Web

Este experimento desea utilizar la pupila como marcador fisiologico con el fin de establecer

una correlacion con la toma de decision hecha por usuarios en un sitio web. Es por esto que

33

es necesario ambientar el experimento en los sitios web:

Primero, es necesario hacer que el sujeto de prueba sienta que el experimento sea lo mas

parecido a una navegacion de un sitio web. Esto se logra a traves del uso de una pantalla,

teclado y mouse, los cuales puede utilizar libremente.

Segundo, es necesario hacer que el experimento utilice una pantalla de computador, con el

fin de que el sujeto de prueba pueda navegar a traves del experimento usando un navegador

y su mouse.

Tercero, por conveniencia del analisis de datos, es requisito que el usuario no pueda hacer

scrolling en el sitio web. Esto se logra disenando un experimento que utilice el espacio y

resolucion de una pantalla, por lo que el sujeto de prueba no necesitara utilizar del scroll del

mouse. Esto se justifica debido a que la complejidad de hacer el seguimiento de las fijaciones

del ojo sobre la pantalla aumenta debido a que hay que mapear el sitio, tomando en cuenta el

scroll. Se gana resolucion de pantalla del experimento, es decir, mas espacio de exploracion

visual, a traves de la utilizacion de la Pantalla Completa de los navegadores, la cual es posible

iniciarse en cualquier momento a traves de la tecla F11 del teclado.

Cuarto, es necesario que el sujeto de prueba pueda tomar varias decisiones dentro del

sitio web en el cual esta navegando y sea posible capturar esa informacion en una variable.

Por ultimo, en el proceso de experimentacion es necesario obtener conductas lo mas lim-

pias posibles, evitando, por ejemplo, sujetos con patologıas que influyan en el comportamiento

ocular o en los procesos cognitivos. A la vez tambien es necesario lograr una cantidad suficien-

te de sujetos que permitan obtener resultados estadısticos satisfactorios, en otras palabras,

mientras mas sujetos se registran, mas certeza de la validez de la hipotesis existe.

Imagenes

Los objetos dentro del sitio elegido para el experimento, son imagenes pre-procesadas, de

igual tamano, las cuales el sujeto de prueba puede tomar una decision haciendo click. Este

dato se debe guardar, ya que es la que define y diferencia los registros en los cuales el sujeto

tomo una decision o no.

3.1.3 Grupo Experimental

Es uno de los componentes claves para la realizacion del experimento. Dado que se trabaja

con personas, las cuales son evaluadas en sus procesos cognitivos, el grupo experimental debe

34

satisfacer una serie de caracterısticas para poder participar. Los datos obtenidos a traves del

grupo elegido, son utilizados para extrapolar los resultados al resto del universo, por lo que

la correcta eleccion de estos, es vital para la validez de los resultados y eventual conclusiones

obtenidos durante este trabajo.

En lo posible, es altamente recomendable utilizar una muestra de mınimo 20 registros

debido a que, de acuerdo con el teorema central del lımite, a medida que se aumenta la

cantidad de registros, la media y la varianza de los datos analizados seran similar al resto de

la poblacion [37]. Como se desarrolla en los siguientes capıtulos, cada sujeto entrega cientos

de registros por lo que la condicion antes mencionada, se cumple con cabalidad.

En cuanto a las caracterısticas demograficas y estado de salud de los sujetos, debido a que

se estudia la reaccion fısica de la pupila como marcador fisiologico ante una toma de decision,

es imperante que se trabaje con personas que esten en condiciones medicas aptas para hacer

el experimento. Por otro lado, es necesario registrar personas que tengan conocimientos

y experiencia trabajando con computadores, ya que el experimento requiere el uso de una

pantalla y mouse de computador. Las caracterısticas se resumen en las siguientes:

1. Personas entre 18 y 50 anos.

2. Personas sin enfermedades neurologicas y/o psiquiatricas.

3. Personas que no consuman medicamentos que afecten el sistema nervioso central (ej:

antidepresivos/ansiolıticos).

4. Personas que hayan firmado el consentimiento informado.

3.1.4 Protocolo

El experimento busca registrar el movimiento ocular y la dilatacion pupilar en cada in-

stante del tiempo, mientras que el sujeto realiza una exploracion visual del sitio y es expuesto

a distintos grupos de imagenes de valencia neutra pertenecientes a la base de datos IAPS

(International Affective Picture System) 2.1.5 que clasifica imagenes segun su valencia y

excitacion emocional.

La cantidad de imagenes que son expuestas al sujeto son 810, divididas en 90 grupos de

9 imagenes cada una. Cada una de estas imagenes son expuestas al individuo sin lımite de

tiempo y debe hacer click a una de ellas.

El proceso de la tarea es el siguiente:

35

1. Se muestra un set de 9 imagenes con contenido emocional neutro, fondo transparente, en

una cuadrilla, sin bordes, de 3x3 imagenes en las cuales el sujeto debe hacer exploracion

visual y elegir una de ellas haciendo click con el mouse. Las imagenes en una misma

grilla, pertenecen a la misma categorıa de objetos neutros, con el fin de dejar fuera los

componentes emocionales al momento de tomar una decision.

2. Una vez hecho click, se realiza un delay de 2 segundos para luego recargar la grilla con

un nuevo set de imagenes.

3. Se repite el paso I y II hasta terminar las 90 categorıas de imagenes.

En la figura 3.2 se muestra una de las pantallas con una grilla de objetos de una misma

categorıa.

Figuras 3.2: Ejemplo de pagina de eleccion para la categorıa bancasFuente: Desarrollo propio.

Debido a que se quiere encontrar la relacion entre la dilatacion pupilar al momento de

que el sujeto explora visualmente el objeto elegido, se desea aislar el comportamiento de una

toma de decision.

Primero es necesario mencionar que la utilizacion de imagenes neutras tiene el fin de

no influenciar la toma de decision hacia ciertos objetos con distinta valencia, agregando un

36

caracter emocional a la decision. Por otro lado, se toma como supuesto fuerte que el hecho

de hacer click sobre un objeto, define una toma de decision sobre este. Es por esto que, sin

importar la instruccion que se presente al sujeto de prueba, el hecho que haga click sobre el

objeto, define una toma de decision: el comportamiento que desea predecir.

Instruccion del Experimento

Para obtener la informacion necesaria con el fin de validar la hipotesis, se debe detectar

tomas de decision a traves de una instruccion adecuada, que permita al sujeto de prueba,

entre varios objetos posibles, tomar una decision.

Una instruccion posible es solicitar al usuario que haga exploracion visual del sitio y a

continuacion elija un objeto en la pantalla para luego hacerle click, sin definir un criterio en

particular. Tambien es posible definir un criterio como solicitar el objeto que mas le guste o

el que mas le desagrade.

El hecho de elegir un objeto, nos entrega una toma de decision observable, la cual nos

permite cruzar los datos con la dilatacion pupilar. Debido a que este experimento no esta

centrado en explicar el fenomeno completo de toma de decision, si no que busca definir una

marcador fisiologico, a traves de la pupila, para establecer una correlacion con la toma de

decision (en este caso, el hecho de hacer click), el criterio de decision no tiene importancia.

Dado lo anterior, es necesario que el eye-tracker tambien permita, no solo registrar los

eventos relacionados a el movimiento ocular y dilatacion pupilar, sino que tambien debe

registrar en cada instante, los eventos relacionados al hardware que utiliza el sujeto, como

los movimientos y clicks hechos con el mouse o las teclas del teclado. Es por esto que la

instruccion de este experimento es: Utilizando el mouse, elija uno de las imagenes que se

presentan en pantalla haciendo click. Con esto es posible capturar la toma de decision del

sujeto y asociarlo a el objeto clickeado.

3.1.5 Resultados

Esta seccion explica el proceso de la captura de los datos. Los datos principalmente

vienen de la salida entregada por el sistema de Eye-Tracking, utilizando imagenes dentro del

sitio web.

Para cada registro que se obtiene por cada sujeto de prueba, el sistema de eye-tracker

genera un archivo de registro EDF con la data asociada a ese experimento. Este archivo

contiene multiples campos indicando el valor de cada variable durante cada instante del

37

experimento. El archivo para ser visualizado, debe ser convertido a codificacion ASCII en

extension .asc. Un registro tıpico se ve ası:

<time><xpl><ypl><psl><xpr><ypr><psr><xvl><yvl><xvr><yvr><xr><yr>

Estas variables son:

1. <time>: Tiempo

2. <xpl>: Ojo-izquierdo posicion x

3. <ypl>: Ojo-izquierdo posicion y

4. <psl>: Tamano de pupila izquierda (area o diametro)

5. <xpr>: Ojo-derecho posicion x

6. <ypr>: Ojo-derecho posicion y

7. <psr>: Tamano de pupila derecha (area o diametro)

8. <xvl>: Velocidad instantanea x de Ojo-izquierdo (grados/seg)

9. <yvl>: Velocidad instantanea y de Ojo-izquierdo (grados /seg)

10. <xvr>: Velocidad instantanea x de Ojo-derecho (grados /seg)

11. <yvr>: Velocidad instantanea y de Ojo-derecho (grados /seg)

12. <xr>: Resolucion x (unidades de posicion/ grados)

13. <yr>: Resolucion y (unidades de posicion/ grados)

El sistema de Eye-Tracking permite obtener bastante informacion asociada al movimiento

ocular hecho por los sujetos de prueba. En base a la posicion relativa de cada uno de los ojos

en la pantalla, se puede calcular, a traves de transformaciones simples de variables, el tiempo

de permanencia de cada fijacion del usuario en cada objeto en el sitio web, el diametro de la

pupila en cada instante, las veces que vuelve a cada objeto, la precision del registro, entre

otras variables directas para cada uno de los ojos.

Por otro lado, el sistema del Eye-Tracker entrega dentro del archivo EDF todos los eventos

relacionados a la interaccion del sujeto con el hardware, para manejar el sitio web. Dentro

de estos eventos, se encuentran los eventos relacionados al click del mouse y a las presiones

de teclas del teclado. Estos eventos permitiran en el analisis de resultados, dividir cada

exploracion visual de una grilla, en distintas observaciones para un mejor analisis.

La data utilizada en este experimento viene principalmente de la interaccion del sujeto

38

de prueba con el sitio web y de la salida de datos del Eye-Tracker. La data obtenida por el

Eye-Tracker esta directamente relacionada por las acciones hechas por el sujeto de prueba.

Para recolectar esta informacion fue necesario explicar las instrucciones al sujeto de prueba,

para que luego, dadas esas instrucciones, navegara por el sitio. Esto se debio repetir para

cada registro con cada sujeto.

3.2 Implementacion

Esta seccion explica en detalle la implementacion del experimento disenado en la seccion

anterior, con el fin de alcanzar los resultados antes propuestos, detallando los componentes

principales de estos.

Se detalla cada uno de los componentes elegidos para realizar el experimento. Esto incluye

el sitio web y las imagenes elegidas, la eleccion del grupo experimental, el protocolo a utilizar

para la realizacion del experimento y los resultados en base a la captura de datos.

3.2.1 Sitio Web e Imagenes

Paginas Web

Dado los requerimientos planteados en la seccion anterior, se procedio a construir un

sitio web, el cual el usuario pudiese navegar con libertad, asimilando un sitio web comun y

corriente. El sitio web consta de 3 partes: Pagina de bienvenida, Paginas de eleccion, Pagina

de agradecimiento.

1. Pagina de bienvenida: incluye un tıtulo en que se presenta de manera escrita las

instrucciones del experimento. El moderador del experimento entrega las mismas in-

strucciones antes de comenzar el experimento. Las instrucciones son: Se le presentara

un set de 9 imagenes en una grilla de 3x3. Haciendo click con el mouse, elija una de

las imagenes.... Luego, incluye un boton clickeable, el cual tiene el texto Empezar Test,

el cual redirige al sujeto de prueba a la siguiente seccion del experimento, las paginas

de eleccion. Por otro lado, se le da la instruccion de hacer clicks rapidos y certeros, al

centro de cada objeto, con el fin de obtener resultados de la toma de decision, lo mas

limpios posibles.

2. Paginas de eleccion: consisten en presentar al sujeto de prueba un mosaico de 9

imagenes, sin espacios entre medio. Cada una de las imagenes son clickeables. Una vez

hecho el click sobre una de las imagenes, el sitio web se recarga, para continuar con

otro set de imagenes. Una vez recorridas todos los sets de imagenes, el sitio lo redirige

39

a la pantalla de agradecimiento.

3. Pantalla de agradecimiento: es la ultima fase del experimento. El sujeto de prueba

termina con esta pantalla, por lo que el experimento ha terminado y se puede retirar.

Figuras 3.3: Pagina de bienvenida de experimentoFuente: Desarrollo propio.

Imagenes a Utilizar

Las imagenes escogidas son imagenes que pertenecen al conjunto de valencia neutra,

definidas por el International Affective Picture System (IAPS), debido a que se quiere aislar

la emocionalidad de la toma de decision. Las imagenes estan repartidas en una malla de 3x3,

del mismo tamano, y distribuidas una al lado de otra en forma de cuadrıcula. Las imagenes

son links clickeables que permiten avanzar al sujeto en el experimento. Cada imagen esta

dentro de un hiperenlace, el cual esta dentro de un objeto div.

Cada imagen se pre-procesa, utilizando el software online http://pixlr.com/editor/ que

permite el manejo y transformacion de imagenes. Las imagenes a utilizar en el experimento

son todas formateadas a Portable Network Graphics (PNG) con las dimensiones 1024x768

pixeles, con fondo transparente. Luego en el experimento, cada imagen se redimensiona a

las dimensiones 384x288 pixeles con el fin de que quepan en la resolucion de la pantalla, sin

tener que hacer scroll hacia abajo o hacia los costados, como se habıa definido anteriormente

en los requerimientos.

Categorıas de Imagenes

Se utiliza un sub-set de 9 imagenes en cada pagina web que pertenecen a una misma

categorıa con el fin de no generar preferencia frente a un objeto en particular. Existe un total

de 90 categorıas haciendo un gran total de 810 imagenes de valencia neutra por experimento,

las cuales se pueden apreciar en la figura 3.2. Cada categorıa se encuentra dentro de una

carpeta con el prefijo category y sufijo n, donde n representa el numero de la categorıa. Los

archivos, dentro de cada carpeta category, estan nombrados con un prefijo de image y con el

40

valor de 1 a 9, para cada imagen, por ejemplo, para la categorıa numero 4, se guarda en la

carpeta category4 los objetos representados por botones, desde la image1 hasta la image9.

enchufe basurero libro lavadoras peinetas quitasolestaladro plato cuchillo alicate llave vestidotaza polera disket ampolleta llaves zapatotazon poleras enchufe bancos maleta polerastelevision puerta escritorio bandeja martillo ruedatelevisor refrigerador flauta basurero mesa cocinatenedor reloj florero billetera microonda toallastermo rueda frasco bufanda ollas bancostijeras sandalias gomas cepillo pala poleratoallas sarten guitarra clavos pantalon colchonestornillos secador hacha cocina panuelos serruchotuerca serrucho interruptor cojin paragua ventanauslero silbato lapices colchones paraguas cucharavelador silla lavadora copa peineta taladroventana sillas lavaplatos cuaderno pesas maletaventilador sofa libro cuchara plancha tornillos

Tablas 3.2: Lista de categorıa de objetos utilizados en el experimento con valencia netra segun IAPSFuente: Tabla de confeccion propia.

3.2.2 Grupo Experimental

El grupo experimental elegido, se baso en los requerimientos del experimento desarrollados

en el diseno de este. En total se realizaron 25 registros. No se tomaron en cuenta los registros

en los que no se pudo llegar al final del experimento.

3.2.3 Protocolos

En la implementacion del experimento, se debe seguir los siguiente pasos para poder

replicar la realizacion del experimento y obtener resultados acordes a los de este trabajo:

1. Bienvenida y relleno de documentos: En este paso, se le da la bienvenida y agradeci-

miento por participar en el experimento, se le explica en lo que consistira y se le solicita

leer y firmar el Consentimiento Informado.

2. Preparar los Equipos: Se debe encender y preparar correctamente los equipos anterior-

mente mencionados.

3. Es necesario posicionar al sujeto frente a la pantalla del computador y conectarlo al

Eye-Tracker, como se muestra en la figura 3.4. El sujeto debe estar comodo y el centro

de la pantalla debe estar a la altura de sus ojos. Por otro lado, la mesa donde esta

posicionada la pantalla y Eye-Tracker debe estar paralela al suelo, tal como se puede

observar en la figura 3.4

41

4. Luego, a traves del software de calibracion del sistema de Eye-Tracker, se procede a

calibrar el sistema con los movimientos oculares del sujeto de prueba. Este proceso

dura aproximadamente entre 5 a 10 minutos, dependiendo el sujeto. Para realizar la

calibracion, se utiliza una funcionalidad que incorpora el software del sistema de Eye-

Tracker y a traves del ajuste de la distancia y posicion de la camara o menton del

sujeto.

5. Una vez calibrado, se inicia el experimento, donde se lleva al sujeto a la pantalla de

inicio. Se le repite la instruccion en voz alta: Se le presentara un set de 9 imagenes en

una grilla de 3x3. Haciendo click con el mouse, elija una de las imagenes.... A medida

que el sujeto de prueba hace una inspeccion visual del mosaico de imagenes y luego

hace click en una.

6. Una vez pasadas las 90 categorıas, el experimento se da por finalizado y el sujeto puede

retirarse.

Figuras 3.4: Sujeto de prueba conectado al eye-tracker realizando experimento.Fuente: Laboratorio de CENI

42

3.2.4 Resultados

Una vez terminado el diseno experimento se procede a la experimentacion con sujetos,

donde se registran sus movimientos, tamano y diversos eventos oculares mediante el sistema

de camaras y software EyeLink 1000, el cual tiene la caracterıstica de tener una baja tasa de

error de 0.01 ◦visuales y una alta frecuencia de sampleo de 500[Hz]. Esto implica la toma de

datos de manera mucho mas precisa y continua.

43

4 Analisis y Resultados

Este capıtulo muestra los resultados del experimento y los datos obtenidos despues de la

aplicacion a los sujetos de prueba sobre todo el proceso detallado en las secciones anteriores.

Estos resultados son explicados de manera simple y ordenada. Tambien se presenta el analisis

de los algoritmos utilizados.

Se desarrolla en detalle cada una de las etapas del proceso KDD y se lista los resultados

complementarios a el objetivo principal encontrados a traves de la realizacion de este expe-

rimento. El proceso KDD esta separado en el pre-procesamiento de los datos, la seleccion de

variables y la transformacion de estas. Luego se plantea las posibles estrategias y modelos a

utilizar. Este proceso es nucleo del presente trabajo, ya que permite descubrir conocimiento.

Por ultimo, se presenta la interpretacion y evaluacion de los resultados encontrados a traves

de los modelos de minerıa de datos utilizados.

4.1 Proceso KDD

Se puede entender que el proceso por el cual pasa el sujeto durante el experimento, es lineal

en el tiempo, donde se pueden detectar ciertos fenomenos que se desea estudiar. Primero, a

medida que el sujeto hace una exploracion visual por el experimento, se va encontrando con

distintos objetos. Segundo, para cada objeto con el cual el sujeto observa, su pupila sufre

una cierta dilatacion. Tercero, luego de terminar la exploracion visual del sitio, la persona

hace click en el que mas le gusta.

Dado lo anterior, podemos desprender 3 eventos claves como se puede ver en la figura:

Para cada objeto observado, el sujeto primero “Ve el objeto”, luego se produce un “cambio

en el diametro de la pupila” y por ultimo el sujeto “toma la decision” si ese elegira o no

haciendo click. Dado esto, y que se guarda cual fue el objeto que realmente elige, gracias

al click, se puede diferenciar los objetos elegidos de los que no fueron elegidos. Utilizando

herramientas de minerıa de datos, es posible encontrar patrones de tomas de decision.

Tal como es mencionado en la metodologıa en el capıtulo introductorio, se procede a

utilizar el proceso KDD para validar la hipotesis, a traves del descubrimiento de conocimiento

subyacente a los datos extraıdos. Se desea generar un modelo de clasificacion binaria, en que

44

permita clasificar senales que esten relacionadas a tomas de decision y senales que no. Se

revisara el proceso en sus pasos de seleccion, transformacion, minerıa de datos y evaluacion.

4.1.1 Seleccion

Los datos a utilizar son la salida del Eye-Tracker: los archivos EDF. Estos archivos son

transformados a formato ASC y contienen cada evento ocurrido durante el experimento con

una frecuencia de 500hz, es decir, existen registros cada 2ms para cada ojo. Entre los registros,

se encuentran eventos relacionados con movimientos oculares, dilatacion pupilar, calibracion

y eventos del hardware como mouse y teclado.

En cuanto a la realizacion de la minerıa de datos, los registros a utilizar son solo los aso-

ciados a la dilatacion pupilar. Los movimientos oculares y los eventos del hardware solo son

utilizados para preparar y separar los datos en distintas observaciones para el entrenamiento

del modelo.

Debido a que se tiene los registros por experimento de ambos ojos y el movimiento de los

ojos es simetrico [9], a traves de los datos de calibracion, se realiza una comparacion entre

los errores promedios para cada ojo entregados por el Eye-Tracker, para luego utilizar los

datos del ojo con menor error promedio de calibracion, con el fin de entrenar el modelo con

los datos mas limpios posibles.

En las figuras 4.1 y 4.2 se muestran extractos de la curva de dilatacion pupilar de registros

de Eye-Tracking en el tiempo. Como se puede observar, es posible detectar distintos sectores

de la curva en el cual se presentan problemas asociados a errores de registro. En la siguiente

seccion, se detallara el pre-procesamiento de los datos para eliminar cada uno de estos tipos

de errores y la separacion de los datos en distintas observaciones para entrenar el modelo.

Figuras 4.1: Senal extraıda de mediciones con EyeLinkFuente: Desarrollo propio.

45

Figuras 4.2: Zoom a intervalo de un mosaico en senal extraıdaFuente: Desarrollo propio..

Por otro lado, en la figura 4.3 se puede apreciar un diagrama de dispersion en que grafica

los puntos de cada fijacion que hizo uno de los sujetos. Esto nos demuestra la precision de

los datos obtenidos, con respecto a la posicion movimiento ocular en la pantalla. En la figura

4.3 se pueden apreciar los 9 clusters asociados a cada uno de los objetos.

Figuras 4.3: Clusters formados por posicion (x,y) de experimento para sujeto 14Fuente: Desarrollo propio..

46

4.1.2 Pre-Procesamiento y Transformacion

Tal como se menciono en la seccion anterior, si se analiza la senal extraıda directamente

del registro se observa que es muy ruidosa y a la vez ciertos eventos oculares producen

modificaciones importantes (artefactos) en la senal. Estos artefactos deben ser tratados

a traves de un pre-procesamiento para continuar con el proceso KDD. A continuacion se

presentan los distintos artefactos, fijaciones y el pre-procesamiento a los datos con el fin de

limpiar y segmentar las distintas observaciones.

Artefactos

Parpadeos: Cada vez que el sujeto pestanea la senal pupilar se pierde, asignando un

valor cero al valor de la dilatacion pupilar. Este evento es menos recurrente que los otros

artefactos y a la vez transcurre en un intervalo de tiempo pequeno, por lo que una solucion

simple es generar una interpolacion lineal en el intervalo del parpadeo con el fin de suplir la

ausencia de datos. Esta interpolacion lineal permite obtener una senal mas suave, sin saltos

ocurridos por los parpadeos. En la figura 4.4 se puede observar la eliminacion del ruido

generado por los parpadeos.

Figuras 4.4: Correccion de artefactos producidos por parpadeos.Fuente: Banco de imagenes CENI.

Sacadas: Los artefactos por sacadas se deben a que estos movimientos pueden producir

una variacion instantanea considerable en la senal pupilar ya que, por ejemplo, al generar

una sacada hacia arriba de manera instantanea se pierde de vista parte de la region pupilar,

generando una disminucion de la senal de la misma rapidez. Este cambio en la senal es facil

de diferenciar del comportamiento general ocular debido a su rapidez, donde la pupila puede

llegar a recorrer hasta 60◦angulares en 20[ms], con lo que se puede definir un movimiento

sacadico si la velocidad pupilar alcanza un cierto umbral.

47

Una vez localizadas las sacadas se corrigen estas variaciones instantaneas generadas mo-

viendo toda la senal desde el final de una sacada hacia el punto donde se comenzo el evento

e interpolando linealmente en el intervalo del evento. Esto se puede apreciar claramente en

la figura 4.5.

Figuras 4.5: Eliminacion de offsets producidos por sacadasFuente: Banco de imagenes CENI.

Parpadeos como sacadas: En varias ocasiones dentro del registro, se puede observar

una secuencia de eventos que representa un error de medicion. Esta secuencia esta definida

por una sacada, luego un parpadeo para terminar con otra sacada. Esto se debe a que

mientras el sujeto esta parpadeando, el eye-tracker sigue registrando la senal pupilar por lo

que en varias ocasiones un parpadeo es confundido con esta secuencia. Para limpiar este

error de medicion, se procede a transformar esta secuencia en un solo parpadeo, eliminando

ambos registros de sacadas.

Alta Frecuencia: Aparte de la correccion de artefactos tambien es util la eliminacion

del ruido de alta frecuencia en la senal. En el registro pupilar se puede observar que existen

rapidas y pequenas variaciones que se deben al error de medicion de hardware. Una manera

de eliminar este ruido es a traves de un filtro de frecuencias pasa-bajo.

Al aplicar un filtro de frecuencias pasa-bajo se debe tener el cuidado de no eliminar

frecuencias que correspondan a la senal pupilar. Un resultado de la eliminacion de la altas

frecuencias se puede observar en la figura 4.6, donde se analizo el espectro de frecuencias de

un analisis de Fourier llegando a una frecuencia de corte de 2 [hz].

48

Figuras 4.6: Zoom a la senal pupilar al aplicar filtro de altas frecuenciasFuente: Banco de imagenes CENI.

Observaciones

El comportamiento ocular de una persona puede verse como una sucesion sacadas y

fijaciones con parpadeos habituales, por ejemplo en este experimento es de esperarse que el

sujeto al pasar de un objeto a otro dentro del mosaico lo haga con una sacada seguido de

una fijacion y ası sucesivamente, en la figura 4.7 se puede ver una representacion grafica de

este suceso, enumerando la posicion de 1 a 9 dependiendo del objeto en la que se encuentra

el sujeto se puede ver su comportamiento de exploracion a traves del tiempo a la vez que se

marcan los intervalos de sacadas y fijaciones en esta representacion.

Figuras 4.7: Comportamiento donde se ve patron de sacada-fijacion asociado al id del objetoFuente: Desarrollo propio.

A continuacion es necesario definir la naturaleza de las observaciones que se utilizaran

para entrenar el modelo de clasificacion:

49

1. Una observacion comienza en el momento que inicia una fijacion dentro de un objeto y

la fijacion anterior fue en un objeto distinto al actual.

2. Se considera una observacion, si y solo si, el sujeto permanece haciendo exploracion

visual por mas de 300ms dentro del area visual del mismo objeto.

3. Una observacion termina al momento que el sujeto hace una sacada hacia otro objeto

y comienza una nueva observacion.

4. Una observacion no se considera, si el sujeto realiza una fijacion fuera del area definida

por la grilla de 3x3 de objetos.

5. Una observacion consta de la senal de dilatacion pupilar, desde su comienzo hasta los

siguientes 600ms.

Por ultimo es necesario definir para cada observacion, si fue una toma de decision o no.

Esto se logra a traves de los eventos del hardware, en particular, a traves de los clicks hechos

con el mouse.

Antes de todo, es necesario mencionar que todas las observaciones de una misma grilla de

objetos, esta separada por un click. Dado el diseno del experimento, cada vez que el sujeto

elije un objeto, se recarga una nueva grilla con una nueva categorıa de objetos. En otras

palabras, cada grupo de observaciones, esta en un subconjunto llamado grilla. Esto facilita

la agrupacion de observaciones y el etiquetado de la toma de decision.

Cada vez que el sujeto hace click para elegir un objeto en particular, se calcula la posicion

del mouse para obtener el identificador del objeto al cual se le hizo click para esa grilla. El

identificador puede ser del 1 al 9 (o 0 en caso de que el click no este dentro del area de

la grilla de objetos) donde cada identificador representa un objeto en la grilla, tal como se

puede observar en la figura 4.8. Luego, para cada grilla, se asigna un parametro de decision

con valor igual a 1 a todas las observaciones de esa grilla, que sean el objeto que se le hizo

click. Para todas las demas, se les asigna un parametro de decision con valor igual a 0.

50

Figuras 4.8: Orden de asignacion de identificador a grilla de objetos en experimentoFuente: Desarrollo propio.

En base a esto, se obtienen cientos de observaciones de 600ms, las cuales tienen asignadas

un valor 1 si es que fueron clickeadas y un valor de 0 en lo contrario.

Transformacion

Para hacer cada una de estas observaciones comparables, es necesario estandarizarlas.

Esto se logra a traves de la utilizacion de la transformacion z-score y ajustando la lınea base.

1. Z-score: Calcula la media y la varianza para cada observacion y transforma la distri-

bucion a una media de 0 y varianza de 1, haciendo los valores comparables.

2. Lınea base: Eliminacion de lınea base, utilizando los 200ms anteriores a cada senal.

Esto permite centrar las observaciones para una mejor apreciacion.

Validacion hipotesis

En base al pre-procesamiento hecho y a las transformaciones hechas las observaciones, es

posible obtener algunos resultados por sujeto y el promedio de todos los objetos.

51

En la figura 4.9 se puede apreciar el promedio de las curvas de dilatacion pupilar para

el sujeto 9 y el sujeto 14, agrupados por toma de decision (parametro de decision igual a

1) y por no toma de decision (parametro de decision igual a 0). Es importante mencionar

que no todas las curvas alcanzan los 600ms, debido a que durante la exploracion visual, no

necesariamente un sujeto se mantendra observando a un mismo objeto durante 600 o mas

milisegundos.

Figuras 4.9: Promedio inter-sujeto para curvas de decision y no decision de dilatacion pupilar normalizadaversus tiempo

Fuente: Desarrollo propio.

En la figura 4.9, se puede ver claramente la diferencia entre las curvas de decision y la

de no decision, sin embargo, no es interesante evaluar este patron individualmente, si no que

es interesante en la poblacion general y no solo en 2 sujeto de prueba. Tambien se puede

apreciar la variabilidad que hay de un sujeto a otro.

A traves de la promediacion de todas las curvas de los sujetos, separadas por decision y no

decision, en 4.10 se logra generar dos curvas que representan a todos los sujetos de prueba. En

base a estas curvas, se puede calcular la confianza y definir si son estadısticamente distintas.

52

Figuras 4.10: Promedio de todos los sujetos para curvas decision y no decision de dilatacion pupilarnormalizada versus tiempoFuente: Desarrollo propio.

Para hacer un test estadıstico que permita contrastar ambas curvas, es primero necesario

probar si siguen una distribucion normal. Esto se puede lograr a traves del test de Lilliefors

de normalidad. Esto se realiza con la funcion lillietest de Matlab. El resultado del test nos

entrega un valor de 0.0970, el cual es mayor al valor crıtico de 0.0518, por lo que la hipotesis

se rechaza con una significancia de 0.05, es decir, no siguen una distribucion normal.

Luego para validar la hipotesis de esta memoria Los cambios del diametro de la pupila en el

tiempo son una variable predictiva dependiente relevante en las tomas de decision proximas,

se procede a realizar un test estadıstico que permita contrastar ambas curvas con cierta

confianza. Esto se puede lograr a traves del test de Wilcoxon que permite comparar dos

grupos emparejados en alguna variable continua, sin el supuesto de normalidad. Esto se

realiza con la funcion ranksum de Matlab. El resultado del test nos entrega que la hipotesis

se rechaza con una significancia de 0.05, es decir, las curvas de decision y no decision no

tienen la misma media.

Con esto se puede concluir y validar la hipotesis, ya que para los objetos explorados por

los sujetos que luego fueron clickeados, la pupila se comporta de manera estadısticamente

53

distinta, con una significancia de 0.05.

El siguiente paso, es desarrollar un modelo clasificador binario, que permita clasificar

nuevas curvas de dilatacion pupilar, en decision y no decision.

4.1.3 Minerıa de Datos

En base a las observaciones obtenidas y las caracterısticas de cada una de ellas, se procede

a realizar distintos modelos de clasificacion binaria. Se utilizan algoritmos de aprendizaje

surpervisado, donde la caracterıstica a utilizar es la dilatacion pupilar del sujeto para cada

observacion y la variable objetivo es el parametro de toma de decision 1 o 0. A continuacion

se listas los algoritmos y parametros a utilizar:

1. RegLog: Los parametros iniciales que necesita este algoritmo son, por una parte, el

termino de regularizacion lambda, y por otra parte, los parametros a entrenar theta.

2. Support Vector Machine: Este algoritmo necesita de una funcion de Kernel para

realizar su entrenamiento.

3. Redes neuronales: Es necesario definir la cantidad de capas para configurar la red

neuronal.

En 4.1 se presenta una tabla con los resultados obtenidos para cada uno de los clasifica-

dores:

Clasificador Accuracy RecallRegresion Logıstica 75% 12%Support Vector Machine 72% 15%Redes Neuronales 82% 19%

Tablas 4.1: Resultados clasificador binario.Fuente: Desarrollo propio

Como se puede observar, los resultados entregan un alto Accuracy pero un extremada-

mente bajo Recall. Esto se debe a que los casos en que la variable objetivo es 1, es decir,

una toma de decision, son eventos raros, por lo que el clasificador prefiere clasificar mejor a

a la variable objetivo cuando es 0, es decir no decision, ya que son 10 veces mas que estos

eventos raros, mejorando de gran manera el Accuracy pero entregando un bajo Recall.

Esto ultimo, puede ser visualizado a traves de la curva ROC de las redes neuronales. La

curva ROC para los datos de entrenamiento, validacion, testing y total, se pueden observar

en la figura 4.11

54

Figuras 4.11: Curva ROC del experimento utilizando redes neuronales como clasificadorFuente: Desarrollo propio.

El Recall permite obtener la probabilidad que un dato obtenido de forma aleatoria, sea

relevante para la busqueda. En particular, en este caso los datos que interesan son los eventos

raros de tomas de decision. Por lo que si a traves del clasificador obtenido el Recall es bajo,

la probabilidad de clasificar bien los datos que sean eventos raros sera baja, haciendo que la

prediccion no sea correcta.

4.2 Mapas de Calor

A traves de la utilizacion de los datos obtenidos en los experimentos realizados, es posible

confeccionar mapas de calor de fijaciones con las coordenadas observadas por mas tiempo.

Esto se realiza a traves del uso de una matriz de 1600x900 donde cada par (x, y) de la matriz,

representa un pixel en la pantalla.

Primero se obtiene la matriz de fijaciones para cada individuo en base al promedio de

tiempo de permanencia en cada punto. Luego las matrices se suman obteniendo una matriz

que representa a todos los individuos. Por ultimo se utiliza un filtro pasa bajo para suavizar

55

la imagen. En la figura 4.12 podemos apreciar el mapa de calor de fijaciones para la categorıa

vestidos de todos los sujetos.

Figuras 4.12: Mapa de calor de fijaciones promedio de todos los sujetos para la categorıa vestidosFuente: Desarrollo propio.

Por otro lado, a traves de la utilizacion de los cambios de diametro de la pupila, se pueden

confeccionar mapas de calor que representen las coordenadas observadas en que la pupila tuvo

una mayor dilatacion.

Primero se obtiene la matriz de dilataciones para cada individuo, con el promedio para

cada coordenada, en base a la serie de tiempo de la dilatacion pupilar en z-score. Luego las

matrices se suman obteniendo una matriz que representa a todos los individuos. Por ultimo

se utiliza un filtro pasa bajo para suavizar la imagen. En la figura 4.13 podemos apreciar el

mapa de calor de dilatacion pupilar para la categorıa vestidos de todos los sujetos.

Figuras 4.13: Mapa de calor de dilatacion pupilar promedio de todos los sujetos para la categorıa vestidosFuente: Desarrollo propio.

56

Cabe destacar que, en base al orden de 1 a 9 en la grilla para la categorıa vestidos, el

vestido con id 5 fue elegido el 40% de las veces, los vestidos 1 y 2 fueron elegidos el 20%

de las veces, los vestido 4 y 7 fueron elegidos el 10% de las veces, mientras que los demas

vestidos nunca fueron elegidos.

En base a esto, se tiene como resultado que tanto el mapa de calor de fijaciones como

el de dilatacion pupilar son certeros en cuanto a los puntos de mayor convergencia, ya que

para el mapa de fijaciones, los vestidos mas observados fueron los 1, 4 y 5, mientras que

para el mapa de calor de dilatacion pupilar fueron el 4 y el 5. Es decir, si se elijen 2 de los

vestidos, en base a las probabilidades recien dadas, utilizando la informacion entregada por

el mapa de calor de dilatacion pupilar, se tiene una probabilidad del 60% elegir un vestido

que en el futuro sera clickeado, es decir, una excelente prediccion (60%) a bajo costo (2 sobre

9 imagenes).

57

5 Conclusiones

El presente trabajo de tıtulo tiene por objetivo descubrir la relacion entre la dilatacion

pupilar y la toma de decision. A continuacion, a traves de metodos estadısticos y el proceso

KDD, se rescata la relacion entre las variables estudiadas y se genera un clasificador binario

de toma de decision.

Se procede a recopilar informacion para lograr los objetivos de desarrollo del estado del

arte de los temas en cuestion. La toma de decision es un area de la neurociencia que no se

ha desarrollado su relacion con la dilatacion pupilar. Gracias a los experimentos realizados

en este trabajo de tıtulo, se puede afirmar que los analisis de dilatacion pupilar, exhiben una

relacion cuantitativa con las tomas de decision en sitios web.

De los analisis y resultados obtenidos se pueden extraer distintas conclusiones que se

listan a continuacion:

• La dilatacion pupilar muestra patrones de comportamiento marcados en relacion con

las tomas de decisiones, como se puede observar en las figuras de curvas de prome-

dio de todos los sujetos en la seccion de 4. Este fenomeno se considera significativo

estadısticamente hablando, con una significancia razonable.

Sin embargo, los esfuerzos por hacer un clasificador binario de tomas de decision, no

bastan para obtener un clasificador de calidad, debido a que, como se puede observar

en el capıtulo de resultados 4, entrega una Accuracy alta, pero con una Recall extre-

madamente baja. Es decir, el comportamiento que nos interesa estudiar y clasificar, no

es bien clasificado.

• La toma de decisiones contextualizada en este experimento, se puede caracterizar como

un evento raro, por lo que los clasificadores comunes utilizados no son recomendables

para el analisis de este tipo de datos. Se propone utilizar clasificadores de eventos raros

o utilizar tecnicas de transformacion de los datos.

• Dentro de las posibles soluciones a la deteccion de eventos raros, es posible la aplicacion

de las siguientes tecnicas: a) Sobre-Muestreo de los Casos Raro; es decir, replicar los

casos raros para que queden en misma cantidad que los casos comunes, b) Hacer un

muestreo de los casos comunes e igualar a cantidad de casos raros, o c) Cambiar los

costos de la matriz de confusion, es decir, castigar a la funcion optimizadora que entrena

58

al modelo de clasificacion, con mayor costo en caso de una mal clasificacion a los eventos

raros.

• La variabilidad de comportamiento de la dilatacion pupilar inter-sujeto es demasiado

alta como para concluir la hipotesis a nivel individuo. Sin embargo, al promediar todos

los sujetos, tal como se muestra en 4 se obtiene el resultado con significancia estadıstica.

Es se explica debido a que, aunque la variable predictiva como marcador fisiologico sea

distinta inter-sujeto, la tendencia y forma de la curva es distinta en promedio, para la

poblacion.

• El criterio de decision de los sujetos fue libre en cada uno de los registros, sin embargo,

aunque todas las razones de la decision ensucian el predictor, al mezclar todas las

posibles razones por la cual las persona decide, se logra un factor comun generico de la

decision de click.

• En base a lo descubierto, se propone detectar cuales son las caracterısticas mas impor-

tantes de la curva de dilatacion pupilar que diferencian una decision a una no decision.

Esto permite generar modelos de clasificacion empıricos, replicables y accionables, con

el fin de aportar a la metodologıa de mejoramiento de sitios web.

• A traves de la utilizacion de mapas de calor de fijaciones y de dilatacion pupilar, es

posible predecir con alta probabilidad de acierto a que objeto el sujeto hara click al

momento de tomar decisiones, a un muy bajo costo. Permitiendo abstraernos del click

y utilizar la dilatacion pupilar como un muy buen predictor de este.

• Aunque la dilatacion pupilar sea un buen predictor del click al momento de tomar

decisiones, el costo de obtener los datos de la dilatacion pupilar es bastante elevado,

ya que es necesario hacer experimentos con sujetos conectados a un eye-trackers, por

lo que este trabajo abre la discusion sobre cual de los dos metodos es conveniente para

predecir clicks de usuarios en sitios web.

5.1 Trabajo futuro

Con el fin de continuar con el estudio de la comprension de la relacion de las tomas de

decisiones con la dilatacion pupilar, se propone realizar las siguientes tareas:

• Grupo experimental: Para obtener resultados con mayor significancia es recomen-

dable aumentar el numero de sujetos a analizar.

• Analisis de dilatacion pupilar: En el presente estudio, el clasificador con mejores

resultados no alcanza el 50% de Recall. Por lo mismo, se propone considerar distintas

opciones para mejorar los resultados. Primero, se pretende utilizar nuevas o modi-

59

ficadas caracterısticas que representen en mayor medida a la dilatacion pupilar, por

ejemplo, agregar caracterısticas de dilatacion y contraccion maxima, aceleracion y ve-

locidad de curva. Segundo, se propone integrar mas restricciones a la consideracion

de dilataciones pupilares como validas, por ejemplo, re-definir las caracterısticas de las

curvas validas. Tercero, aplicacion de transformadas de series de tiempo para generar

nuevas caracterısticas para el clasificador binario. Cuarto, se buscaran nuevos algorit-

mos supervisados, que contengan comportamientos menos lineales que los usados hasta

el momento, por ejemplo, algoritmos clasificadores de eventos raros.

• Identificacion de Website Keyobjetcs : Una vez que el clasificador se encuentre

terminado, se propone generar mapas de calor asociados a la probabilidad de tomas de

decision de hacer click.

60

Bibliografıa

[1] O. Maimon and L. R. (Eds.), The Data Mining and Knowledge Discovery Handbook.Springer, 2005.

[2] J. D. Velasquez, “Combining eye-tracking technologies with web usage mining for iden-tifying website keyobjects,” Engineering Applications of Artificial Intelligence, vol. 26,no. 5–6, pp. 1469 – 1478, 2013.

[3] L. Dujovne and J. D. Velasquez, “Design and implementation of a methodology foridentifying website keyobjects,” in Proceedings of the 13th International Conference onKnowledge-Based and Intelligent Information and Engineering Systems, pp. 301–308,KES, 2009.

[4] J. D. Velasquez, L. E. Dujovne, and G. L’Huillier, “Extracting significant website keyobjects: A semantic web mining approach,” Engineering Applications of Artificial Intelli-gence, vol. 24, no. 8, pp. 1532 – 1541, 2011. Semantic-based Information and EngineeringSystems.

[5] N. F. Ali-Hasan, E. J. Harrington, and J. B. Richman, “Best practices for eye tracking oftelevision and video user experiences,” in Proceedings of the 1st international conferenceon Designing interactive user experiences for TV and video, pp. 5–8, ACM, 2008.

[6] F. J. A. Fernandez, J. F. Perez, and S. F. Lopez, Oftalmologıa en Atencion Primaria.Alcala, 2002.

[7] B. Cassin, M. L. Rubin, and S. Solomon, Dictionary of eye terminology. Wiley OnlineLibrary, 1984.

[8] J. E. Russo, “Eye fixations can save the world: A critical evaluation and a comparisonbetween eye fixations and other information processing methodologies.,” Advances inconsumer research, vol. 5, no. 1, 1978.

[9] S. Marcos, “Calidad optica del ojo,” Investigacion y ciencia, no. 345, pp. 66–74, 2005.

[10] P. J. A. Unema, S. Pannasch, M. Joos, and B. M. Velichkovsky, “Time course of infor-mation processing during scene perception: The relationship between saccade amplitudeand fixation duration,” Visual Cognition, vol. 12, no. 3, pp. 473–494, 2005.

[11] K. Rayner, “Eye movements in reading and information processing: 20 years ofresearch.,” Psychological bulletin, vol. 124, no. 3, p. 372, 1998.

[12] I. E. Loewenfeld and O. Lowenstein, The pupil: Anatomy, physiology, and clinicalapplications. Iowa State University Press Ames, 1993.

[13] C. M. Privitera, L. W. Renninger, T. Carney, S. Klein, and M. Aguilar, “Pupil dilationduring visual target detection,” Journal of Vision, vol. 10, no. 10, 2010.

61

[14] P. Gupta, H. Mehrotra, A. Rattani, A. Chatterjee, and A. Kaushik, “Iris recognitionusing corner detection,” in Proceedings of 23rd International Biometric Conference (IBC2006), Montreal, Canada, 2006.

[15] R. S. Lazarus and S. Folkman, “Stress,” Appraisal and Coping, New York, 1984.

[16] W. Einhauser, C. Koch, and O. L. Carter, “Pupil dilation betrays the timing ofdecisions,” Frontiers in human neuroscience, vol. 4, 2010.

[17] M. M. Bradley, L. Miccoli, M. A. Escrig, and P. J. Lang, “The pupil as a measure ofemotional arousal and autonomic activation,” Psychophysiology, vol. 45, no. 4, pp. 602–607, 2008.

[18] G. J. Siegle, S. R. Steinhauer, C. S. Carter, W. Ramel, and M. E. Thase, “Do theseconds turn into hours? relationships between sustained pupil dilation in response toemotional information and self-reported rumination,” Cognitive Therapy and Research,vol. 27, no. 3, pp. 365–382, 2003.

[19] D. Noton and L. Stark, “Scanpaths in saccadic eye movements while viewing andrecognizing patterns,” Vision research, vol. 11, no. 9, pp. 929–IN8, 1971.

[20] L. R. Young and D. Sheena, “Survey of eye movement recording methods,” BehaviorResearch Methods & Instrumentation, vol. 7, no. 5, pp. 397–429, 1975.

[21] J. A. Schirillo, “Pupil dilations reflect why rembrandt biased female portraits leftwardand males rightward,” Frontiers in Human Neuroscience, vol. 7, no. 938, 2014.

[22] A. Duchowski, Eye tracking methodology: Theory and practice, vol. 373. Springer, 2007.

[23] A. E. Kaufman, A. Bandopadhay, and B. D. Shaviv, “An eye tracking computer userinterface,” in Virtual Reality, 1993. Proceedings., IEEE 1993 Symposium on ResearchFrontiers in, pp. 120–121, IEEE, 1993.

[24] A. Bulling, J. A. Ward, H. Gellersen, and G. Troster, “Eye movement analysis for activityrecognition using electrooculography,” Pattern Analysis and Machine Intelligence, IEEETransactions on, vol. 33, no. 4, pp. 741–753, 2011.

[25] R. S. Rele and A. T. Duchowski, “Using eye tracking to evaluate alternative searchresults interfaces,” in Proceedings of the Human Factors and Ergonomics Society AnnualMeeting, vol. 49, pp. 1459–1463, SAGE Publications, 2005.

[26] A. Poole and L. J. Ball, “Eye tracking in hci and usability research,” Encyclopedia ofHuman-Computer Interaction, C. Ghaoui (ed.), 2006.

[27] J. Beatty, “Task-evoked pupillary responses, processing load, and the structure ofprocessing resources.,” Psychological bulletin, vol. 91, no. 2, p. 276, 1982.

[28] D. Kahneman and J. Beatty, “Pupil diameter and load on memory.,” Science, 1966.

[29] M. Sarter, B. Givens, and J. P. Bruno, “The cognitive neuroscience of sustained at-tention: where top-down meets bottom-up,” Brain research reviews, vol. 35, no. 2,pp. 146–160, 2001.

62

[30] S. R. Steinhauer, G. J. Siegle, R. Condray, and M. Pless, “Sympathetic and parasym-pathetic innervation of pupillary dilation during sustained processing,” InternationalJournal of Psychophysiology, vol. 52, no. 1, pp. 77–86, 2004.

[31] P. J. Lang, M. M. Bradley, B. N. Cuthbert, et al., “Motivated attention: Affect, ac-tivation, and action,” Attention and orienting: Sensory and motivational processes,pp. 97–135, 1997.

[32] M. M. Bradley and P. J. Lang, “Measuring emotion: the self-assessment manikin and thesemantic differential,” Journal of behavior therapy and experimental psychiatry, vol. 25,no. 1, pp. 49–59, 1994.

[33] U. Fayyad, G. Piatetsky-Shapiro, and P. Smyth, “From data mining to knowledgediscovery in databases,” AI magazine, vol. 17, no. 3, p. 37, 1996.

[34] R. Christensen, Log-Linear Models and Logistic Regression, 2th Edition. Springer, 1997.

[35] B. Liu, Web data mining. Springer, 2007.

[36] S. R. Ltd, EyeLink User Manual. 2005 - 2008.

[37] J. Blaiotta and P. Delieutraz, “Teorema central del limite,”

63

incidencia de la dilatación pupilar como variable predictiva del

Documents