tesis doctoral (mapas gráficos para la visualización de relaciones en sistemas de recomendación)

68

Upload: richard-moya

Post on 20-Jul-2015

167 views

Category:

Data & Analytics


0 download

TRANSCRIPT

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 2

Artículo

Hernando, A., Moya, R., Ortega, F., & Bobadilla, J. (2013).

Hierarchical Graph Maps for Visualization of Collaborative Recommender Systems

Journal of Information Sciences, 40(1), 97-106.

(JCR Impact factor: 1.087. Q2)

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 3

• Introducción y contexto

• Motivación, hipótesis y objetivos

• Ejemplo del método propuesto

• Técnicas y métricas de similaridad

• Caso de estudio

• Conclusiones y trabajos futuros

Índice

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 4

• Introducción y contexto

• Motivación, hipótesis y objetivos

• Ejemplo del método propuesto

• Técnicas y métricas de similaridad

• Caso de estudio

• Conclusiones y trabajos futuros

Índice

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 5

• Los sistemas de recomendación (SR) son sistemas inteligentes capaces de realizar recomendaciones personalizadas a usuarios registrados en el sistema.

• Se necesita conocer los gustos de los usuarios para poder realizar recomendaciones personalizadas.

• El tipo de ítems a recomendar por un SR es muy variado: películas, libros, artículos, etc.

• Nacen como consecuencia del denominado “problema de la sobrecarga de información” que hay en Internet.

Introducción

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 6

• La tarea de averiguar los gustos de los usuarios y encontrar aquellos ítems que más se ajusta a sus gustos ha requerido del uso de técnicas de Machine Learning:

Introducción

Knn (K-Vecinos) Redes Neuronales Modelos Bayesianos

Descomposición matricial Modelos probabilísticos

Texto del título

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación)

Métodos Híbridos

Sistemas de Recomendación

Filtrado Demográfico

Filtrado Basado en Contenido

Filtrado Colaborativo

Basados en Memoria

Basados en Modelos

Basados en Memoria

Basados en Modelos

7

Clasificación

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 8

• La tendencia de los SR corre paralela a la propia evolución de la web.

• Inicio de la Web: Los SR se nutrían únicamente de información explicita de los usuarios.

• Web 2.0: Utilizan información de redes sociales (amigos, followers, etc.), su comportamiento, participación en blogs, foros, etc.

• Web 3.0: Incorporan más información: Internet of things, ubicuidad, parámetros de salud, compras, hábitos, etc.

Tendencias

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 9

• Introducción y contexto

• Motivación, hipótesis y objetivos

• Ejemplo del método propuesto

• Técnicas y métricas de similaridad

• Caso de estudio

• Conclusiones y trabajos futuros

Índice

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 10

• El número de usuarios no registrados que acceden a un SR es muchísimo mayor que el de los usuarios registrados.

• Gran parte de las investigaciones en el campo de los SR se han centrado en el cálculo de recomendaciones a usuarios registrados.

• Esta tesis se centra fundamentalmente en los usuarios no registrados.

Motivación

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 11

Motivación

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 12

Si bien es cierto que los SR no pueden realizar recomendaciones personalizadas a usuarios no registrados, sí

que es posible que el SR pueda ofrecer un modelo de inferencia sencillo de interpretar que permita a un usuario

no registrado inferir por él mismo las propias recomendaciones a partir de sus gustos.

Hipótesis

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 13

• Para que este modelo de inferencia tenga sentido, debe cumplir los siguientes puntos:

1. El modelo de inferencia no debe estar basado en ecuaciones matemáticas.

2. El modelo de inferencia debe estar basado en un tipo de razonamiento similar al razonamiento humano.

3. La inferencia en el modelo propuesto debe proporcionar recomendaciones lo más similares posibles a algún mecanismo de recomendación conocido.

4. La inferencia debe estar basada en modelos visuales.

Hipótesis

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 14

• Los sistemas de inferencia basado en reglas cumplen:

1. Se basan en un razonamiento muy cercano al humano (Modus ponens, Modus tollens)

2. No se usan ecuaciones matemáticas complejas.

Modelo basado en reglas

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 15

Modelo basado en reglasEjemplo

Hecho 1 En general suele gustar la película “Ocho apellidos vascos”

Regla 1 Si te gusta la película “La isla mínima”, entonces probablemente te gustará la película “El niño”

Hecho IIUsuario no registrado

Me gusta bastante la película “La isla mínima”

InferenciaUsuario no registrado

Sería interesante ver la película “Ocho apellidos vascos” (Hecho I)

Sería interesante ver la película “El niño” (Regla I y Hecho II)

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 16

1. Inferencia compleja para el usuario: El SR tiene que ofrecer una gran cantidad de reglas y hechos.

2. Basado en representación textual: El usuario tiene que leerse una gran cantidad de reglas y hechos para poder sacar sus propias conclusiones.

Modelo basado en reglasInconvenientes

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 17

• Solventa los inconvenientes de los modelos basados en reglas:

1. No se definen infinidad de reglas y hechos.

2. Es un modelo visual (no implica lectura para el usuario)

Modelo basado en grafos

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 18

• Se propone un grafo no dirigido con las siguientes características:

1. Vértices: representarán a los ítems del SR y definirán una cantidad asociado al ítem i que indicarán el grado de confianza del hecho:

Hecho: “En general suele gustar el ítem i”

2. Aristas: Dados dos ítems i,j; existe una arista entre dos vértices asociados a estos dos ítems si existe la regla del tipo:

Regla: “Si te gusta el ítem i, entonces ‘probablemente’ te gustará el ítem j”

La longitud de la arista equivaldrá al grado de incertidumbre de la regla (‘probablemente’, ‘es posible’, ‘quizás’, etc.)

Modelo basado en grafos

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 19

• El grafo obtenido en general no es plano (las aristas se cruzan).

• No se puede representar con la longitud de la arista el grado de incertidumbre de las reglas.

Modelos basados en grafos Inconvenientes

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 20

• Construir un subgrafo a partir del grafo de relaciones entre ítems con las reglas más significativas (con mayor grado de confianza).

• Dentro de los tipos de subgrafos, se han considerado los árboles de recubrimiento mínimo (ARM) ya que:

1. Son grafos planos.

2. Las aristas no se cruzan entre ellas.

3. Con la longitud de las aristas se puede representar el grado de confianza.

4. El problema de los ARM ha sido muy estudiado y es muy conocido en el campo de la algorítmica.

Modelo definitivo

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 21

Modelo definitivoEjemplo

Hecho En general suele gustar el item “I4”

Regla Si te gusta el item “I2”, entonces probablemente te gustará el ítem “I5”

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 22

Modelo definitivoEjemplo del caso de estudio: RS-IST

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 23

• La tesis propuesta puede encuadrarse dentro del área de visualización en Machine Learning.

• Existen técnicas destinadas a la visualización de d a t o s c o m o : P C A , Ke r n e l P C A , M ap a s autoorganizados, técnicas de clustering, etc.

• Estas técnicas no son adecuadas para representar los ítems de un SR ya que aunque representan en el plano los datos, no establecen relaciones entre los datos y por tanto no proporcionan un modelo de inferencia.

Métodos de visualización en Machine Learning

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 24

• Introducción y contexto

• Motivación, hipótesis y objetivos

• Ejemplo del método propuesto

• Técnicas y métricas de similaridad

• Caso de estudio

• Conclusiones y trabajos futuros

Índice

Texto del título

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 25

Método

Calcular importancia del item

Calcular distancias entre items

Calcular el ARM

Calcular la fiabilidad de las similaridades

Texto del título

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación)

importancia(I1) = 2importancia(I2) = 3

importancia(I6) = 2

importancia(I3) = 2importancia(I4) = -2

importancia(I5) = -1

26

MétodoPaso I: Cálculo de la importancia de un ítem

UsuariosIt

emsU1 U2 U3 U4 U5

I1 4 5 4 1I2 3 5 4I3 1 5 5I4 1 4 3 2I5 2 4 3 2I6 5

Texto del título

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 27

MétodoPaso I: Cálculo de la importancia de un ítem

Items

I1 I2 I3 I4 I5 I6

Importancia 2 3 2 -2 -1 2

Texto del título

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 28

MétodoPaso II: Cálculo de distancias entre ítems

Usuarios

Item

s

U1 U2 U3 U4 U5I1 4 5 4 1I2 3 5 4I3 1 5 5I4 1 4 3 2I5 2 4 3 2I6 5

I1 I2 I3 I4 I5 I6I1 x 0.02 0.53 0.33 0.13 xI2 x 0.06 0.16 0.06 xI3 x 0.46 0.46 1I4 x 0.02 0.06I5 x 0.06I6 x

Distancias

Texto del título

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 29

MétodoPaso II: Cálculo de distancias entre ítems

I1 I2 I3 I4 I5 I6I1 x 0.02 0.53 0.33 0.13 x

I2 x 0.06 0.16 0.06 x

I3 x 0.46 0.46 1

I4 x 0.02 0.06

I5 x 0.06

I6 x

Distancias

Texto del título

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 30

MétodoPaso III: Cálculo del árbol de recubrimiento mínimo

Texto del título

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 31

MétodoPaso IV: Cálculo de la fiabilidad de las similaridades

Usuarios

Item

s

U1 U2 U3 U4 U5I1 4 5 4 1I2 3 5 4I3 1 5 5I4 1 4 3 2I5 2 4 3 2I6 5

I1 I2 I3 I4 I5 I6I1 x 0.02 0.53 0.33 0.13 xI2 x 0.06 0.16 0.06 xI3 x 0.46 0.46 1I4 x 0.02 0.06I5 x 0.06I6 x

Distancias

I1 I2 I3 I4 I5 I6I1 x 0.75 0.40 0.60 0.60 0I2 x 0.40 0.40 0.40 0I3 x 0.75 0.75 0.33I4 x 1 0.25I5 x 0.25I6 x

Fiabilidad

Texto del título

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 32

MétodoPaso IV: Cálculo de la fiabilidad de las similaridades

I1 I2 I3 I4 I5 I6I1 x 0.02 0.53 0.33 0.13 xI2 x 0.06 0.16 0.06 xI3 x 0.46 0.46 1I4 x 0.02 0.06I5 x 0.06I6 x

DistanciasI1 I2 I3 I4 I5 I6

I1 x 0.75 0.40 0.60 0.60 0I2 x 0.40 0.40 0.40 0I3 x 0.75 0.75 0.33I4 x 1 0.25I5 x 0.25I6 x

Fiabilidad

Fiabilidad 1 - 0.8 0.79 - 0.6 0.59 - 0.4 0.39 - 0.2 0.19 - 0

Color Rojo Naranja Verde Morado Azul

Tramos de fiabilidad

I1 I2 I3 I4 I5 I6I1 x 0.02 0.53 0.33 0.13 xI2 x 0.06 0.16 0.06 xI3 x 0.46 0.46 1I4 x 0.02 0.06I5 x 0.06I6 x

DistanciasI1 I2 I3 I4 I5 I6

I1 x 0.75 0.40 0.60 0.60 0I2 x 0.40 0.40 0.40 0I3 x 0.75 0.75 0.33I4 x 1 0.25I5 x 0.25I6 x

Fiabilidad

Texto del título

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 33

MétodoPaso IV: Cálculo de la fiabilidad de las similaridades

I1 I2 I3 I4 I5 I6I1 x 0.02 0.53 0.33 0.13 x

I2 x 0.06 0.16 0.06 x

I3 x 0.46 0.46 1

I4 x 0.02 0.06

I5 x 0.06

I6 x

Distancias

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 34

Resultado y conclusiones

Hecho En general suele gustar el item “I2”

Hecho En general suele gustar el item “I1”

Hecho En general suele gustar el item “I3”

Regla Si te gusta el ítem “I5”, entonces probablemente te gustará el ítem “I4”

Regla Si te gusta el ítem “I5”, entonces es posible que te guste el ítem “I2”

Regla Si te gusta el ítem “I5”, entonces quizás te guste el ítem “I6”

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 35

• Introducción y contexto

• Motivación, hipótesis y objetivos

• Ejemplo del método propuesto

• Técnicas y métricas de similaridad

• Caso de estudio

• Conclusiones y trabajos futuros

Índice

Texto del título

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 36

Método

Calcular importancia del item

Calcular distancias entre items

Calcular el ARM

Calcular la fiabilidad de las similaridades

Texto del título

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 37

SR basados en contenido

Sistemas de Recomendación

Basados en Memoria Basados en Modelos

SR basados en vectores de palabras

LSI PLSI LDA

Filtrado Basado en Contenido

No probabilísticos Probabilísticos

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 38

• Preprocesamiento de la descripción de los ítems:

• Eliminar preposiciones, artículos, etc.

• Sustituir plurales, diminutivos, etc. a su palabra raíz.

• Se trabaja con una matriz de apariciones de palabras en los ítems (palabras/items).

SR basados en contenido

Items

Pala

bras

I1 I2 I3 I4 I5

Fútbol 3 0 2 0 0

Política 0 0 4 4 2

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 39

• Calculan las recomendaciones basándose en el cálculo de distancias entre cada par de vectores de apariciones de palabras en los ítems.

SR basados en vectores de palabras

Items

Pala

bras

I1 I2 I3 I4 I5

Fútbol 3 0 2 0 0

Política 0 0 4 4 2

I1 I2 I3 I4 I5

I1 0 3.0 4.1 5.0 3.6

I2 3.0 0 4.5 4 2

I3 4.1 4.5 0 2 2.8

I4 5.0 4 2 0 2

I5 3.6 2 2.8 2 0

Distancia Euclidea

I1 I2 I3 I4 I5

I1 0 3.0 4.1 5.0 3.6

I2 3.0 0 4.5 4 2

I3 4.1 4.5 0 2 2.8

I4 5.0 4 2 0 2

I5 3.6 2 2.8 2 0

Distancia Euclidea

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 40

• Técnica de factorización matricial basada en la técnica matemática del SVD.

• Extrae (a partir de la matriz de apariciones de palabras en ítems) una serie de factores latentes que caracterizan a las palabras y los documentos.

• A partir de esos factores latentes podemos calcular las similaridades entre los ítems o las palabras.

LSIPu

blic

ació

n

Deerwester.S, Dumais.ST, Furnas.GW, Landauer.TK, and Harshman.R. Indexing by latent semantic analysis. Journal of the American Society for Information Science, page 391, 1990.

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 41

LSI

Teorema de Eckart-Young

Texto del título

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 42

Cálculo de distanciasPara SR basados en vectores de palabras y LSI

SR basados en vectores de palabras LSI

Métrica de similaridad basada en ángulos (Coseno)

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 43

• El PLSI es una evolución del LSI al que se le añado un modelo probabilístico.

• Descompone la matriz de apariciones de palabras/ítems en dos matrices que van a tener un significado probabilístico.

• Los items y las palabras están caracterizados por una distribución de probabilidad en el que se indica con que grado un item o palabra pertenecen a un tema u otro.

PLSIPu

blic

ació

n

Hofmann.T. Probabilistic latent semantic indexing. International Computer Science Institute, 1999.

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 44

PLSI

Conjunto de temas: z ∈ Z = {z1,...,zk}

Conjunto de palabras: w ∈ W = {w1,...,wn}

Conjunto de documentos: d ∈ D = {d1,...,dm}

Estudiar similaridades entre items

Probabilidad de que un documento pertenezca a un determinado tema.

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 45

PLSIEjemplo

Items

Pala

bras

I1 I2 I3 I4 I5 I6 I7 I8 I9 I10 I11Balón 3 2Fútbol 2 6 8 1 1Liga 3 1CR7 6 7

Messi 1 2 5Política 4 4 4 1 1

PP 6 3 1PSOE 4 6 1

ZP 3 5 1 1 1Rajoy 5 1 1 1 1Dinero 1 4 4

FMI 5 4 4UE 4 4 3PIB 3 1 1Ibex 2

K = 3

Temas

Fútbol Política EconomíaI1 1.00 0 0I2 1.00 0 0I3 1.00 0 0I4 0 1.00 0I5 0 1.00 0I6 0 1.00 0I7 0 0 1.00I8 0 0 1.00I9 0 0.21 0.79

I10 0.33 0.33 0.33I11 0.40 0.60 0

P (z | d)

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 46

• Modelo probabilístico que se enmarca dentro de los modelos generativos ya que trata de describir como se crea un documento.

• Al igual que el PLSI, el LDA calcula dos matrices de probabilidad P(w|z) y P(z|θ).

• La diferencia radica en como se calculan las matrices de probabilidad:

• LDA: Cada ítem esta representado por un vector que sigue una distribución de Dirichlet.

• PLSI: Cada ítem esta representado por un vector que sigue una distribución categórica.

LDAPu

blic

ació

n

Blei.D, Ng.A, and Jordan.M. Latent dirichlet allocation. the Journal of machine Learning research, pages 993–1022, 2003.

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 47

LDA

Probabilidad de que un documento pertenezca a un determinado tema.

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 48

LDAEjemplo

Items

Pala

bras

I1 I2 I3 I4 I5 I6 I7 I8 I9 I10 I11Balón 3 2Fútbol 2 6 8 1 1Liga 3 1CR7 6 7

Messi 1 2 5Política 4 4 4 1 1

PP 6 3 1PSOE 4 6 1

ZP 3 5 1 1 1Rajoy 5 1 1 1 1Dinero 1 4 4

FMI 5 4 4UE 4 4 3PIB 3 1 1Ibex 2

K = 3 Temas

Fútbol Política EconomíaI1 15.01 0.01 0.01I2 15.01 0.01 0.01I3 15.01 0.01 0.01I4 0.01 15.01 0.01I5 0.01 15.01 0.01I6 0.01 15.01 0.01I7 0.01 0.01 15.01I8 0.01 2.01 13.01I9 0.01 4.01 11.01

I10 1.01 1.01 1.01I11 2.01 3.01 0.01

P (z | θ)

Texto del título

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 49

Cálculo de distanciasPara SR basados en modelos probabilísticos

PLSI LDA

Métrica de similaridad entre distribuciones de probabilidad

Kullback-Liebler (KL)

Texto del título

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 50

SR basados en filtrado colaborativo

Sistemas de Recomendación

Basados en Memoria Basados en Modelos

Knn (K-Vecinos) Factorización Matricial

Filtrado Colaborativo

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 51

• Se toma como base la matriz de votos que los usuarios han emitido sobre los ítems

• El filtrado colaborativo consiste en ver que usuarios (o ítems) son similares al usuario (o ítem) activo al que se ha de recomendar.

SR basados en filtrado colaborativo

Items

Usu

ario

s

I1 I2 I3 I4 I5 I6U1 4 3 1 2U2 1 4 4 5U3 5 5U4 4 4 5 3 3U5 1 5 2 2

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 52

K-VecinosEsquema general

Calcular la similaridad

Buscar los k vecinos

Predecir votaciones

Elegir items recomendados

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 53

• Uno de los pasos más importantes es el de calcular la similaridad entre usuarios o ítems.

• Se han propuesto varias métricas de similaridad

• Tradicionales: MSD, Coseno, Correlación

• Destacadas: JMSD, Singularidades

• La distancia se calcula como:

Cálculo de distanciasPara la técnica de los K-Vecinos

dist(I1,I2) = 1 - sim(I1,I2)

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 54

• Una de las técnicas más importantes utilizadas en los SR basados en factorización matricial es el basado en SVD aplicado a los SR basados en FC.

• Esta técnica tiene como finalidad la de obtener una serie de factores latentes que caractericen a los usuario y a los ítems.

• A partir de estos factores se pueden calcular la similaridad en usuarios o entre ítems.

SR basados en factorización matricial

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 55

SVD aplicado a FC

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 56

SVD aplicado a FC

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 57

• Para el cálculo de similaridades entre usuario o entre ítems a partir de sus factores latentes, se puede utilizar cualquiera de las métricas basadas en distancias o en ángulos como el MSD, Coseno, Correlación, etc.

• De igual forma la distancia se calcula como:

Cálculo de distanciasPara el SVD

dist(I1,I2) = 1 - sim(I1,I2)

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 58

• Introducción y contexto

• Motivación, hipótesis y objetivos

• Ejemplo del método propuesto

• Técnicas y métricas de similaridad

• Caso de estudio

• Conclusiones y trabajos futuros

Índice

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación)

Métodos Híbridos

Sistemas de Recomendación

Filtrado Demográfico

Filtrado Basado en Contenido

Filtrado Colaborativo

Basados en Memoria

Basados en Modelos

Basados en Memoria

Basados en Modelos

Sistemas de Recomendación

Filtrado Colaborativo

Basados en Memoria

59

Caso de estudio

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 60

Base de datos

MovieLens

Número de usuarios 6.040

Número de ítems 3.900

Número de votaciones 1.000.209 (1M)

Escala 1 - 5

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 61

RS-ISTVisión general

películas más populares

Texto del título

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 62

RS-ISTPelículas más populares

Hecho En general suele gustar la película “ ”

Texto del título

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 63

RS-ISTEjemplo de inferencia

Loca academia de policía

Loca academia de policía 2

Loca academia de policía 4

Loca academia de policía 5

Loca academia de policía 3

Texto del título

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 64

RS-ISTEjemplo (Muchos vértices adyacentes)

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 65

• Introducción y contexto

• Motivación, hipótesis y objetivos

• Ejemplo del método propuesto

• Técnicas y métricas de similaridad

• Caso de estudio

• Conclusiones y trabajos futuros

Índice

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 66

• Se ha presentado un modelo de inferencia sencillo para usuarios no registrados.

• Se ha presentado un modelo de visualización para los ítems de un SR en los que es posible estudiar sus similaridades.

• Como caso de estudio, se ha probado el modelo propuesto con la base de datos de MovieLens 1M.

• Con el RS-IST resultante ha sido posible determinar que ítems (películas) han sido votadas de forma similar, pudiendo así “explicar las recomendaciones al estilo ítem”.

Conclusiones

Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 67

• Estudiar posibles formas de generar árboles personalizados para usuarios de los que se tiene cierta información sobre su perfil, gustos, etc.

• Introducir otras medidas de fiabilidad.

• Comparar las diferentes estructuras de árboles al aplicar diferentes medidas de similaridad entre ítems.

• Incorporar una etapa de pre-clasterización.

• Recuperación de información en las diferentes áreas en las que existen sistemas de recomendación basados en memoria (redes sociales, blogs, etc.), para poder aplicar más características a los árboles.

• Árboles dirigidos (Poliárboles).

• Aplicar este concepto a otros grafos planos (mallas).

Trabajos futuros

¿Preguntas?