aprendizaje de agentes ii alberto reyes ballesteros programa itesm-iie doctorado en ciencias...

19
Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales

Upload: mateo-grajales

Post on 28-Jan-2016

220 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales

Aprendizaje de Agentes II

Alberto Reyes Ballesteros

Programa ITESM-IIE

Doctorado en Ciencias Computacionales

Page 2: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales

Intuición b2-a2

?

Page 3: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales
Page 4: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales
Page 5: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales

Modelo de una Neurona Artificial

Page 6: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales
Page 7: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales
Page 8: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales
Page 9: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales
Page 10: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales
Page 11: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales
Page 12: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales
Page 13: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales
Page 14: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales

REDES NEURONALES MULTICAPA

w1(1,1)

w1(8,4)

w2(2,8)

w2(1,1)

b1(1)

b1(8)

a2(1)

a2(2)

p(1)

p(2)

p(3)

p(4)

Page 15: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales

Introducción• Redes neuronales con una o mas capas ocultas.

• MLP - Multilayer Perceptrons (Perceptrón Multicapa)

• Normalmente cada capa oculta de una red usa el mismo tipo de función de activación.

• La función de activación de la salida es sigmoidal o lineal.

• Llamados aproximadores universales.

Page 16: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales

Introducción• Perceptrón multicapas con una sola capa oculta no-

lineal (neuronas sigmoidales) aproximan cualquier función continua.

• No hay prueba de cuantas capas ocultas se requieren para esto.

• BP-Backpropagation es un método general para resolver iterativamente los pesos y los bias del MLP.

• Usa la técnica del gradiente descendente para el cálculo de los pesos, minimizando el error.

Page 17: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales

BP-Backpropagation• Rumelhart, Hinton y Williams (1986) basandose

en trabajos de (Werbos 74) y (Parker 82).

• Método para que la RNA aprendiera la asociación entre patrones de entrada y las clases correspondientes.

• Técnica de optimización diseñada para minimizar una función objetivo:

M

kkk wydwe

1

2)(21

Page 18: Aprendizaje de Agentes II Alberto Reyes Ballesteros Programa ITESM-IIE Doctorado en Ciencias Computacionales

Algoritmo

• Inicialización aleatoria de pesos• Aplicar patrón de entrada• Propagación de la entrada a través de todas las capas• La RNA genera salidas y se calcula el error para cada

neurona de salida• Los errores se transmiten hacia atrás, partiendo de la capa

de salida hacia las neuronas de la capa intermedia• Este proceso se repite capa por capa.• Se reajustan los pesos de conexión da cada neurona en base

al error recibido.