introducci on a identi caci on de...

20
Introducci´ on a Identificaci´ on de Sistemas Introducci´on a Identificaci´on de Sistemas Antonio Sala Piqueras ınimos cuadrados est´ atico Notas de clase sobre control de sistemas multivariables/complejos Dept. Ing. Sistemas y Automatica (DISA) Universitat Polit` ecnica de Val` encia (UPV) – Video-presentaci´ on disponible de algunas de las secciones –

Upload: others

Post on 26-Apr-2021

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Introduccion a Identificacion de Sistemas

Antonio Sala Piqueras

Mınimos cuadrados estatico

Notas de clase sobre control de sistemas multivariables/complejos

Dept. Ing. Sistemas y Automatica (DISA)

Universitat Politecnica de Valencia (UPV)

– Video-presentacion disponible de algunas de las secciones –

Page 2: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Estructura del tema

1 Introduccion: modelos y parametros.2 Identificacion de modelos lineales estaticos.

Posibles definiciones de modelo optimo.Regresion (mınimos cuadrados).Calidad del estimado, diseno de experimentos.Total Least SquaresAjuste de modelos no linealesCompromiso error sistematico/aleatorio

[ 2] A. Sala AI2-DISA. Universitat Politecnica de Valencia

Page 3: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Conceptos previos

Se recomienda revisar conceptos de matrices, pseudoinversas,optimizacion, mınimos cuadrados en notas de asignaturasprevias o, brevemente, en: personales.upv.es/asala/videos/mgo.html

Asimismo, conceptos basicos de estadıstica; una escuetarevision aparece en: personales.upv.es/asala/videos/est1.html

Aconsejable, quizas para una segunda lectura, los conceptos de prediccion lineal

optima y su aplicacion al observador optimo (Filtro de Kalman),

personales.upv.es/asala/videos/est2k.html

[ 3] A. Sala AI2-DISA. Universitat Politecnica de Valencia

Page 4: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Introduccion

Seccion 1

Introduccion

[ 4] A. Sala AI2-DISA. Universitat Politecnica de Valencia

Page 5: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Introduccion

Modelos en control

En control tenemos dos clases de modelos:

Modelos deterministas: xk+1 = Axk + Buk , y(s) = G (s)u(s),y = Cx , . . .Modelos aleatorios que dan la probabilidad (f. densidad) deuna variable condicionada a otras:

(y |x) = N (Cx ,V )⇔ y = Cx + v , v = N (0,V )

Abstraccion: En muchas aplicaciones de control dado f (x , y), of (y |x), . . . :

y seran “salidas observables” o “informacion”.x seran

“estados internos” (observadores, filtro de Kalman), o“parametros” (identificacion).

Un “modelo matematico” sera una expresion de la “dependencia(estadıstica)” entre x e y .

[ 5] A. Sala AI2-DISA. Universitat Politecnica de Valencia

Page 6: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Introduccion

Uso de los modelos

Problemas relevantes dado modelo y = Cx + w :

Simulacion: dado x , calcular distrib. de probabilidad de y .Observacion de x (estimacion): dado y , calcular el x masprobable que lo haya generado.

Con un estimado “puntual” (media)Calcular una distribucion de probabilidad conditional f (x |y).

Identificacion dados y , x calcular C mas probable/mınimoerror/. . . .

Es el mismo que arriba cambiando el rol de C y X: observacion eidentificacion son dos caras del mismo problema.

Estimacion puntual vs. probabilıstica de C .

[ 6] A. Sala AI2-DISA. Universitat Politecnica de Valencia

Page 7: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Introduccion

Modelos Parametricos

En general, un modelo parametrico es una expresion de ladensidad de probabilidad condicional f (y |x ,θ) donde x son lasentradas/estados, y son las salidas y θ son los parametrosajustables.

Identificacion: x , y medidas experimentalmente... modelo enforma f (medidas|parametros), interpretado como [probabilidad de medidas dados

parametros].Modelos deterministas: y = m(x ,θ)

si hay errores, se supone un modelo estadıstico y = m(x ,θ) + ε, siendoε una vble. aleatoria media cero.

Si el error no es aleatorio (error sistematico), el resultado seran estimados

“desviados” (bias).

[ 7] A. Sala AI2-DISA. Universitat Politecnica de Valencia

Page 8: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Ajuste de parametros (modelos estaticos)

Seccion 2

Ajuste de parametros (modelos estaticos)

[ 8] A. Sala AI2-DISA. Universitat Politecnica de Valencia

Page 9: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Ajuste de parametros (modelos estaticos)

Los “tres mosqueteros” en identificacion (NO-LINEAL)

Supongamos un modelo probabilıstico f (medidas|parametros): f (y |θ). Tresformas de definir una “identificacion” θ dado y conocido1:

1 Maxima probabilidad de datos (maximum likelihood, ML):

θML := arg maxθ f (y |θ)Sencillo en muchos casos,“moda”.

2 Maxima probabilidad a posteriori [Bayes] (MAP):

θMAP := arg maxθ f (θ|y) = arg maxθ f (y |θ)f (θ)Usa una densidad de probabilidad “a priori” f (θ).Si f (θ) constante –uniforme–, entonces MAP≡ML.

3 Estimacion bayesiana a posteriori completa:

fposteriori(θ) := f (θ|y) = f (y |θ)f (θ)∫θf (y |θ)

Permite dar intervalos de confianza. Complicado de manejar.

1Usualmente y es un vector de muestras de repetir el experimento.

[ 9] A. Sala AI2-DISA. Universitat Politecnica de Valencia

Page 10: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Ajuste de parametros (modelos estaticos)

Identificacion lineal.

La transparencia anterior, en el caso de modelos lineales con ruidoen distribucion NORMAL2 de desv. tıp σ (vza. σ2):

y = Mθ + v , v = N (0, σ2) ⇒ f (y |θ) α e−(

v︷︸︸︷y−Mθ)2

2σ2

resulta en maximizar prob. de y = minimizar v , mınimoscuadrados:

Mınimos cuadrados, prediccion optima lineal (error nocorrelado), maximum likelihood (centro de la gaussiana,media) son definiciones EQUIVALENTES3,

Filtro de Kalman Lineal / Mınimos cuadrados recursivos sonequivalentes a la estimacion bayesiana completa.

En efecto, media y varianza “a posteriori” definen por completo unadistribucion normal.

2La distribucion de v no cambia al repetir experimento y es independiente entre experimentos.

3En el caso no lineal NO es cierto.

[ 10] A. Sala AI2-DISA. Universitat Politecnica de Valencia

Page 11: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Ajuste de parametros (modelos estaticos)

Mınimos cuadrados en identificacion, ejemplo

Teorema

Si v tiene distribucion normal media 0, identica y estadısticamenteindependiente en todas las muestras de y , la prediccion ML esidentica al resultado de mınimos cuadrados min(y − f (θm2)2):θm2 = θML.

log p(y |θ) = log κe−1

2σ v2

= log κe−1

2σ (y−f (θ))2

= − 12σ (y − f (θ))2 + log κ

Nota: κ = (σ√

2π)−1.

Varias muestras independientes:log p(y1|θ)p(y2|θ)p(y3|θ) = log p(y1|θ) + log p(y2|θ) + log p(y3|θ) =− 1

2σ ((y1 − f (θ))2 + (y2 − f (θ))2 + (y3 − f (θ))2)︸ ︷︷ ︸mınimos cuadrados

+cte.

Mınimos cuadrados ⇔ “max log∗-likelihood” con distribucion normal.*El logaritmo es monotono: max log-likelihood⇔ max-likelihood.

[ 11] A. Sala AI2-DISA. Universitat Politecnica de Valencia

Page 12: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Ajuste de parametros (modelos estaticos)

Mınimos cuadrados, caso estatico.

Consideremos yN×m = XN×qθq×m (determinista) o,

equivalentemente y = Xθ + v , v distr. normal . Suponemos y , Xconocidos de un experimento.

Ajuste mınimos cuadrados (determ.) ⇔ Max-Likelihood (estoc.)

Mejor modelo y = X θ, θ = pinv(X )y = (XTX )−1︸ ︷︷ ︸q×q

XT︸︷︷︸q×N

· y︸︷︷︸N×m

Tambien mejor prediccion lineal de y dado X : puede probarseque e = (y − y)T y XT son no correlados4:

(y − y)TX = (y − X θ)TX = yT (I − X (XTX )−1XT )X = 0

4Aplicar la formula de mejor pred. lin a yT = [Modelo]XT

[ 12] A. Sala AI2-DISA. Universitat Politecnica de Valencia

Page 13: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Ajuste de parametros (modelos estaticos)

Calidad del modelo y la prediccion

A partir de: θ = pinv(X )y︸ ︷︷ ︸media

+ pinv(X )v︸ ︷︷ ︸efecto ruido medida

Si y = Xθ, siendo θ los parametros verdaderos, la

media de θ es pinv(X )Xθ = θ : estimador no sesgado.

La matriz de varianzas-covarianzas:

E ((θ − θ)(θ − θ)T ) = pinv(X )E (vvT )pinv(X )T

[Escalado] Si E (vvT ) = σ2I (independiente entre muestras,constante):

pinv(X )E (vvT )pinv(X )T = σ2·(XTX )−1XTX (XTX )−1 = σ2 · (XTX )−1

[ 13] A. Sala AI2-DISA. Universitat Politecnica de Valencia

Page 14: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Ajuste de parametros (modelos estaticos)

Identificabilidad

La matrix F = XTX se denomina matriz de informacion.Determina la “riqueza” (excitacion) de los datos “X” para poder identificar θ

(mas precision a mas excitacion, intervalo de confianza inversamente

proprcional a excitacion).

Sus valores propios son los cuadrados de valores singulares de X .

Sea X = UΣV T :

θ puede expresarse como unos componentes principalesindependientes dados por las columnas de V : θ = V θpc .

La desviacion tıpica de la estimacion de cada componenteθpc es inversamente proporcional al valor singularasociado (dicho valor se interpreta como “informacion”).

El efecto de cada componente de θpc sobre las medidasexperimentales viene dado por la columna de U asociada.

[ 14] A. Sala AI2-DISA. Universitat Politecnica de Valencia

Page 15: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Ajuste de parametros (modelos estaticos)

Diseno de modelos/experimentos (1: pocainformacion)

[1.Poca informacion] Si el mınimo valor singular σ(X ) es

pequeno: el experimento es “poco informativo”, el parametro (estoes, combinacion θpc asociada) no es identificable:

Gran variabilidad ≈ σv/σ(X ); repetir experimento puede darvalores estimados muy diferentes.

Mal condicionamiento –mala seleccion deentradas/salidas/medidas–: Las salidas para distintos valoresde unos ciertos parametros son practicamente iguales.

[ 15] A. Sala AI2-DISA. Universitat Politecnica de Valencia

Page 16: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Ajuste de parametros (modelos estaticos)

Diseno de modelos/experimentos (1: pocainformacion)

En ese caso, se requiere:

tomar mas datos (informacion aprox. proporc. a√N), o

Redisenar el experimento (forma de obtener X , y ; seleccionde elementos de X , y), oSimplificar el modelo (eliminando parametros que influyen“poco” en las salidas observables).

Regularizacion (1): Minimizar J = ‖y − Xθ‖2 + γ‖θ‖2

El resultado es θ = inv(XTX + γI )−1XT y .

En aquellas direcciones cuya excitacion es despreciable frente a γ, se identifica

“cero” –eliminacion “automatica” de parametros no identificables–, introduce

un “bias”.

Regularizacion (2): Usar en pinv(X ) solo los valores singulares porencima de un cierto umbral [Ver TLS mas adelante].

[ 16] A. Sala AI2-DISA. Universitat Politecnica de Valencia

Page 17: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Ajuste de parametros (modelos estaticos)

Diseno de modelos/experimentos (2)

[2.Buena informacion] Si σ(X ) es grande:

Tomar mas muestras no va a mejorar mucho la precision.

Si el error de ajuste e = (y − X θ) es GRANDE, σ(X ) grande,o bien:

Modelo correcto pero ruido aleatorio grande, oEl modelo NO es correcto (los datos no son generados pory = Xθ + v).

Metodologıa “model error modelling”.

si error de ajuste e = (y − X θ) es PEQUENO, σ(X ) grande:El modelo explica bien el experimento (X , y) concreto y losparametros pueden ser identificados con precision.El modelo podrıa ser invalidado en otros experimentos diferentesfuturos5.

Metodologıa training set / test set.

5Se debe comprobar la capacidad de extrapolacion/generalizacion/repetibilidad.

[ 17] A. Sala AI2-DISA. Universitat Politecnica de Valencia

Page 18: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Ajuste de parametros (modelos estaticos)

Compromiso bias-variance (error sistematico/aleatorio)

Consideramos un posible modelo de m parametros, identificado apartir de N muestras de datos x y m funciones (regresores) fijasf1(x), f2(x), . . . :

yN×1 = [f1(x) . . . fm(x)]︸ ︷︷ ︸P N×m

· θm×1

Para mejorar, queremos anadir q regresores y parametros mas:

yN×1 = [

P︷ ︸︸ ︷f1(x) . . . fm(x)

Q︷ ︸︸ ︷fm+1(x) . . . fm+q(x)]︸ ︷︷ ︸

N×(m+q)

· θ(m+q)×1

[ 18] A. Sala AI2-DISA. Universitat Politecnica de Valencia

Page 19: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Ajuste de parametros (modelos estaticos)

Resultado principal

1. [↓] Mejora el ajuste (error sistematico –bias– disminuye).

*minθm‖y − Pθm‖ = minθm

‖y − [P Q][θm; 0q]‖ ≥ minθm+q‖y − [P Q]θm+q‖

2.[↑] Empeora sensibilidad a ruido (varianza aumenta).

Teorema

σ([P Q]) ≤ σ(P) ≤ σ(P) ≤ σ([P Q])

*minθm+q‖[P Q]θm+q‖ ≤ minθm

‖[P Q] · [θm; 0q]‖ = minθm‖P · θm‖, y analogo con el

maximo.

Anadir columnas mantiene o baja el mınimo valor singular (no nulo).

Existe al menos una combinacion de los nuevos parametros massensible a ruido – se necesitan mas datos –.

[ 19] A. Sala AI2-DISA. Universitat Politecnica de Valencia

Page 20: Introducci on a Identi caci on de Sistemaspersonales.upv.es/asala/DocenciaOnline/material/IdentE... · 2020. 4. 22. · Introducci on a Identi caci on de Sistemas Ajuste de par ametros

Introduccion a Identificacion de Sistemas

Ajuste de parametros (modelos estaticos)

Conclusiones de la seccion

Equivalencia entre mınimos cuadrados deterministas y mejorprediccion ante ruido blanco normal.

Necesidad de determinar la cantidad de informacion de unexperimento, y que (combinaciones de) parametros puedenestimarse con determinada precision.

Compromiso entre reduccion de error sistematico con modelosmas complejos y necesidad de mas informacion para ajustarlo.

Algunos de los conceptos son ilustrados en un ejemplo de Matlab en

personales.upv.es/asala/videos/id2.html.

[ 20] A. Sala AI2-DISA. Universitat Politecnica de Valencia