diagnostic de defauts par les machines a vecteurs … · table des matières introduction...
TRANSCRIPT
-
HAL Id: tel-00985437https://tel.archives-ouvertes.fr/tel-00985437
Submitted on 29 Apr 2014
HAL is a multi-disciplinary open accessarchive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come fromteaching and research institutions in France orabroad, or from public or private research centers.
Larchive ouverte pluridisciplinaire HAL, estdestine au dpt et la diffusion de documentsscientifiques de niveau recherche, publis ou non,manant des tablissements denseignement et derecherche franais ou trangers, des laboratoirespublics ou privs.
Diagnostic de dfauts par les Machines VecteursSupports : application diffrents systmes
mutivariables nonlinairesNassim Laouti
To cite this version:Nassim Laouti. Diagnostic de dfauts par les Machines Vecteurs Supports : application diffrentssystmes mutivariables nonlinaires. Autre. Universit Claude Bernard - Lyon I, 2012. Franais..
https://tel.archives-ouvertes.fr/tel-00985437https://hal.archives-ouvertes.fr
-
N dordre: 161-2012 Anne 2012
THSE DE L'UNIVERSIT DE LYON Dlivre par
L'UNIVERSIT CLAUDE BERNARD LYON 1
Prsente pour obtenir le grade de docteur en automatique
COLE DOCTORALE EEA DE LYON (arrt du 7 aot 2006)
Par
M. Nassim LAOUTI
Diagnostic de dfauts par les Machines Vecteurs Supports : application diffrents systmes multivariables
non linaires
Soutenue le 21 septembre 2012, devant le jury compos de
Dr. Mazen ALAMIR GIPSA-Lab, Grenoble Rapporteur Professeur Christophe AUBRUN CRAN, Universit de Lorraine Rapporteur Professeur Michel KINNAERT Universit Libre de Bruxelles Examinateur Dr. Sami OTHMAN LAGEP, Universit de Lyon Co-encadrant Dr. Isabelle QUEINNEC LAAS, Universit de Toulouse Prsident Dr. Nida SHEIBAT-OTHMAN LAGEP, Universit de Lyon Directeur de thse
-
Ddicaces
Je ddie cette thse mes trs chers parents qui je dois tout ce que je suis, et qui m'ont
donn un vritable modle de travail, et qui m'ont appris le respect de lautre, la gentillesse
et la persvrance. J'espre qu'ils trouveront dans ce travail toute ma reconnaissance et tout
mon amour.
A mes chers frres et surs et qui ont toujours t l pour moi: Leila, Mehdi, Sihem,
Mohamed, Hafid, Rayane Yasmine
Je ddie cette thse au directeur de lcole doctorale EEA de Lyon monsieur Grard Scorletti.
A tous mes amis : Kamel, Kamel, Reda, Bassem, Sidali, Belkacem, Amine, Aziz, Sofiane et
tous les autres qui mont encourag finir ce travail
Je ddie cette thse
Nassim
-
Remerciements
Je remercie Dieu de mavoir donn la volont et le courage qui mont permis de raliser ce
travail, veuille-t-il me guider dans le droit chemin.
Je remercie Madame Nida Othman et Monsieur Sami Othman, pour leurs gentillesses
ainsi que leurs encouragements rguliers face la difficult.
Je remercie ma sur Leila pour son aide depuis toujours
Je remercie aussi les membres du jury pour avoir accept de juger ce travail. Je suis trs
honor de prsenter mes travaux de thse devant un tel jury.
Ce travail a t ralis au sein du Laboratoire dAutomatique et de Gnie des Procds de
luniversit Claude Bernard Lyon1 (LAGEP-UMR 5007). Mes remerciements s'adressent
tous les membres du laboratoire LAGEP que ce soit les doctorants, les enseignants,
ingnieurs ou les chercheurs pour mavoir accueilli parmi eux.
-
Table des matires
Introduction gnrale ................................................................................................................... 1
CHAPITRE I : Diagnostic de dfauts et thorie des Machines Vecteurs de Supports ....... 5
I.1. Gnralits ............................................................................................................................ 7
I.1.1. Terminologie en matire de diagnostic.......................................................................... 7
I.1.2. Le principe de dtection de dfaut ................................................................................. 9
I.1.3. FDI en boucle ouverte et en boucle ferme ................................................................. 10
I.1.4. Domaines concerns par la FDI ................................................................................... 11
I.1.5. Performances des techniques FDI ............................................................................... 12
I.2. Les mthodes de diagnostic ................................................................................................ 12
I.2.1. Mthodes base de modle explicite .......................................................................... 13
I.2.2. Mthodes bases sur les donnes ................................................................................. 18
I.2.3. Etapes de mise en uvre des mthodes bases sur les donnes .................................. 28
I.3. Les Machines Vecteurs de Supports ................................................................................ 39
I.3.1 Thorie de l'apprentissage statistique ........................................................................... 40
I.3.2. Les machines Vecteurs de Support pour la classification (SVM) ............................ 41
I.3.3. Les machines Vecteurs de supports pour la rgression (SVR) ................................. 56
CHAPITRE II : Systme de traitement des eaux uses ........................................................... 67
II.1. Description du systme .................................................................................................... 69
II.1.1. Le procd de traitement des eaux uses par boues actives ..................................... 70
II.1.2. La modlisation .......................................................................................................... 71
II.1.3. Le modle BSM1........................................................................................................ 73
-
II.1.4. Variables composites/mesures ................................................................................... 84
II.2. Commande des systmes de traitement des eaux uses ................................................... 86
II.3. Revue des mthodes de diagnostic du procd WWTP ................................................... 87
II.3.1. ACP (PCA en anglais) et dautres mthodes statistiques ........................................... 88
II.3.2. La Projection aux Structures Latentes ( PLS ) ........................................................... 90
II.3.3. SVM ........................................................................................................................... 91
II.4. Stratgie SVR/SVM propose pour le diagnostic du procd WWTP ............................. 92
II.4.1. Schma SVR/SVM propos ....................................................................................... 92
II.4.2. Rcapitulatif des variables dtat/ dentre/ et de sortie ............................................. 94
II.4.3. Les variables superviser ........................................................................................... 95
II.5. Implmentation de SVR pour la modlisation .................................................................. 97
II.5.1. Gnration de donnes pour lapprentissage et la validation ..................................... 97
II.5.2. Prtraitement des donnes (normalisation, filtrage) ................................................... 99
II.5.3. Analyse de corrlation/Information mutuelle ........................................................... 100
II.5.4. Rsultats de la modlisation SVR ............................................................................ 103
II.6. Implmentation de SVM pour le diagnostic de dfauts ................................................. 116
II.7. Conclusion ...................................................................................................................... 129
CHAPITRE III : Diagnostic de dfauts dans les oliennes ................................................... 131
III.1. Introduction ................................................................................................................... 133
III.1.1. Revue des mthodes de diagnostic sur les oliennes ............................................. 135
III.1.2. Revue sur la commande des oliennes ................................................................... 138
III.2. Description du systme olien ...................................................................................... 139
III.2.1. Modle des pales et pitch ........................................................................................ 141
-
III.2.2. Modle convertisseur et gnratrice ....................................................................... 141
III.2.3. Modle du systme dentranement ........................................................................ 142
III.2.4. Le systme de contrle ............................................................................................ 143
III.2.5. Dfauts considrs dans ce modle olien .............................................................. 144
III.3. Diagnostic de dfauts dans une olienne ...................................................................... 146
III.3.1. Les vecteurs des caractristiques pour chaque dfaut ............................................ 148
III.3.2. Rsultats de lapproche de diagnostic .................................................................... 151
III.4. Comparaison entre diffrentes mthodes de diagnostic ................................................ 157
III.5. Combinaison entre lapproche base sur SVM et un observateur ................................ 159
III.5.1. Conception de lobservateur de type Kalman ......................................................... 161
III.5.2. Lapproche base SVM pour la dtection/isolation de dfaut actionneur sur le
systme pitch ....................................................................................................................... 162
III.6. Conclusion .................................................................................................................... 166
CHAPITRE IV : Racteur chimique parfaitement agit ...................................................... 169
IV.1. Revue bibliographique ................................................................................................... 171
IV.2. Prsentation du systme ................................................................................................. 174
IV.2.1. Le procd............................................................................................................... 174
IV.2.2. Le modle ............................................................................................................... 175
IV.3. Implmentation du diagnostic de dfauts ...................................................................... 176
IV.3.1 Implmentation des SVMs....................................................................................... 176
IV.3.2 Implmentation de lobservateur de grand gain ...................................................... 178
IV.3.3. Rsultats et discussion ............................................................................................ 180
IV.4. Implmentation de SVR................................................................................................. 189
IV.4.1. Identification d'une drive de temprature par rgression SVM ............................ 190
-
IV.4.2. Identification des U par rgression SVM ............................................................... 193
IV.5. Conclusions .................................................................................................................... 196
Conclusion gnrale .................................................................................................................. 197
Notations .................................................................................................................................... 201
Annexes ...................................................................................................................................... 209
Annexe A ................................................................................................................................ 211
Annexe B................................................................................................................................. 219
Annexe C................................................................................................................................. 223
Bibliographie ............................................................................................................................. 227
-
Table des Figures
Figure I.1 Architecture du fonctionnement dun systme avec une commande tolrante aux
dfauts ............................................................................................................................................. 9
Figure I.2 Schma classique de dtection des dfauts ............................................................... 10
Figure I.3 Schma de classification des mthodes de diagnostic de dfauts bases sur le modle
....................................................................................................................................................... 13
Figure I.4 Mthodes de diagnostic diriges par les donnes..................................................... 19
Figure I.5 Taux de reprsentativit des composantes principales dans le modle .................... 21
Figure I.6 Lhyperplan sparateur pour des donnes bidimensionnelles .................................. 41
Figure I.7 Sparation linaire .................................................................................................... 42
Figure I.8 Sparation linaire avec des erreurs ......................................................................... 45
Figure I.9 Marge souple ............................................................................................................ 46
Figure I.10 Exemple de projection .............................................................................................. 48
Figure I.11 Vecteurs support et surface de dcision calcule par la mthode noyau ............... 49
Figure I.12 La fonction de perte insensible dans la rgression SVR linaire ........................ 58
Figure I.13 Structure de type Hammerstein ................................................................................ 61
Figure I.14 Structure de type Wiener .......................................................................................... 62
Figure II.1 Prsentation gnrale du procd BSM1..74
Figure II.2 La matire organique dans le modle BSM1 ........................................................... 79
Figure II.3 Les composs azots dans le modle BSM1 ............................................................ 79
Figure II.4 Stratgie SVR suivi par SVM pour le diagnostic de dfauts ................................... 93
Figure II.5 Concentration de nitrites/nitrates dans la 2me cuve utilise pour lapprentissage et le
test du modle SVR....................................................................................................................... 98
Figure II.6 Concentration doxygne dissous dans la 5me cuve utilise pour lapprentissage et
le test du modle SVR ................................................................................................................... 98
Figure II.7 Bote moustache des variables du procd WWTP non normes ......................... 99
Figure II.8 Bote moustache des variables du procd WWTP normalises avec la mthode
min/max ...................................................................................................................................... 100
Figure II.9 Analyse des relations entre variables avec linformation mutuelle ....................... 102
Figure II.10 Analyse des relations entre variables avec linformation mutuelle (pour CODe et
TSSe) ........................................................................................................................................... 102
-
Figure II.11 Evolution temporelle des variables dentre/sortie des matires en suspension ... 104
Figure II.12 Densit de probabilit Qin ..................................................................................... 105
Figure II.13 Concentration SNH,in et sa densit de probabilit .................................................. 106
Figure II.14 L'volution de la variable So5 par rapport Kla5 ................................................... 106
Figure II.15 Lvolution de la variable Sno2 par rapport Qa ................................................... 107
Figure II.16 Trac de Sno2 et son estime .................................................................................. 109
Figure II.17 Zoom sur le trac de Sno2 et son estim................................................................. 110
Figure II.18 Trac de TSSe et son estim .................................................................................. 110
Figure II.19 Zoom sur le trac de TSSe et son estim ............................................................... 111
Figure II.20 Trac de CODe et son estim ................................................................................ 111
Figure II.21 Trac de So5 et son estim ..................................................................................... 112
Figure II.22 Rsidu So5.............................................................................................................. 112
Figure II.23 Rsidu Sno2 ............................................................................................................ 113
Figure II.24 Rsidu filtre de Sno2 ............................................................................................. 113
Figure II.25 Densit de probabilit Sno2 .................................................................................... 114
Figure II.26 Autocorrlation du rsidu TSSe ............................................................................ 114
Figure II.27 Rsidu sur TSSe .................................................................................................... 115
Figure II.28 Densit de probabilit TSSe .................................................................................. 115
Figure II.29 Rsidu CODe ......................................................................................................... 115
Figure II.30 volution du rsidu Kla5 ........................................................................................ 119
Figure II.31 Zoom sur le rsidu Kla5 ......................................................................................... 119
Figure II.32 volution du rsidu Qa .......................................................................................... 120
Figure II.33 volution du rsidu So5 ......................................................................................... 120
Figure II.34 Trac de la mesure de loxygne dissous (So5) et son rsidu ................................ 121
Figure II.35 Zoom sur de la mesure de So5 et son rsidu .......................................................... 121
Figure II.36 volution du rsidu Sno2 ........................................................................................ 122
Figure II.37 La mesure de Sno2 et son rsidu............................................................................. 122
Figure II.38 Mesure TSSe et son rsidu .................................................................................... 123
Figure II.39 Rsultat de dcision sur le dfaut Qa .................................................................... 124
Figure II.40 Zoom sur le rsultat du dfaut Qa ......................................................................... 125
Figure II.41 Rsultat de dcision sur le dfaut Kla5 .................................................................. 126
Figure II.42 Zoom de dcision sur le dfaut Kla5 ...................................................................... 126
Figure II.43 Rsultat de dcision sur le dfaut Sno2 .................................................................. 127
Figure II.44 Zoom sur la dcision du dfaut Sno2 ...................................................................... 127
-
Figure II.45 Rsultat de la dcision sur dfaut TSSe ................................................................ 128
Figure II.46 Rsultat de la dcision sur dfaut So5 .................................................................... 129
Figure III.1 Eoliennes offshore.133
Figure III.2 Destruction dune olienne par prise de feu ......................................................... 134
Figure III.3 Coupe transversale dune nacelle dolienne ....................................................... 140
Figure III.4 Une vue d'ensemble du modle de rfrence de lolienne .................................. 140
Figure III.5 Puissance de lolienne en fonction de la vitesse du vent .................................... 143
Figure III.6 Squence vitesse du vent ...................................................................................... 144
Figure III.7 Schma de diagnostic de dfaut pour les oliennes .............................................. 146
Figure III.8 Stratgie de diagnostic de dfaut classique avec SVM ........................................ 147
Figure III.9 Schma de diagnostic de dfauts propos ............................................................ 147
Figure III.10 Stratgie propose de diagnostic de dfaut base sur SVM ................................. 147
Figure III.11 Vitesse du vent mesure ...................................................................................... 152
Figure III.12 Puissance lectrique gnre ............................................................................... 152
Figure III.13 Dtection et isolation du dfaut 2 de type gain (1b) sur le capteur de la position
pitch 2,2 m
................................................................................................................................... 153
Figure III.14 Dtection et isolation du dfaut 4 valeur fixe (type 2a) sur la vitesse du rotor ... 154
Figure III.15 Dtection et isolation du dfaut 5 de type gain (2b) sur le capteur de la vitesse
rotationnelle du rotor 2,mr
w ......................................................................................................... 155
Figure III.16 Dtection et isolation du dfaut 5 de type gain (3b) sur le capteur de la vitesse
rotationnelle de la gnratrice1,mg
w ........................................................................................... 156
Figure III.17 Dtection et isolation du dfaut 8 de type offset (4a) sur le convertisseur .......... 156
Figure III.18 Dtection et isolation du dfaut 9 (6) sur le systme dentrainement ................. 157
Figure III.19 Schma de combinaison SVM et observateur ..................................................... 161
Figure III.20 Dtection et isolation du dfaut 6 (5a) sur lactionneur2 et estimation du coefficient
damortissement e2 et de la pulsation naturelle 2nw avec lobservateur .................................... 164
Figure III.21 Dtection et isolation du dfaut 7 (5b) sur lactionneur 3 et estimation du
coefficient damortissement e3 et de la pulsation naturelle 3nw avec lobservateur .................. 164
Figure IV.1 Schma simplifi du racteur parfaitement agit du laboratoire (Tr1, Tr2, Tj1, Tj2
et THC sont des sondes de temprature P1, P2, P3 et P4 sont des pompes)...174
Figure IV.2 Schma de diagnostic de dfauts par SVM en ligne ............................................ 180
Figure IV.3 Drive dans Tj,in 55min ...................................................................................... 181
-
Figure IV.4 Classification des dfauts de THC. Effet de (variance du noyau gaussien) sur les
hyperplans optimaux (avec C=100) ............................................................................................ 182
Figure IV.5 Cas dtude par simulation (avec C=100) et diffrentes valeurs de : Occurrence de
dfaut dans THC (objective de commande Trd=70C) ................................................................. 183
Figure IV.6 Classification des defaults de THC. Effet de C (paramtre de rgularisation) sur les
hyperplans optimaux (avec =10) .............................................................................................. 184
Figure IV.7 Dfaut dans le systme de chauffe/refroidissement (HC : un actionneur) en
changeant les paramtres du PID afin dcarter THC de Tjd (Tj
d=70C) ..................................... 185
Figure IV.8 Drive dans Tr1 33 min dans le racteur du laboratoire ...................................... 186
Figure IV.9 Erreur de calibration de -5C est considre dans la sonde Tr2 dans le racteur pilote
de 250 L ...................................................................................................................................... 187
Figure IV.10 Une valuation exprimentale de la mthode SVM et de lobservateur dans un
racteur pilote de 250 L .............................................................................................................. 188
Figure IV.11 Evolution des tempratures dans le racteur pilote sans dfaut .......................... 188
Figure IV.12 Schma de SVR pour lestimation de U et lidentification de niveaux de dfauts
pendant la priode la chauffe du racteur ................................................................................... 189
Figure IV.13 Validation exprimentale de lidentification dune drive dans la sonde de
temprature Tr1 avec diffrentes valeurs de (=0.01, C=100, objectif de commande Tjd=70C)
..................................................................................................................................................... 191
Figure IV.14 Identification de la drive dans la sonde Tr1 avec diffrentes valeurs de (=60,
C=100, objectif de commande Trd=60C) ................................................................................... 192
Figure IV.15 Identification de la drive du capteur Tr1 avec diffrentes valeurs de C (=0.01,
=60) ........................................................................................................................................... 193
Figure IV.16 Estimation du coefficient dchange thermique U pendant la chauffe du racteur
(simulation avec diffrentes valeurs de U, paramtre de lobservateur =0.04) ........................ 195
Figure IV.17 Estimation exprimentale du coefficient dchange thermique U pendant la chauffe
du racteur ................................................................................................................................... 195
-
Liste des tableaux
Tableau II.1 Les concentrations intervenant dans le modle BSM1 .......................................... 75
Tableau II.2 Paramtres du modle BSM1 ................................................................................ 77
Tableau II.3 Paramtres de dcantation ..................................................................................... 83
Tableau II.4 Corrlation des variables avec CODeff ................................................................ 101
Tableau II.5 Performances des modles SVR .......................................................................... 109
Tableau II.6 Les diffrents dfauts considrs ......................................................................... 109
Tableau II.7 Rsultats de dtection de dfauts ......................................................................... 117
Tableau III.1 Paramtres du modle de rfrence de lolienne ............................................... 143
Tableau III.2 Dfauts considrs dans le modle olien de rfrence ...................................... 145
Tableau III.3 Rsultats de diagnostic du dfaut 1 ..................................................................... 158
Tableau III.4 Rsultats de diagnostic du dfaut 2 ..................................................................... 159
Tableau III.5 Rsultats de dtection des dfauts ....................................................................... 166
Tableau IV.1 Vecteurs dentrs SVM (xi), (i est linstant de temps) ........................................ 177
Tableau IV.2 Correspondance entre rsidu de la temprature de la double enveloppe et du bain
thermost (R=rsidu)................................................................................................................... 178
-
1
Introduction gnrale Tout ce que je sais, :c'est que je ne sais rien Socrate
La socit actuelle est trs oriente vers la technologie et dpend ainsi de la disponibilit, la
scurit et la fiabilit de technologies de plus en plus complexes. Cependant, la matrise parfaite
de ces systmes reste un sujet important et ouvert. Afin de satisfaire le bon fonctionnement, le
diagnostic de dfaut Fault detection and isolation FDI apparat ainsi comme une ncessit
qui consiste identifier les causes du dfaut partir des symptmes ou signaux perus afin
d'viter toute propagation de ce dfaut. Ce dernier peut occasionner notamment :
1. Un arrt de fonctionnement du systme,
2. Des dgts matriels,
3. La pollution de lenvironnement,
4. Des dangers pour l'utilisateur.
Le diagnostic de dfauts est, en fait, lensemble des actions mises en uvre pour dtecter,
localiser et identifier tout dysfonctionnement sur un systme. Ceci peut se faire partir des
informations pouvant tre rcupres du systme, telles que les mesures fournies par les
capteurs, les sorties calcules par les contrleurs, et les connaissances sur la structure ou le
modle du systme. Parmi les intrts du diagnostic de dfauts figure l'optimisation des
oprations de maintenance, la minimisation de larrt du service, lassurance dune bonne qualit
du produit, ainsi que la reconfiguration de la commande.
La conception d'un systme de diagnostic performant n'est, cependant, pas une tche facile
raliser, puisque la majorit des systmes rels sont de nature non-linaire faisant intervenir un
grand nombre de variables et travaillant dans un environnement entach de bruit, et affect par
diffrents types de perturbations. Depuis des annes, un grand nombre de chercheurs se sont
intresss la rsolution du problme de diagnostic des dfauts. On trouve ainsi plusieurs tudes
dans la littrature qui proposent diffrentes techniques de diagnostic de dfauts. Dune faon
gnrale, on peut dcomposer les mthodes de diagnostic en deux grandes familles : des
mthodes bases sur le modle, et des mthodes bases sur les donnes rcupres partir du
systme. Cependant, la complexit des systmes industriels rend difficile, voire impossible,
lobtention dun modle fondamental exact et prcis reprsentant le systme dans toutes les
conditions de fonctionnement afin de lutiliser pour raliser un diagnostic de dfaut par modle.
Dun autre ct, la technologie moderne nous offre un grand bnfice puisquelle fournit un
grand nombre dinformations (donnes) mais dont lanalyse nest pas vidente, ce qui explique
-
2
le recours des mthodes de diagnostic de dfauts bases sur les donnes. En plus la nature des
signatures(ou symptmes) de dfauts qui sont des grandeurs alatoires rend la dtection dune
diffrence ventuelle entre la signature nominale et celle mesure ne peut pas se faire facilement
avec les mthodes dterministes.
Pour ces raisons, lintrt des industriels pour les mthodes de diagnostic de dfauts diriges par
des donnes notamment celle de lintelligence artificielle (rseaux de neurones, systmes
experts,..) prend de plus en plus dampleur. Lintelligence artificielle a pour but dlaborer des
systmes ayant des capacits intellectuelles comparables lhomme capable de prendre des
dcisions dune manire automatique dans lenvironnement peru. Dans ce vaste domaine, on
trouve un axe de recherche assez important qui est lapprentissage automatique Machine
Learning (Ao et al., 2010) qui permet de bien comprendre un phnomne ou un systme
illustr par un nombre limit dexemples de donnes afin de construire des modles pouvant tre
appliqus des nouvelles observations (exemples). Dans cette thse, la mthode dintelligence
artificielle stochastique Machines Vecteurs Supports (ou Sparateur Vaste Marge, Support
Vector Machines, SVM) est utilise pour la conception des mthodes de diagnostic avances.
La mthode SVM est issue de la thorie de lapprentissage statistique (Vapnik, 1998) introduite
par Vapnik dans les annes 90 (Boser et al., 1992). Elle a t conue au dpart pour trouver un
discriminateur optimal entre deux classes de donnes, et a t ensuite tendue pour le cas de la
rgression. La capacit de gnralisation, et l'aspect stochastique ont favoris l'utilisation de cette
mthode d'apprentissage statistique pour le diagnostic de dfauts. Dans ce cas, le diagnostic de
dfaut est assimil un problme de classification (en deux classes : normale et anormale). Dans
cette mthode, le choix et lextraction des caractristiques reprsentatives de chaque dfaut
reprsentent l'tape la plus importante afin dtre sensible aux symptmes du dfaut et dobtenir
ainsi un systme de diagnostic ractif et prcis.
Ce travail contribue dvelopper une nouvelle approche originale de diagnostic de dfauts assez
performante en termes de prcision, temps de dtection et permettant un pourcentage quasi nul
des fausses alarmes. La mthode SVM est utilise en premier choix pour la dtection et
lisolation de dfaut. Dans certains cas, la modlisation par SVM pour la rgression SVR est
ralise en parallle afin dajouter des estimations au vecteur de mesure. Dans dautres cas, une
combinaison avec des mthodes bases sur le modle (principalement lobservateur grand
gain) a t ncessaire afin de garantir une bonne isolation de dfaut. Cette stratgie est applique
aux systmes rels lchelle de laboratoire/pilote dans le cas dun racteur chimique, et en
simulation dans le cas de procd de traitement des eaux uses et du systme olien.
-
3
Ce mmoire est organis comme suit :
Le premier chapitre est ddi la revue des mthodes de diagnostic et leurs applications suivie
dune prsentation de la thorie des mthodes utilises dans cette thse, savoir la mthode
SVM, SVR, et quelques observateurs non linaires.
Le deuxime chapitre concerne la premire application de cette thse qui est le systme de
traitement des eaux uses Waste Water Traitement Process WWTP . Ce chapitre prsente
tout dabord le procd et son modle utilis pour la simulation. Ensuite, la mthode SVR est
utilise pour la modlisation (entre/sortie) de certaines variables cls. La mthode SVM est
galement utilise pour le diagnostic de dfaut dans ce systme en utilisant les variables estimes
par SVR en plus des variables mesurs en ligne. Enfin, quelques rsultats de simulation sont
discuts.
Le troisime chapitre est consacr au systme olien Wind Turbine en appliquant la
mthode SVM et un observateur de type Kalman pour le diagnostic de dfaut. On utilisera un
benchmark disponible sur internet pour cette application. La stratgie propose dans ce chapitre
par lauteur de cette thse (Laouti et al., 2011a) a dmontr son efficacit en se classant premire
par rapport 12 autres mthodes lors dune comptition internationale, organise par la socit
kk-electronic, sur le diagnostic de dfaut dans les oliennes .
Le quatrime chapitre prsente lapplication de la mthode SVM (classification et rgression)
aux racteurs chimiques parfaitement agits Continuous Stirred Tank Reactor, CSTR .
Dans chaque application, une revue des mthodes de diagnostic employes dans le domaine en
question est prsente ainsi que le systme et son modle. Par la suite la manire choisie pour
appliquer les SVM est dfinie et les rsultats de simulation sont discuts.
Le mmoire se termine par une conclusion gnrale rsumant les contributions de la thse et
prsentant les perspectives de recherche que je souhaite poursuivre dans lavenir ainsi que
quelques rflexions sur ces prochaines voies de recherches.
Parmi les contributions de cette thse on cite :
1. Une revue de la mthode SVM et ses applications pour le diagnostic de dfauts.
2. La combinaison entre une mthode de diagnostic base sur les donnes SVM avec une
mthode base sur le modle Observateur afin de tirer profit des avantages de chaque
mthode.
-
4
3. Lapplication de la mthode SVM dans trois procds diffrents : un racteur parfaitement
agit, un systme olien et un systme de traitement des eaux uses.
4. Un capteur logiciel bas sur SVM rgression SVR est dvelopp et sa capacit de
prdiction et de gnralisation face un environnement bruit et assez perturb est tudie.
-
5
CHAPITRE I : Diagnostic de dfauts et thorie des Machines Vecteurs de Supports
-
6
-
7
Dans ce chapitre, nous prsentons dune manire simplifie les concepts basiques de diagnostic
de dfauts, et les fondements thoriques des mthodes utilises dans cette thse telles que les
Machines Vecteurs Supports SVM, Observateurs, Analyse en Composantes Principales, etc.
I.1. Gnralits
La recherche constante dune meilleure comptitivit pousse les entreprises produire des
machines ayant une grande fiabilit et disponibilit. Cependant, un systme quelle que soit sa
modernit et sa robustesse, est affect par des dysfonctionnements qui peuvent compromettre son
bon fonctionnement. Il apparat donc ncessaire didentifier rapidement les changements
inattendus (dfauts).
Dans cette premire partie, nous allons d'abord prsenter les principes de diagnostic de dfauts et
quelques dfinitions de la terminologie dans ce domaine.
I.1.1. Terminologie en matire de diagnostic
Partant du fait que le diagnostic de dfaut est rparti sur plusieurs domaines technologiques, un
comit technique SAFEPROCESS de la Fdration internationale de contrle automatique IFAC
a essay de proposer une terminologie unifie (Isermann and Ball, 1997). La terminologie
dfinie par ce comit sera utilise dans ce mmoire :
Dfaut : cart non autoris d'au moins une proprit caractristique ou variable du systme
partir du comportement acceptable / habituelle /standard du systme.
Panne : Linterruption permanente d'une capacit du systme pour effectuer une fonction requise
dans des conditions de fonctionnement spcifies.
Dysfonctionnement : Lirrgularit intermittente dans l'accomplissement de la fonction
souhaite du systme.
Dtection de dfauts : Dtermination de dfauts prsents dans un systme et l'heure de
dtection.
Isolation des dfauts : Dtermination du type, de l'emplacement et du temps de dtection d'un
dfaut. Cette tape suit ltape de dtection de dfauts.
Identification de dfauts : Dtermination de la taille et variation dans le temps du
comportement d'un dfaut. Cette tape suit ltape de lisolation de dfaut.
-
8
Diagnostic des dfauts : Dtermination du type, de la taille, de l'emplacement et du temps de
dtection d'un dfaut. Cette tape suit la dtection de dfaut et inclut lisolation et l'identification
de dfaut.
Rsidu : Lindicateur de dfaut, bas sur les carts entre les mesures et un modle bas sur des
calculs d'quations.
Symptme : Le changement d'une grandeur observable du comportement normal.
Surveillance : Cest une tche continue en temps rel dterminant les conditions possibles d'un
systme physique, tout en reconnaissant et en indiquant des anomalies du comportement.
Supervision : La surveillance d'un systme physique tout en prenant des actions appropries
pour maintenir le fonctionnement dans le cas de dfauts.
Scurit : Aptitude d'un systme ne pas causer de danger pour les personnes, le matriel ou
pour l'environnement.
Modle quantitatif : Utilise des relations statiques et dynamiques entre les variables du systme
et des paramtres afin de dcrire le comportement d'un systme en terme quantitatif
mathmatique.
Modle qualitatif : Utilise des relations statiques et dynamiques entre les variables du systme
et des paramtres pour dcrire le comportement du systme en termes qualitatifs tels que les
causalits ou les rgles.
Pour plus de dtails voir (Isermann, 2011, Isermann, 2006).
En rsum, le diagnostic de dfaut consiste dtecter, isoler et estimer le dfaut. La dtection
du dfaut dtermine linstant dapparition dun mauvais fonctionnement dans le systme, tandis
que lisolation du dfaut consiste cerner (identifier) les causes ou les sources de dfaut afin de
dire s'il s'agit d'un dfaut de type capteur, actionneur ou procd, et lidentification du dfaut
donne une estimation de certaines caractristiques du dfaut telle que son amplitude.
Le rle de diagnostic de dfaut est dassurer la scurit et le fonctionnement optimal du systme
par lindication de tout tat non dsir (ou statu hors contrle) permettant ainsi dviter tout
dommage ou accident. Gnralement, le diagnostic de dfauts se fait en ligne. Les tches de
dtection et de localisation sont accomplies paralllement ou bien une tche dclenche l'autre.
-
9
Nous pouvons souligner que le terme diagnostic a une origine mdicale, qui signifie trouver
les causes de la maladie (dfaut) partir des symptmes perus (les signes observables).
I.1.2. Le principe de dtection de dfaut
La Figure I.1 montre un schma global du fonctionnement dun systme pouvant tre affect par
diffrents types de dfauts. Comme cest le cas dans la plupart des systmes industriels, ce
procd est rgul en boucle ferme avec un contrleur dont lobjectif est de maintenir la sortie
Y le plus proche possible de la consigne Yref. Des instruments de mesure transmettent les
donnes acquises englobant les entres et les sorties mesures ainsi que la sortie du contrleur
vers l'organe de dtection et de diagnostic de dfauts. En plus de ces donnes, le module de
diagnostic de dfaut utilise un modle (fondamental ou statistique) pour raliser la surveillance
du systme et informer le module de reconfiguration de la prsence de dfauts.
Figure I.1 Architecture du fonctionnement dun systme avec une commande tolrante aux
dfauts
Le bloc de reconfiguration permet de garder le systme dans ltat dsir par le rglage des
paramtres du contrleur ou par une adaptation dune nouvelle loi de commande (Blanke et al.,
2006, Blanke et al., 2003, Prakash et al., 2002). On note quil existe plusieurs mthodes de
reconfiguration, toutefois elles ne seront pas discutes dans ce mmoire. Le but de la
reconfiguration est de continuer faire fonctionner le systme tout en maintenant les
performances/conditions de scurit requises malgr la prsence de dysfonctionnement dans
l'attente d'une opration de maintenance (Patton, 1997).
Afin de raliser le diagnostic des dfauts, une premire approche consiste dupliquer les
composants d'instruments de mesure pour augmenter la fiabilit. Cela nous permet de choisir la
mesure saine partir des mesures disponibles. Cette approche sappelle la redondance
-
10
matrielle. Elle est utilise dans le diagnostic, surtout dans le domaine aronautique, mais elle
entrane une augmentation des cots et une rduction de lautonomie du systme. La deuxime
approche, qui est la redondance analytique, est trs intressante la fois sur le plan financier et
technique puisquelle se base uniquement sur lexploitation de relations existantes entre les
diffrentes variables mesures ou estimes. Aprs la collection des donnes, on essaie dextraire
les informations utiles partir de ces donnes, en dautres termes, de convertir ces donnes
brutes en quelque chose de significatif pour des objectifs bien prcis. Le processus de dtection
de dfauts proprement dit est donc compos essentiellement de deux phases (Chow et al., 1982) :
gnration de rsidus suivie par lanalyse de rsidus, comme le montre la Figure I.2
Figure I.2 Schma classique de dtection des dfauts
Gnration des rsidus : Cette tape consiste crer un signal calculant la diffrence entre la
sortie relle et celle estime. Le rsidu est nul (ou ngatif dans certaines mthodes) dans le cas
du fonctionnement normal, et en cas de dysfonctionnement, il sera proportionnel la gravit du
dfaut.
valuation des rsidus : Cette phase permet d'analyser les indicateurs de dfaut gnrs et de
dfinir un seuil (fixe, adaptatif, ou statistique) qui va dcider de l'instant de changement d'tat de
fonctionnement du systme. En effet, dans le cas rel, les bruits de mesure, les imprcisions de
modlisation et les perturbations ne sont pas des grandeurs dterministes mais de nature alatoire
car ils vont introduire des variations imprvisibles sur le systme. Cette tape est donc capitale
afin de diminuer les taux de fausse alarme ou de non dtection.
I.1.3. FDI en boucle ouverte et en boucle ferme
Un dfaut agit dune manire diffrente sur le systme dpendamment si le fonctionnement (de
la commande) est en boucle ouverte ou en boucle ferme. Il influence les sorties et/ou les entres
mesurables et/ou les paramtres internes du systme ou les variables dtats non mesurables.
-
11
Lorsquun systme ou procd fonctionne en boucle ouverte et quun dfaut apparat, ce dernier
va influencer la sortie Y par un cart (offset) Y. Par contre, dans le cas de procd fonctionnant
en boucle ferme, la sortie risque de ne montrer quune faible dviation qui disparat
rapidement, surtout si un contrleur de type intgral est utilis pour asservir cette sortie
(contrleur PI). En revanche, la variable dentre manipule U va montrer un offset permanent
U. Il est souligner que la sortie est galement affecte par des bruits, perturbations et des
variations dans U. Cela rend la tche de diagnostic trs difficile.
On note galement que les dfauts peuvent apparatre de diffrentes faons, dune manire
brusque (cest le cas dune coupure de phase dans un moteur lectrique), dune faon progressive
(on parle dune drive lente, cest le cas dencrassement) ou dune faon intermittente qui
apparat selon les conditions de fonctionnement (temprature, pression, concentration).
I.1.4. Domaines concerns par la FDI
La communaut de l'automatique a tabli un cadre thorique bien fond pour le diagnostic de
dfaut pour les systmes linaires (Nyberg, 1999, Chow et al., 1982) et non linaires (Ding,
2008). Une revue dtaille des techniques dveloppes pour le diagnostic de dfauts est donne
dans (Venkatasubramanian V. et al., 2003) et un grand nombre d'applications en ingnierie
jusqu'en 1996 est fourni dans (Isermann and Ball, 1997) .
Dans cette littrature, nous pouvons citer les applications suivantes :
Procds chimiques : (Caccavale et al., 2011, Verron, 2007, Pierri et al., 2008a,
Chetouani, 2006, Ram Maurya et al., 2004)
Moteurs, machines et roulements : (Verucchi et al., 2008, Ding, 2008, Isermann,
2005)
Eoliennes : (Wei, 2010, Dolan, 2010), Donders, 2002)
Procd de traitement des eaux uses : (Baggiani and Marsili-Libelli, 2009,
Wimberger and Verde, 2008, Tharrault, 2008)
Turbine gaz industrielle : (Simani et al., 2003)
Systme hydraulique : (Ding, 2008, Hammouri et al., 2002)
Industrie automobile : (Arnanz et al., 2011,Saludes Rodil et al., 2009, Svard and
Nyberg, 2010)
Rseau de distribution lectrique : (Mohamed and Rao, 1995)
Robot manipulateurs : (Paviglianiti et al., 2010)
-
12
Circuit lectronique analogique : (Mohsen and El-Yazeed, 2004)
Systme de contrle du vol davion : (Hajiyev, 2012)
On peut trouver aussi une revue dtaille sur le diagnostic de dfauts appliqu sur les
systmes de chauffage, ventilation, et climatisation : (Katipamula and Brambley,
2005).
I.1.5. Performances des techniques FDI
Afin d'valuer la performance d'une technique de diagnostic de dfauts ou la comparer avec
dautres mthodes, il faut dfinir certains critres de performances respecter:
1. La rapidit de dtection du dfaut.
2. La minimisation de fausses alarmes
3. La robustesse de la mthode face la prsence de bruit, perturbation et erreur de
modlisation.
4. Ladaptation face aux variations du procd.
5. La capacit identifier des dfauts multiples.
6. La capacit manipuler diffrents types de dfauts (actionneur, capteur, procd).
7. La diagnosticabilit ou la capacit de distinction entre les diffrents dfauts.
8. La sensibilit face des petits dfauts.
9. La prcision de la localisation.
10. La convenance par rapport aux systmes rels gnralement non linaires.
11. Laptitude inclure la commande tolrante aux dfauts.
12. La simplicit d'implmentation et d'utilisation.
I.2. Les mthodes de diagnostic
Des chercheurs de domaines varis ont essay de raliser la tche de diagnostic pour diffrents
systmes en apportant leur connaissance et outils de certains domaines de recherche. Cela
conduit l'enrichissement de mthodes de diagnostic.
Certains chercheurs dcomposent les mthodes de diagnostic en 3 catgories (Isermann, 2011,
Ping, 2011, Verron, 2007, Frank et al., 2000). Dans cette thse, les approches de diagnostic de
dfauts sont dcomposes en deux grandes catgories, comme propos par (Zhang and Jiang,
2008) et (Venkatasubramanian V. et al., 2003a) :
-
13
1. Schmas bass sur le modle (Venkatasubramanian V. et al.,
2003a,Venkatasubramanian et al., 2003b)
2. Schmas bass sur les donnes (sans modle a priori) (Venkatasubramanian, 2003c)
Ces approches sont brivement discutes dans les paragraphes suivants.
I.2.1. Mthodes base de modle explicite
Les mthodes bases sur un modle explicite utilisent un modle dcrivant les relations
fondamentales gouvernant le systme afin de gnrer des symptmes de dfauts (Simani et al.,
2003). Ces mthodes ont de nombreux avantages car elles permettent didentifier le type du
dfaut et de remonter la source du dfaut pour diffrentes classes de systmes. La plupart des
mthodes base de modle reposent sur le concept de redondance analytique qui consiste
vrifier la cohrence entre le comportement simul du modle et celui rellement observ, do
la ncessit davoir un modle dtaill et suffisamment prcis du systme afin d'avoir des
rsultats satisfaisants. Ceci est ralis en gnrant des rsidus qui permettent leur tour de
dtecter un cart entre le comportement dfectueux et le comportement normal du systme.
Plusieurs mthodes sont envisageables pour lobtention de rsidus partir de modles
analytiques (Figure I.3). On peut citer par exemple les mthodes par estimation de paramtres,
par estimation d'tat, ou par espace de parit.
Figure I.3 Schma de classification des mthodes de diagnostic de dfauts bases sur le
modle
-
14
Approche par estimation de paramtres :
Partant de l'ide qu'un dfaut se reflte dans les paramtres physiques du systme, des mthodes
d'estimation paramtriques sont utilises pour estimer la valeur actuelle de ces paramtres. Le
rsidu est ainsi calcul partir de l'cart entre la valeur des paramtres estims et celle de
rfrences obtenue dans le cas sans dfaut (Simani et al., 2003, Gertler, 1998, Fuente et al.,
1996).
Approche par espace de parit :
Cette technique se base sur la rcriture des quations d'tat et de mesure de telle sorte que seules
les variables connues (entres et sorties) sont autorises apparatre. Ces variables connues sont
ensuite utilises afin de construire un rsidu indicateur de dfaut.
Soit le modle
zBzA
G M dcrivant le systme
zBzA
pG . Ainsi le rsidu peut tre dfini
comme suit :
zuzB
zA
zB
zA
zr (I.1)
Plusieurs travaux ont utilis cette mthode pour le diagnostic de dfauts (Gustafsson, 2007,
Gertler, 1998) ou ont combin cette mthode avec la mthode destimation de paramtre
(Isermann, 2005).
Approche par estimation d'tat (observateur)
La construction des observateurs dtat reprsente une des techniques les plus employes dans
lapproche base sur le modle (Ding, 2008, Pierri et al., 2008b, Li et al., 2008, Isermann, 2006,
Simani et al., 2003, Venkatasubramanian V. et al., 2003a, Lootsma, 2001, Lootsma, 1999). La
redondance analytique est obtenue grce aux tats estims partir dun modle adquat et dun
ensemble de mesures appropries. En comparant les variables estimes et mesures, un ensemble
de signaux (rsidus) sensibles aux dfauts est gnr. Ces rsidus sont ensuite analyss pour
dtecter et/ou isoler le dfaut.
Diffrents types dobservateurs ont t proposs dans la littrature pour les systmes linaires et
non linaires. Parmi les techniques les plus utilises, on peut citer les observateurs entre
inconnue (Sotomayor and Odloak, 2005); les observateurs bass sur le placement de structure
propre The eigen structure assignment approach (Patton and Chen, 2000), les observateurs
-
15
mode glissant (Edwards et al., 2000) , le filtre de Kalman tendu qui a t initialement appliqu
pour la dtection et lisolation des dfauts des systmes non linaires par (Huang et al., 2003).
Le problme fondamental de dtection et disolation des dfauts de systmes non linaires a t
introduit initialement par Frank (Frank, 1990). Depuis lors, plusieurs techniques ont t utilises
pour les systmes non linaires. Une revue sur les principales approches bases sur les
observateurs pour les systmes non linaires a t donne par (Alcorta Garca and Frank, 1997) .
Les auteurs dans (Hammouri et al., 2002), (De Persis and Isidori, 2001), (Kabore et al., 2000) et
(Hammouri et al., 1999) ont propos une solution pour la dtection et lisolation des dfauts des
systmes non linaires en combinant une approche gomtrique de dcouplage avec les
techniques des observateurs non linaires, notamment le grand gain.
Tout l'art de ces approches rside dans le choix du terme correctif et plus particulirement la
synthse de gain qui a pour objectif non seulement de s'assurer de la convergence de l'estimation
vers la sortie relle du procd mais aussi le dcouplage par rapport aux autres dfauts.
Dans cette thse on sintresse deux types dobservateurs ; un observateur grand gain et un
autre de type Kalman cause de leur convergence exponentielle. Lobservateur grand gain
sera appliqu dans lestimation dtat d'un racteur chimique alors que lobservateur de type
Kalman trouvera son application dans le systme olien. Un bref rappel de ces types
dobservateurs est donn ci-dessous.
I.2.1.1. Observateur grand gain
Ce type dobservateur peut sappliquer une large classe de systmes non linaires qui
scrivent sous la forme suivante :
Cxtxty
ttxtstutx
ttxtxtstuxtstuAtx
ttxtstuxtstuAtx
qqq
qqqqqq
)()(
)())(),(),(()(
)())(,),(),(),(())(),(()(
)())(),(),(())(),(()(
1
111111
111211
(I.2)
O nTq Rxxx ,,1 est le vecteur dtat, T
ikii xxx ],,[ 1 , tu est lentre, suAi , est une
matrice carre de dimension ).( nkqkk , s(t) est un signal connu, Tq ],,[ 1 sont des
-
16
fonctions non linaires et supposs diffrentiables, Tq ],,[ 1 est un vecteur non connu
born, 0,,0, kIC .
Un observateur grand gain peut tre construit pour le systme prcdent en se basant sur les
hypothses suivantes:
H1) est globalement Lipschitz par rapport x.
H2) Les matrices ))(),(( tstuAi et leurs drives sont inversibles et bornes
H3) Les matrices ))(),(( tstuAi sont diffrentiables par rapport au temps et leurs drives sont
bornes.
Dans ce cas, lobservateur grand gain du systme (I.2) est donn par:
)())(),(),(())(),(( 1 yxCKtxtstuxtstuAx (I.3)
O K est une matrice de taille kn tel que KCA est une matrice Hurwitz,
000
))(),((100
0))(),((200
00))(),((10
))(),((
tstuqA
tstuA
tstuA
tstuA (I.4)
),,(
)1,,1,,(1
)1,,(1
),(
xsuq
qxxsuq
xsu
tu
,
q
00
00
20
00
(I.5)
))(),((1))(),((10
00
))(),((10
000
)(
tstuqAtstuA
tstuAk
I
t
(I.6)
0000
000
000
000
kI
kI
kI
A
(I.7)
est un paramtre de rglage positif, Ik est la matrice identit de taille kk .
-
17
Thorme: (bas sur les rsultats donns dans Farza et al., 1997, Gauthier et al., 1992)
Supposons que le systme (I.2) satisfait les hypothses H1), H2) and H3), alors:
! " )0()0()()( xxetxtx t
O est la norme infinie (L ) de )(t ; 0#! , 0#" et 0# sont des constantes. Cela
implique que, si 0 , alors, le systme (I.3) est un observateur exponentiel du systme (I.2).
I.2.1.2. Observateur du type Kalman
Lobservateur de type Kalman a t initialement propos par (Bornard et al., 1989) et
(Hammouri and de Leon Morales, 1990) pour une classe de systmes non linaires o la matrice
dtat peut dpendre du signal dentre, du signal de sortie ou du temps et toutes les entres sont
rgulirement persistantes. Ce systme peut se mettre sous la forme :
Cxy
uxuAx )()( $ (I.8)
O %y ; nx % ; mu % et $(u) est un vecteur qui dpend non linairement de u.
Notons par ),( 0tsu& , la matrice de transition, la solution unique de lquation :
),(.)(),( 00 tssuAds
tsdu
u &&
(I.9)
Notons par ),,( 100 tttuG le Grammien dobservabilit relatif lentre u sur lintervalle
[t0, t0+ t1] :
'
10
0
),(),(,, 0*
0*
100
tt
t
uu dtttCCtttttuG && (I.10)
O C* reprsente la transpose de C.
Dfinition :
Lentre uRm est dite rgulirement persistante pour le systme (I.8) si ( t1 > 0, ( )1 > 0, ( )2
> 0 and ( t0 * 0 tels que 0tt*+ :
2100max
1100min
,,
,,
),
),
*
tttuG
tttuG (I.11)
-
18
O min, et max, reprsentent la plus petite et la plus grande valeur propre respectivement.
Thorme: (Bornard and Hammouri, 1991)
Si u est rgulirement persistante, alors pour tout > 0, le systme suivant :
CCuARRuARR
yCxCRuGxuAx
TT
T
)(.)(.
)()( 1
(I.12)
est un observateur exponentiel pour (I.8). Le paramtre de rglage dtermine la vitesse de
convergence de lobservateur qui est garantie si la matrice R est symtrique dfinie positive.
La particularit de lobservateur de type Kalman est son gain variable donn par la rsolution de
lquation algbrique de Riccati.
I.2.2. Mthodes bases sur les donnes
La disponibilit dune grande quantit des donnes ainsi que les inconvnients des mthodes
bases sur le modle (dus la ncessit davoir un modle prcis par exemple), ont encourag la
croissance des mthodes de diagnostic bases sur les donnes. Ces mthodes peuvent permettre
des dveloppements rigoureux des donnes disponibles (mesures historiques ou en temps rel)
mme dans le cas de systmes complexes, do leur succs dans les applications industrielles.
Elles font appel des procdures d'apprentissage et de reconnaissance de forme, la logique
floue ou lintelligence artificielle (Frank and Kppen-Seliger, 1997) afin de gnrer les
symptmes de dfaut qui seront analyss pour fournir la dcision de diagnostic de dfaut (Reiter,
1987).
Les mthodes bases sur les donnes sont appropries pratiquement pour n'importe quel type de
problme pour lequel d'importantes quantits de donnes mesures reprsentatives du
fonctionnement du systme sont disponibles. Elles sont dautant plus intressantes lorsque le
modle mathmatique du systme nest pas disponible, ce qui rend inutilisables les mthodes de
diagnostic bases sur le modle. Lapplication de ces mthodes est ralise en diffrentes tapes
dacquisition et prtraitement des donnes, de modlisation/apprentissage et de validation. La
Figure I.4 rpertorie les diffrentes mthodes de diagnostic de dfauts bases sur les donnes. Un
aperu des mthodes bases sur des donnes est donn dans (Venkatasubramanian, 2003).
-
19
Figure I.4 Mthodes de diagnostic diriges par les donnes
Vrification de limites et tendances
La mthode la plus simple de supervision dans le cas dabsence de modle est mono variable et
se base sur la vrification de limites (seuils) de la valeur de certaines variables mesurables telles
que : la pression, la temprature, la force, la vitesse et la position. Si cette valeur dpasse la zone
de tolrance ( maxminY YY -- et dt
dYY
dt
maxmindY -- ), une alarme se dclenche. Loprateur doit
ensuite cerner le dfaut (le localiser) afin de prendre les mesures ncessaires pour le retour
ltat normal.
Certes, cette mthode est simple et facile mettre en uvre, mais elle a des limites. En effet, si
une variable mesure dpasse la zone de tolrance, le procd est probablement dj dans un tat
critique. En plus, malgr que ces mthodes fonctionnent quand le procd est ltat dquilibre,
la situation devient plus complique si la variable contrle change de dynamique avec les points
de fonctionnement. Aussi, un dfaut important dans un procd complexe peut dclencher
plusieurs alarmes en mme temps. Cela rend la tche de loprateur qui supervise le procd
difficile pour identifier le dfaut en question afin de ragir immdiatement par les actions
requises.
Mthodes statistiques
Les mthodes statistiques font partie des mthodes bases sur les donnes. En tudiant les
caractristiques dun ensemble dobjets ou dobservations, elles donnent un moyen essentiel
pour la connaissance. A partir de ces donnes, elles fournissent un outil graphique facilement
-
20
manipulable et interprtable par loprateur. Malheureusement, cela demande la connaissance
complte de la population, ce qui rend ces mthodes coteuses, voire impossibles dans certains
cas (comme dans le cas des systmes rgis par des perturbations inconnues). La solution est donc
dutiliser les statistiques infrentielles qui consistent utiliser la thorie de probabilits afin
dinduire les caractristiques inconnues dune population partir de certains chantillons tirs de
cette population avec une certaine marge derreur, autrement dit la dtermination dune loi de
probabilit partir dune srie dexpriences.
Parmi les mthodes statistiques, on cite lAnalyse en Composantes Principale (ACP), Partial
Least Square (PLS) et Support Vector Machines (SVM). Les mthodes ACP et PLS ont t
utilises dans cette thse titre comparatif avec la mthode de rfrence qui est la mthode
SVM. Dans les deux paragraphes suivants, on propose donc de rappeler la thorie et les
applications de ces deux mthodes.
I.2.2.1. LAnalyse en Composantes Principales (ACP)
Lanalyse en composantes principales (ACP) Principal Component Analysis PCA est une
mthode gomtrique et statistique qui permet de transformer lespace multivariable dentres
corrles en un espace plus petit non corrl tout en conservant le maximum de variance des
donnes dentres. Elle permet de voir les donnes dune manire diffrente (dans un autre
repre) par la rotation des axes des variables originales vers des nouveaux axes, qui sont
orthogonaux et compltement dcorrls pour viter davoir des informations redondantes. Cest
donc une mthode danalyse et de rduction de dimension de donnes. Elle gnre un nouveau
jeu de donnes appel Composantes Principales (CP) (variables latentes, ou facteurs) partir
desquelles le modle va tre construit, et chaque composante a un taux de reprsentation du
modle, comme on peut le voir sur la Figure I.5 . Chaque composante est une combinaison
linaire des variables originales. Donc chaque variable peut contribuer la cration du modle
contrairement la slection des caractristiques (voir section I.2.3.3) qui utilisent juste un sous-
ensemble des variables originales pour la cration du modle (Ramaswami and Bhaskaran,
2009). Plus le nombre de composantes est important, plus la sensibilit au bruit va augmenter.
On se limite gnralement 2 ou 3 composantes, o le maximum dinformation (variance) est
compress.
-
21
Figure I.5 Taux de reprsentativit des composantes principales dans le modle
Le champ dapplication de cette mthode est trs vari allant de la rduction de dimension ,
rduction et suppression de bruit, visualisation, la compression de donnes, dtection des
dfauts (Sun et al., 2005, Dunia et al., 1996), et aussi au prtraitement des modles empiriques.
Fondement thorique de la mthode ACP
Soit X une matrice de donnes de taille mn constitue de n observations ou chantillons et m
variables :
.
.
.
/
0
111
2
3
nmn1
1m11
xx
xx
X
L'ACP cherche laxe (utilis dans la projection des chantillons) qui va maximiser la capture de
variabilit ou variance (information) des nuages de points. Ceci est fait en utilisant une matrice
de transformation nmP % , qui projette les donnes dans un espace de dimension rduit :
XXEetTPX T (I.13)
Pi est nomm le vecteur poids loading , qui contient linformation qui concerne la relation
entre les variables. X est la nouvelle matrice de donnes qui estime X . E est la matrice des
rsidus et reprsente la source de bruit. Les lments de T sont appels scores, et ils contiennent
la relation entre les chantillons. Les scores reprsentent les valeurs des variables originales
mesures et transformes dans lespace de dimension rduit. Lespace des donnes dorigine
peut tre calcul comme :
EptXETPX Ti
a
i
i
T 4 51
(I.14)
O ti est le vecteur score. Ceci donne la mthode ACP la possibilit denlever le bruit et de
laisser seulement linformation pertinente. La matrice de variance-covariance R est obtenue par
la dcomposition en valeurs singulires :
EEXX
nn
XXUUR TT
TT
1
1
12/1
(I.15)
Variabilit
Explique % Composantes Principales
1 2 3 4 5 6 7 8 9 10 11 12 13
-
22
O est la matrice diagonale contenant les valeurs propres dans un ordre dcroissant de la
matrice de corrlation R. Les colonnes de la matrice U sont les vecteurs propres de R. La matrice
P est gnre par le choix des vecteurs propres de U.
Le choix du nombre a (a
-
23
1. La carte de contrle T2 de Hotelling statistique
La carte de contrle T est dfinie comme la majeure partie de variation des donnes lintrieur
du modle (lespace principal). Le processus est considr tant en fonctionnement normal pour
un seuil de confiance )) donn, et une distribution du 6 :
anaFann
naT
kxPPkxktktkT
na
T
TTT
a
,)(
)1(
)()()()()(2
2,,
2112
))
7 (I.17)
O n est le nombre dchantillons, a est le nombre de composantes principales, an,aF ) est la
valeur de la distribution de Fisher-Snedecor. a est la matrice forme par les premires lignes et
colonnes de , ) reprsente le niveau appropri de l'importance pour la ralisation du test qui
prend gnralement la valeur de 0,05 ou 0,01 pour les limites de confiance.
2. Indice Squared Prediction Error SPE
Lindice SPE est dfini comme la somme des carrs de chaque ligne de E. Il est perpendiculaire
l'espace construit par le modle ACP :
5
n
j
T
TT
aa
T
jj XPPIXkekekxkxkSPEQ1
22 )()()()()( 7 (I.18)
5
n
j
T
T
jj
T pktkxEEQ1
22)()( 7
(I.19)
La limite suprieure, ou les seuils de confiance de Q statistique, peuvent tre calculs par sa
distribution approximative comme suit :
01
21
002
1
101
12.. hhhchQ
.
./
0
112
3
))
5
n
aj
i
ji h1
22
310 3
21,
,
(I.20)
O c) est l'cart type normal correspondant la partie suprieure (1-)) centile, ,j est la valeur
propre associe au jme vecteur poids. Q statistique reprsente lerreur de prdiction quadratique
dcrivant le bruit dans les donnes et la variation lextrieur du modle. Q est utilis pour
surveiller et suivre de prs la corrlation entre les variables du procd. Une augmentation de sa
valeur signifie un changement dans les corrlations qui gouvernent les variables ce qui
-
24
indiquerait un dfaut. Cependant, la distance SPE est sensible aux incertitudes de modlisation
provoquant de nombreuses fausses alarmes si les systmes sont non-linaires.
Des travaux ont t faits utilisant lACP avec les cartes de contrle Q et T2 statistiques afin de
diffrencier entre loccurrence dun dfaut et une condition de fonctionnement normale largie
(Humberstone et al., 2012, Humberstone, 2010). Nanmoins, ces cartes de contrle prsentent
certaines restrictions puisqu'elles font des suppositions sur la distribution des donnes. (Camci et
al., 2008) proposent une carte de contrle base sur la distance noyau utilisant les principes de
SVM et dmontre quil est sensible tous les types de donnes en hors contrle quels que soient
leurs distributions et permet aussi de bnficier et dapprendre de ces donnes.
I.2.2.2. Moindres carrs partiels (PLS)
La mthode de Moindres Carrs Partiels (MCP) ou Projection aux Structures Latentes (PSL)
Partial Least Squares PLS est un algorithme danalyse statistique multivariable propos par
Wold la fin des annes 60 qui combine les fonctionnalits de lACP et la rgression multiple
(Wold, 1966). Il tait destin au dbut pour lconomtrie. Il a trouv un grand succs et pris de
lampleur en chimiomtrie o il est devenu un outil standard danalyse et de calibrage du spectre
pour choisir les longueurs donde appropries. Maintenant, cette technique est applique dans
plusieurs disciplines telles que la mdecine, la modlisation des procds, les sciences
pharmaceutiquesetc. La notation PLS est utilise par la suite dans cette thse pour dsigner
cette mthode.
La PLS cherche les composantes latentes qui maximisent la covariance entre X et Y, afin de
trouver une relation entre les variables indpendantes (entre X) et les variables dpendantes
(sortie Y) en les dcomposant en variables latentes non corrles avec un processus itratif. La
structure latente correspond lextraction du maximum de variation de Y qui explique au mieux
la structure latente de X. Cette mthode est similaire lanalyse de corrlation canonique, et
est lie aux autres mthodes de rgression telles que la rgression en composantes principales.
La PLS a surmont les problmes de colinarit (qui mnent une mauvaise interprtation des
coefficients de rgression ), et les problmes de limitation du nombre de variables prdites par
rapport aux mthodes de rgression standards des moindres carrs. Elle permet danalyser des
donnes avec plus de variables que dobservations et produit des modles avec une grande
stabilit de prdiction car le risque de sur-apprentissage est minimis. Elle est trs efficace dans
la gestion des valeurs manquantes et donc produit des modles trs robustes face aux dfauts
capteurs par exemple. Elle est aussi capable de dtecter les valeurs aberrantes avec une analyse
-
25
plus soigne des donnes amliorant ainsi la qualit des modles dajustement. Cette mthode
permet de manipuler plus facilement le bruit et les donnes redondantes et corrles et de raliser
une marginalisation des valeurs anormales pour amliorer la robustesse du systme. Elle
reprsente aussi une faon trs propre dinverser des matrices, la diffrence de lanalyse en
composantes principales qui cherche trouver les composantes principales qui expliquent le
maximum de variance dun seul bloc X ou Y sans tenir compte des autres blocs. Enfin, elle a
lavantage de pouvoir prdire soit plusieurs variables rponse la fois (PLS2) soit juste une seule
variable rponse (PLS1). En gnral, plus les variables rponses sont corrles meilleure sera la
performance de PLS2 par rapport PLS1 en termes dinterprtation et de prcision de prdiction.
Les algorithmes PLS sont numriquement stables, leur simplicit dimplmentation et de calcul
leur donne un aspect fort. Une des difficults de rglage du PLS est le choix du nombre de
valeurs latentes qui permet une bonne gnralisation. Cela peut se faire avec une validation
croise.
La PLS est un outil trs polyvalent qui peut raliser plusieurs tches : la rgression (Melssen et
al., 2007, Kim et al., 2005), la rduction de dimension (Tenenhaus et al., 2007), la classification
(Barker and Rayens, 2003, Nguyen and Rocke, 2002), la supervision et le contrle des procds
(Kourti, 2005), la surveillance des procds (Zhou et al., 2010), et la modlisation (Shinzawa et
al., 2011). Elle a aussi t utilise avec succs dans la surveillance et la dtection des dfauts
pour les donnes chimiques (Wise and Gallagher, 1996). La PLS est mieux adapte au
diagnostic de dfauts que l'ACP sur le plan thorique et pratique (Chiang et al., 2000) car lACP
sintresse seulement la capture du maximum de variance sans tenir compte de la relation qui
existe entre les donnes et les dfauts. La performance et lefficacit de la mthode PLS a t
montre dans plusieurs travaux et articles (Ferrer et al., 2008,Yin et al., 2011), et elle a t
combine aussi avec dautres mthodes telles que les SVMs (Rosipal and Trejo, 2003, Lu and
Wang, 2008).
Diffrentes mthodes ont t proposes pour tendre la mthode PLS au cas non linaire. En
utilisant la force des mthodes noyau, la PLS peut tre tendue dune manire simple et efficace
au cas des systmes non linaires. Il y a aussi plusieurs variantes de PLS qui diffrent selon la
faon avec laquelle elles extraient les vecteurs latents. Un des algorithmes les plus lgants qui
reprsentent la faon standard du PLS est le PLS itratif non linaire (Geladi and Kowalski,
1986) qui est le plus appropri pour la supervision des procds par rapport la mthode
SIMPLS (Li et al., 2010). Lalgorithme SIMPLS a cependant lavantage de calculer les facteurs
PLS directement comme une combinaison linaire des variables dorigine en maximisant un
-
26
critre de covariance et donc vite de calculer des matrices dgonfles comme cest le cas dans
lalgorithme NIPALS (de Jong, 1993).
Fondement thorique de la mthode PLS
Soit un ensemble de donnes compos des deux matrices X des mesures (entres) et Y des
rponses (sorties). La PLS dtermine la relation entre ces deux blocs, en essayant de garder le
maximum de covariance entre eux, par les quations suivantes :
FUQY
ETPXT
T
(I.21)
X est la matrice prdicateurs de donnes de taille nm o chaque ligne reprsente une
observation ou les mesures un chantillon donn, et chaque colonne reprsente les mesures
dune variable. T est la matrice de scores de X, P la matrice de chargement de X, Y la matrice de
rponse de taille nmy , U la matrice des scores de Y, Q la matrice de chargement de Y, E et F
sont les matrices rsiduelles.
La modlisation de X et Y de cette faon suppose que les deux sont observs avec une erreur
(rsidu). Le chargement se fait travers les vecteurs latents T qui peuvent tre choisis de
diffrentes faons, condition quils soient orthogonaux (dcorrls) couvrant lespace des
colonnes de X. Des conditions additionnelles sont requises afin de spcifier T pour que les
vecteurs de T soient orthogonaux, telle la cration dune combinaison linaire des colonnes de X
et Y en multipliant ces dernires par les poids w et c respectivement de telle sorte que leur
covariance soit maximale (Geladi and Kowalski, 1986, Rosipal and Krmer, 2006) :
maximalesoitque tel
1,1,,
ut
ttwwYcuXwt
T
TT (I.22)
t, u sont les vecteurs scores de X et Y respectivement. w et c sont les coefficients de rgression
de X et Y sur u, t respectivement (vecteurs poids de X et Y). Quand les premiers vecteurs latents
(t et u) sont trouvs, ils sont soustraits de X et Y et la procdure est ritre jusqu' ce que X
devienne une matrice nulle.
tYttcetuXuuw TTTT 11 )()( (I.23)
Avant de commencer le processus itratif, le vecteur u est initialis dune faon alatoire par le
choix dune colonne de Y (celle avec la plus grande variance).
-
27
Ycuctt
tYcXwtw
uu
uXw
T
T
T
T
88 ,1,,,1, (I.24)
On rpte ces tapes jusqu' la convergence. La PLS est une mthode itrative, qui dtermine
chaque itration les vecteurs poids w, c ou les vecteurs scores t, u et les chargements p sont
calculs, ainsi X et Y seront ajusts par ces rsultats :
YttYquYY
XttXptXXTT
TT
.
. (I.25)
O p et q sont les coefficients de rgression de X et Y sur t, u respectivement
uYuuqettXttp TTTT 11 )()( (I.26)
Aprs chaque itration les vecteurs w, t, p et q sont enregistrs dans les matrices W, T, P, et Q
respectivement. On peut voir w comme le vecteur propre droite de la matrice YXS T , et le
problme devient :
Xwt
wXwYYX TT
, (I.27)
Dans PLS rgression le but est de prdire Y en utilisant X et leur structure commune :
XY (I.28)
Daprs (Rosipal and Krmer, 2006), la structure commune est donne par la relation suivante :
TT CWPW 1)( (I.29)
ce qui donne :
YTUXXTUX TTTT 1)( (I.30)
PLS noyau : (KPLS) est une extension non linaire du PLS linaire. Lutilisation de fonction
noyau (Kernel) permet de transformer (mapper) les donnes complexes non linaires de lentre
dans un espace de caractristiques de plus grande dimension dans lequel la modlisation linaire
peut se faire facilement (Rosipal and Trejo, 2002). Cette notion de noyau va tre dtaille par la
suite dans la thorie des SVMs. La fonction noyau est donne comme suit :
jijix xxxxK ,, (I.31)
Avant de commencer le processus itratif, le vecteur u est initialis dune faon alatoire :
1)5)4)31)2)1 88 uYcutYctuKut TxT (I.32)
En utilisant lquation (I.27) en multipliant les deux termes par X on obtient :
-
28
tYYu
ttYYXX
T
TT
, (I.33)
Considrons $$yK la matrice noyau du Gram (Kernel Gram matrix) de la sortie Y et $ la
transformation de lespace de sortie de Y vers lespace de caractristique, do :
tKu
ttKK
y
yx
, (I.34)
Pour centrer les donnes transformes dans lespace des caractristiques, cela revient :
)111
()111
(
)111
()111
(
T
nnny
T
nnny
T
nnnx
T
nnnx
nIK
nIK
nIK
nIK
9
9 (I.35)
O nI est la matrice identit de taille n, et n1 est le vecteur unit de taille n. Aprs le calcul des
nouveaux scores t et u, on soustrait des matrices xK et yK leurs approxims calculs partir de t
et u :
YttYY
ttIKttIK
T
T
nx
T
nx
9 )()( (I.36)
Et donc on obtient :
YTTYTUKTUKY
YTUKTU
TT
x
T
x
T
x
TT
1
1
)(
)(
(I.37)
I.2.3. Etapes de mise en uvre des mthodes bases sur les donnes
Malgr le fait quon sintresse principalement lutilisation des mthodes bases sur les
donnes pour le diagnostic de dfaut, il est important de noter que ces mthodes peuvent
galement tre utilises pour la modlisation, donc avec un objectif diffrent
Dans lobjectif de diagnostic, les mthodes statistiques permettent de relier les entres et
sorties du systme au type de situation (dfectueuse ou normale pour diffrents dfauts).
Dans lobjectif de modlisation (rgression), on cherche par ces mthodes trouver une
relation empirique entre les entres et les sorties.
Lapplication des mthodes bases sur les donnes pour le diagnostic de dfaut est ralise en
plusieurs tapes : lacquisition et prtraitement des donnes, lextraction des caractristiques
-
29
importantes, la modlisation (soit entre-sortie soit donnes-type de dfaut) et la validation du
modle. Selon lobjectif vis (modlisation ou diagnostic), ces tapes sont adapter.
I.2.3.1. Acquisition des donnes
Cette tape concerne laccueil (collection) et la prparation (prtraitement) des donnes. Ces
donnes peuvent tre chantillonnes dans le domaine temporel ou frquentiel avec un intervalle
dchantillonnage adapt la dynamique du procd. Des donnes riches et reprsentatives des
diffrentes situations sont ncessaires pour lapprentissage de la dynamique du procd.
On distinguera deux approches de collections des donnes :
pour la modlisation (entres-sorties), la rponse transitoire est ncessaire. Dans ce cas,
il est intressant dexciter le procd par une entre de spectre convenable (par exemple
signal pseudo alatoire) afin de capter le maximum dinformation. La rponse transitoire
dun systme (la sortie face une entre transitoire, tel un chelon ou une impulsion) est
souvent utilise pour la modlisation. Elle permet de comprendre le comportement
dynamique du systme, tel que le retard et les chelles de temps.
pour le diagnostic (relation mesures-type de dfaut), des donnes dans les situations
normale et dfectueuse sont ncessaires.
Supposons X une matrice de donnes (contenant les entres U et les sorties mesures Y) de taille
mn constitue de n rcurrences de mesures (observations, ou encore chantillons) et m
variables caractristiques )( jX (facteurs ou encore proprits) dans les colonnes de la matrice:
mjnmn
m
XXX
xx
xx
YUX ,,,,, 1
1
111
.
.
.
/
0
111
2
3
Les donnes acquises sont gnralement spares en deux groupes : donnes dapprentissage et
donnes de test. Les donnes dapprentissage sont utilises pour le dveloppement du modle
(slection des caractristiques et dveloppement du modle). Les donnes de test sont utilises
pour la validation (valuation ou jugement) du modle et des caractristiques choisies.
-
30
I.2.3.2. Prtraitement des donnes
Un prtraitement des donnes est ncessaire pour rduire le bruit, la suppression des valeurs
aberrantes, le traitement des valeurs manquantes et la normalisation des donnes.
Normalisation des donnes
La normalisation est trs utile lorsque le systme a plusieurs variables dont les amplitudes et
variances varient dans des plages diffrentes. Elle consiste mettre lchelle la matrice de
donnes X en rendant les variables de la nouvelle matrice XN comparables (la mme plage de
variation). Parmi les mthodes de normalisation de donnes, on peut citer :
1. La mthode min/max : met les valeurs de chaque colonne de X selon le maximum et le
minimum de cette colonne, de telle sorte avoir les valeurs de la matrice normalis XN
dans lintervalle [bas-haut] :
bas)(minimum)(maximum
)(minimumbashaut
XX
XXX N
O )(minimum X et )(maximum X remplace respectivement chaque colonne de X par son
minimum et maximum. Ce type de normalisation avec haut=1 et bas=0 est utilis dans cette
thse au chapitre II.
2. La mthode Z-scores : permet de ramener la moyenne de chaque variable de X zro et sa
variance lunit par lapplication de la formule suivante : )(typecart
)( moyenne
X
XXX N
3. La mthode de mise l'chelle dcimale decimal scaling
4. La mthode de fentre coulissante ou glissante.
Manipulation des donnes manquantes
Dans le monde rel, les donnes ne sont pas toujours propres et compltes. Souvent elles sont
censures et corrompues. Plusieurs techniques existent pour traiter les donnes manquantes, mais
la mthode la plus simple et la plus utilise consiste dterminer la ligne de la matrice o des
donnes sont corrompues puis la supprimer. Malgr sa simplicit, cette mthode rduit la taille
de la matrice de donnes. Cela conduit une perte de puissance (informations) du rsultat. En
plus, il y a des cas o la ligne corrompue contient des donnes importantes quon ne peut pas
supprimer, ou des cas o la matrice de donnes a beaucoup de valeurs manquantes et donc la
suppression de toutes ces lignes mne une matrice avec peu de donnes. Dans ce cas, on a
recours la mthode de substitution qui remplace les donnes manquantes par une
-
31
approximation raisonnable en supposant que ces donnes sont faciles modliser. Parmi les