diagnostic de defauts par les machines a vecteurs … · table des matières introduction...

HAL Id: tel-00985437https://tel.archives-ouvertes.fr/tel-00985437

Submitted on 29 Apr 2014

HAL is a multi-disciplinary open accessarchive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come fromteaching and research institutions in France orabroad, or from public or private research centers.

Larchive ouverte pluridisciplinaire HAL, estdestine au dpt et la diffusion de documentsscientifiques de niveau recherche, publis ou non,manant des tablissements denseignement et derecherche franais ou trangers, des laboratoirespublics ou privs.

Diagnostic de dfauts par les Machines VecteursSupports : application diffrents systmes

mutivariables nonlinairesNassim Laouti

To cite this version:Nassim Laouti. Diagnostic de dfauts par les Machines Vecteurs Supports : application diffrentssystmes mutivariables nonlinaires. Autre. Universit Claude Bernard - Lyon I, 2012. Franais..

https://tel.archives-ouvertes.fr/tel-00985437https://hal.archives-ouvertes.fr

N dordre: 161-2012 Anne 2012

THSE DE L'UNIVERSIT DE LYON Dlivre par

L'UNIVERSIT CLAUDE BERNARD LYON 1

Prsente pour obtenir le grade de docteur en automatique

COLE DOCTORALE EEA DE LYON (arrt du 7 aot 2006)

Par

M. Nassim LAOUTI

Diagnostic de dfauts par les Machines Vecteurs Supports : application diffrents systmes multivariables

non linaires

Soutenue le 21 septembre 2012, devant le jury compos de

Dr. Mazen ALAMIR GIPSA-Lab, Grenoble Rapporteur Professeur Christophe AUBRUN CRAN, Universit de Lorraine Rapporteur Professeur Michel KINNAERT Universit Libre de Bruxelles Examinateur Dr. Sami OTHMAN LAGEP, Universit de Lyon Co-encadrant Dr. Isabelle QUEINNEC LAAS, Universit de Toulouse Prsident Dr. Nida SHEIBAT-OTHMAN LAGEP, Universit de Lyon Directeur de thse

Ddicaces

Je ddie cette thse mes trs chers parents qui je dois tout ce que je suis, et qui m'ont

donn un vritable modle de travail, et qui m'ont appris le respect de lautre, la gentillesse

et la persvrance. J'espre qu'ils trouveront dans ce travail toute ma reconnaissance et tout

mon amour.

A mes chers frres et surs et qui ont toujours t l pour moi: Leila, Mehdi, Sihem,

Mohamed, Hafid, Rayane Yasmine

Je ddie cette thse au directeur de lcole doctorale EEA de Lyon monsieur Grard Scorletti.

A tous mes amis : Kamel, Kamel, Reda, Bassem, Sidali, Belkacem, Amine, Aziz, Sofiane et

tous les autres qui mont encourag finir ce travail

Je ddie cette thse

Nassim

Remerciements

Je remercie Dieu de mavoir donn la volont et le courage qui mont permis de raliser ce

travail, veuille-t-il me guider dans le droit chemin.

Je remercie Madame Nida Othman et Monsieur Sami Othman, pour leurs gentillesses

ainsi que leurs encouragements rguliers face la difficult.

Je remercie ma sur Leila pour son aide depuis toujours

Je remercie aussi les membres du jury pour avoir accept de juger ce travail. Je suis trs

honor de prsenter mes travaux de thse devant un tel jury.

Ce travail a t ralis au sein du Laboratoire dAutomatique et de Gnie des Procds de

luniversit Claude Bernard Lyon1 (LAGEP-UMR 5007). Mes remerciements s'adressent

tous les membres du laboratoire LAGEP que ce soit les doctorants, les enseignants,

ingnieurs ou les chercheurs pour mavoir accueilli parmi eux.

Table des matires

Introduction gnrale ................................................................................................................... 1

CHAPITRE I : Diagnostic de dfauts et thorie des Machines Vecteurs de Supports ....... 5

I.1. Gnralits ............................................................................................................................ 7

I.1.1. Terminologie en matire de diagnostic.......................................................................... 7

I.1.2. Le principe de dtection de dfaut ................................................................................. 9

I.1.3. FDI en boucle ouverte et en boucle ferme ................................................................. 10

I.1.4. Domaines concerns par la FDI ................................................................................... 11

I.1.5. Performances des techniques FDI ............................................................................... 12

I.2. Les mthodes de diagnostic ................................................................................................ 12

I.2.1. Mthodes base de modle explicite .......................................................................... 13

I.2.2. Mthodes bases sur les donnes ................................................................................. 18

I.2.3. Etapes de mise en uvre des mthodes bases sur les donnes .................................. 28

I.3. Les Machines Vecteurs de Supports ................................................................................ 39

I.3.1 Thorie de l'apprentissage statistique ........................................................................... 40

I.3.2. Les machines Vecteurs de Support pour la classification (SVM) ............................ 41

I.3.3. Les machines Vecteurs de supports pour la rgression (SVR) ................................. 56

CHAPITRE II : Systme de traitement des eaux uses ........................................................... 67

II.1. Description du systme .................................................................................................... 69

II.1.1. Le procd de traitement des eaux uses par boues actives ..................................... 70

II.1.2. La modlisation .......................................................................................................... 71

II.1.3. Le modle BSM1........................................................................................................ 73

II.1.4. Variables composites/mesures ................................................................................... 84

II.2. Commande des systmes de traitement des eaux uses ................................................... 86

II.3. Revue des mthodes de diagnostic du procd WWTP ................................................... 87

II.3.1. ACP (PCA en anglais) et dautres mthodes statistiques ........................................... 88

II.3.2. La Projection aux Structures Latentes ( PLS ) ........................................................... 90

II.3.3. SVM ........................................................................................................................... 91

II.4. Stratgie SVR/SVM propose pour le diagnostic du procd WWTP ............................. 92

II.4.1. Schma SVR/SVM propos ....................................................................................... 92

II.4.2. Rcapitulatif des variables dtat/ dentre/ et de sortie ............................................. 94

II.4.3. Les variables superviser ........................................................................................... 95

II.5. Implmentation de SVR pour la modlisation .................................................................. 97

II.5.1. Gnration de donnes pour lapprentissage et la validation ..................................... 97

II.5.2. Prtraitement des donnes (normalisation, filtrage) ................................................... 99

II.5.3. Analyse de corrlation/Information mutuelle ........................................................... 100

II.5.4. Rsultats de la modlisation SVR ............................................................................ 103

II.6. Implmentation de SVM pour le diagnostic de dfauts ................................................. 116

II.7. Conclusion ...................................................................................................................... 129

CHAPITRE III : Diagnostic de dfauts dans les oliennes ................................................... 131

III.1. Introduction ................................................................................................................... 133

III.1.1. Revue des mthodes de diagnostic sur les oliennes ............................................. 135

III.1.2. Revue sur la commande des oliennes ................................................................... 138

III.2. Description du systme olien ...................................................................................... 139

III.2.1. Modle des pales et pitch ........................................................................................ 141

III.2.2. Modle convertisseur et gnratrice ....................................................................... 141

III.2.3. Modle du systme dentranement ........................................................................ 142

III.2.4. Le systme de contrle ............................................................................................ 143

III.2.5. Dfauts considrs dans ce modle olien .............................................................. 144

III.3. Diagnostic de dfauts dans une olienne ...................................................................... 146

III.3.1. Les vecteurs des caractristiques pour chaque dfaut ............................................ 148

III.3.2. Rsultats de lapproche de diagnostic .................................................................... 151

III.4. Comparaison entre diffrentes mthodes de diagnostic ................................................ 157

III.5. Combinaison entre lapproche base sur SVM et un observateur ................................ 159

III.5.1. Conception de lobservateur de type Kalman ......................................................... 161

III.5.2. Lapproche base SVM pour la dtection/isolation de dfaut actionneur sur le

systme pitch ....................................................................................................................... 162

III.6. Conclusion .................................................................................................................... 166

CHAPITRE IV : Racteur chimique parfaitement agit ...................................................... 169

IV.1. Revue bibliographique ................................................................................................... 171

IV.2. Prsentation du systme ................................................................................................. 174

IV.2.1. Le procd............................................................................................................... 174

IV.2.2. Le modle ............................................................................................................... 175

IV.3. Implmentation du diagnostic de dfauts ...................................................................... 176

IV.3.1 Implmentation des SVMs....................................................................................... 176

IV.3.2 Implmentation de lobservateur de grand gain ...................................................... 178

IV.3.3. Rsultats et discussion ............................................................................................ 180

IV.4. Implmentation de SVR................................................................................................. 189

IV.4.1. Identification d'une drive de temprature par rgression SVM ............................ 190

IV.4.2. Identification des U par rgression SVM ............................................................... 193

IV.5. Conclusions .................................................................................................................... 196

Conclusion gnrale .................................................................................................................. 197

Notations .................................................................................................................................... 201

Annexes ...................................................................................................................................... 209

Annexe A ................................................................................................................................ 211

Annexe B................................................................................................................................. 219

Annexe C................................................................................................................................. 223

Bibliographie ............................................................................................................................. 227

Table des Figures

Figure I.1 Architecture du fonctionnement dun systme avec une commande tolrante aux

dfauts ............................................................................................................................................. 9

Figure I.2 Schma classique de dtection des dfauts ............................................................... 10

Figure I.3 Schma de classification des mthodes de diagnostic de dfauts bases sur le modle

....................................................................................................................................................... 13

Figure I.4 Mthodes de diagnostic diriges par les donnes..................................................... 19

Figure I.5 Taux de reprsentativit des composantes principales dans le modle .................... 21

Figure I.6 Lhyperplan sparateur pour des donnes bidimensionnelles .................................. 41

Figure I.7 Sparation linaire .................................................................................................... 42

Figure I.8 Sparation linaire avec des erreurs ......................................................................... 45

Figure I.9 Marge souple ............................................................................................................ 46

Figure I.10 Exemple de projection .............................................................................................. 48

Figure I.11 Vecteurs support et surface de dcision calcule par la mthode noyau ............... 49

Figure I.12 La fonction de perte insensible dans la rgression SVR linaire ........................ 58

Figure I.13 Structure de type Hammerstein ................................................................................ 61

Figure I.14 Structure de type Wiener .......................................................................................... 62

Figure II.1 Prsentation gnrale du procd BSM1..74

Figure II.2 La matire organique dans le modle BSM1 ........................................................... 79

Figure II.3 Les composs azots dans le modle BSM1 ............................................................ 79

Figure II.4 Stratgie SVR suivi par SVM pour le diagnostic de dfauts ................................... 93

Figure II.5 Concentration de nitrites/nitrates dans la 2me cuve utilise pour lapprentissage et le

test du modle SVR....................................................................................................................... 98

Figure II.6 Concentration doxygne dissous dans la 5me cuve utilise pour lapprentissage et

le test du modle SVR ................................................................................................................... 98

Figure II.7 Bote moustache des variables du procd WWTP non normes ......................... 99

Figure II.8 Bote moustache des variables du procd WWTP normalises avec la mthode

min/max ...................................................................................................................................... 100

Figure II.9 Analyse des relations entre variables avec linformation mutuelle ....................... 102

Figure II.10 Analyse des relations entre variables avec linformation mutuelle (pour CODe et

TSSe) ........................................................................................................................................... 102

Figure II.11 Evolution temporelle des variables dentre/sortie des matires en suspension ... 104

Figure II.12 Densit de probabilit Qin ..................................................................................... 105

Figure II.13 Concentration SNH,in et sa densit de probabilit .................................................. 106

Figure II.14 L'volution de la variable So5 par rapport Kla5 ................................................... 106

Figure II.15 Lvolution de la variable Sno2 par rapport Qa ................................................... 107

Figure II.16 Trac de Sno2 et son estime .................................................................................. 109

Figure II.17 Zoom sur le trac de Sno2 et son estim................................................................. 110

Figure II.18 Trac de TSSe et son estim .................................................................................. 110

Figure II.19 Zoom sur le trac de TSSe et son estim ............................................................... 111

Figure II.20 Trac de CODe et son estim ................................................................................ 111

Figure II.21 Trac de So5 et son estim ..................................................................................... 112

Figure II.22 Rsidu So5.............................................................................................................. 112

Figure II.23 Rsidu Sno2 ............................................................................................................ 113

Figure II.24 Rsidu filtre de Sno2 ............................................................................................. 113

Figure II.25 Densit de probabilit Sno2 .................................................................................... 114

Figure II.26 Autocorrlation du rsidu TSSe ............................................................................ 114

Figure II.27 Rsidu sur TSSe .................................................................................................... 115

Figure II.28 Densit de probabilit TSSe .................................................................................. 115

Figure II.29 Rsidu CODe ......................................................................................................... 115

Figure II.30 volution du rsidu Kla5 ........................................................................................ 119

Figure II.31 Zoom sur le rsidu Kla5 ......................................................................................... 119

Figure II.32 volution du rsidu Qa .......................................................................................... 120

Figure II.33 volution du rsidu So5 ......................................................................................... 120

Figure II.34 Trac de la mesure de loxygne dissous (So5) et son rsidu ................................ 121

Figure II.35 Zoom sur de la mesure de So5 et son rsidu .......................................................... 121

Figure II.36 volution du rsidu Sno2 ........................................................................................ 122

Figure II.37 La mesure de Sno2 et son rsidu............................................................................. 122

Figure II.38 Mesure TSSe et son rsidu .................................................................................... 123

Figure II.39 Rsultat de dcision sur le dfaut Qa .................................................................... 124

Figure II.40 Zoom sur le rsultat du dfaut Qa ......................................................................... 125

Figure II.41 Rsultat de dcision sur le dfaut Kla5 .................................................................. 126

Figure II.42 Zoom de dcision sur le dfaut Kla5 ...................................................................... 126

Figure II.43 Rsultat de dcision sur le dfaut Sno2 .................................................................. 127

Figure II.44 Zoom sur la dcision du dfaut Sno2 ...................................................................... 127

Figure II.45 Rsultat de la dcision sur dfaut TSSe ................................................................ 128

Figure II.46 Rsultat de la dcision sur dfaut So5 .................................................................... 129

Figure III.1 Eoliennes offshore.133

Figure III.2 Destruction dune olienne par prise de feu ......................................................... 134

Figure III.3 Coupe transversale dune nacelle dolienne ....................................................... 140

Figure III.4 Une vue d'ensemble du modle de rfrence de lolienne .................................. 140

Figure III.5 Puissance de lolienne en fonction de la vitesse du vent .................................... 143

Figure III.6 Squence vitesse du vent ...................................................................................... 144

Figure III.7 Schma de diagnostic de dfaut pour les oliennes .............................................. 146

Figure III.8 Stratgie de diagnostic de dfaut classique avec SVM ........................................ 147

Figure III.9 Schma de diagnostic de dfauts propos ............................................................ 147

Figure III.10 Stratgie propose de diagnostic de dfaut base sur SVM ................................. 147

Figure III.11 Vitesse du vent mesure ...................................................................................... 152

Figure III.12 Puissance lectrique gnre ............................................................................... 152

Figure III.13 Dtection et isolation du dfaut 2 de type gain (1b) sur le capteur de la position

pitch 2,2 m

................................................................................................................................... 153

Figure III.14 Dtection et isolation du dfaut 4 valeur fixe (type 2a) sur la vitesse du rotor ... 154

Figure III.15 Dtection et isolation du dfaut 5 de type gain (2b) sur le capteur de la vitesse

rotationnelle du rotor 2,mr

w ......................................................................................................... 155

Figure III.16 Dtection et isolation du dfaut 5 de type gain (3b) sur le capteur de la vitesse

rotationnelle de la gnratrice1,mg

w ........................................................................................... 156

Figure III.17 Dtection et isolation du dfaut 8 de type offset (4a) sur le convertisseur .......... 156

Figure III.18 Dtection et isolation du dfaut 9 (6) sur le systme dentrainement ................. 157

Figure III.19 Schma de combinaison SVM et observateur ..................................................... 161

Figure III.20 Dtection et isolation du dfaut 6 (5a) sur lactionneur2 et estimation du coefficient

damortissement e2 et de la pulsation naturelle 2nw avec lobservateur .................................... 164

Figure III.21 Dtection et isolation du dfaut 7 (5b) sur lactionneur 3 et estimation du

coefficient damortissement e3 et de la pulsation naturelle 3nw avec lobservateur .................. 164

Figure IV.1 Schma simplifi du racteur parfaitement agit du laboratoire (Tr1, Tr2, Tj1, Tj2

et THC sont des sondes de temprature P1, P2, P3 et P4 sont des pompes)...174

Figure IV.2 Schma de diagnostic de dfauts par SVM en ligne ............................................ 180

Figure IV.3 Drive dans Tj,in 55min ...................................................................................... 181

Figure IV.4 Classification des dfauts de THC. Effet de (variance du noyau gaussien) sur les

hyperplans optimaux (avec C=100) ............................................................................................ 182

Figure IV.5 Cas dtude par simulation (avec C=100) et diffrentes valeurs de : Occurrence de

dfaut dans THC (objective de commande Trd=70C) ................................................................. 183

Figure IV.6 Classification des defaults de THC. Effet de C (paramtre de rgularisation) sur les

hyperplans optimaux (avec =10) .............................................................................................. 184

Figure IV.7 Dfaut dans le systme de chauffe/refroidissement (HC : un actionneur) en

changeant les paramtres du PID afin dcarter THC de Tjd (Tj

d=70C) ..................................... 185

Figure IV.8 Drive dans Tr1 33 min dans le racteur du laboratoire ...................................... 186

Figure IV.9 Erreur de calibration de -5C est considre dans la sonde Tr2 dans le racteur pilote

de 250 L ...................................................................................................................................... 187

Figure IV.10 Une valuation exprimentale de la mthode SVM et de lobservateur dans un

racteur pilote de 250 L .............................................................................................................. 188

Figure IV.11 Evolution des tempratures dans le racteur pilote sans dfaut .......................... 188

Figure IV.12 Schma de SVR pour lestimation de U et lidentification de niveaux de dfauts

pendant la priode la chauffe du racteur ................................................................................... 189

Figure IV.13 Validation exprimentale de lidentification dune drive dans la sonde de

temprature Tr1 avec diffrentes valeurs de (=0.01, C=100, objectif de commande Tjd=70C)

..................................................................................................................................................... 191

Figure IV.14 Identification de la drive dans la sonde Tr1 avec diffrentes valeurs de (=60,

C=100, objectif de commande Trd=60C) ................................................................................... 192

Figure IV.15 Identification de la drive du capteur Tr1 avec diffrentes valeurs de C (=0.01,

=60) ........................................................................................................................................... 193

Figure IV.16 Estimation du coefficient dchange thermique U pendant la chauffe du racteur

(simulation avec diffrentes valeurs de U, paramtre de lobservateur =0.04) ........................ 195

Figure IV.17 Estimation exprimentale du coefficient dchange thermique U pendant la chauffe

du racteur ................................................................................................................................... 195

Liste des tableaux

Tableau II.1 Les concentrations intervenant dans le modle BSM1 .......................................... 75

Tableau II.2 Paramtres du modle BSM1 ................................................................................ 77

Tableau II.3 Paramtres de dcantation ..................................................................................... 83

Tableau II.4 Corrlation des variables avec CODeff ................................................................ 101

Tableau II.5 Performances des modles SVR .......................................................................... 109

Tableau II.6 Les diffrents dfauts considrs ......................................................................... 109

Tableau II.7 Rsultats de dtection de dfauts ......................................................................... 117

Tableau III.1 Paramtres du modle de rfrence de lolienne ............................................... 143

Tableau III.2 Dfauts considrs dans le modle olien de rfrence ...................................... 145

Tableau III.3 Rsultats de diagnostic du dfaut 1 ..................................................................... 158

Tableau III.4 Rsultats de diagnostic du dfaut 2 ..................................................................... 159

Tableau III.5 Rsultats de dtection des dfauts ....................................................................... 166

Tableau IV.1 Vecteurs dentrs SVM (xi), (i est linstant de temps) ........................................ 177

Tableau IV.2 Correspondance entre rsidu de la temprature de la double enveloppe et du bain

thermost (R=rsidu)................................................................................................................... 178

1

Introduction gnrale Tout ce que je sais, :c'est que je ne sais rien Socrate

La socit actuelle est trs oriente vers la technologie et dpend ainsi de la disponibilit, la

scurit et la fiabilit de technologies de plus en plus complexes. Cependant, la matrise parfaite

de ces systmes reste un sujet important et ouvert. Afin de satisfaire le bon fonctionnement, le

diagnostic de dfaut Fault detection and isolation FDI apparat ainsi comme une ncessit

qui consiste identifier les causes du dfaut partir des symptmes ou signaux perus afin

d'viter toute propagation de ce dfaut. Ce dernier peut occasionner notamment :

1. Un arrt de fonctionnement du systme,

2. Des dgts matriels,

3. La pollution de lenvironnement,

4. Des dangers pour l'utilisateur.

Le diagnostic de dfauts est, en fait, lensemble des actions mises en uvre pour dtecter,

localiser et identifier tout dysfonctionnement sur un systme. Ceci peut se faire partir des

informations pouvant tre rcupres du systme, telles que les mesures fournies par les

capteurs, les sorties calcules par les contrleurs, et les connaissances sur la structure ou le

modle du systme. Parmi les intrts du diagnostic de dfauts figure l'optimisation des

oprations de maintenance, la minimisation de larrt du service, lassurance dune bonne qualit

du produit, ainsi que la reconfiguration de la commande.

La conception d'un systme de diagnostic performant n'est, cependant, pas une tche facile

raliser, puisque la majorit des systmes rels sont de nature non-linaire faisant intervenir un

grand nombre de variables et travaillant dans un environnement entach de bruit, et affect par

diffrents types de perturbations. Depuis des annes, un grand nombre de chercheurs se sont

intresss la rsolution du problme de diagnostic des dfauts. On trouve ainsi plusieurs tudes

dans la littrature qui proposent diffrentes techniques de diagnostic de dfauts. Dune faon

gnrale, on peut dcomposer les mthodes de diagnostic en deux grandes familles : des

mthodes bases sur le modle, et des mthodes bases sur les donnes rcupres partir du

systme. Cependant, la complexit des systmes industriels rend difficile, voire impossible,

lobtention dun modle fondamental exact et prcis reprsentant le systme dans toutes les

conditions de fonctionnement afin de lutiliser pour raliser un diagnostic de dfaut par modle.

Dun autre ct, la technologie moderne nous offre un grand bnfice puisquelle fournit un

grand nombre dinformations (donnes) mais dont lanalyse nest pas vidente, ce qui explique

2

le recours des mthodes de diagnostic de dfauts bases sur les donnes. En plus la nature des

signatures(ou symptmes) de dfauts qui sont des grandeurs alatoires rend la dtection dune

diffrence ventuelle entre la signature nominale et celle mesure ne peut pas se faire facilement

avec les mthodes dterministes.

Pour ces raisons, lintrt des industriels pour les mthodes de diagnostic de dfauts diriges par

des donnes notamment celle de lintelligence artificielle (rseaux de neurones, systmes

experts,..) prend de plus en plus dampleur. Lintelligence artificielle a pour but dlaborer des

systmes ayant des capacits intellectuelles comparables lhomme capable de prendre des

dcisions dune manire automatique dans lenvironnement peru. Dans ce vaste domaine, on

trouve un axe de recherche assez important qui est lapprentissage automatique Machine

Learning (Ao et al., 2010) qui permet de bien comprendre un phnomne ou un systme

illustr par un nombre limit dexemples de donnes afin de construire des modles pouvant tre

appliqus des nouvelles observations (exemples). Dans cette thse, la mthode dintelligence

artificielle stochastique Machines Vecteurs Supports (ou Sparateur Vaste Marge, Support

Vector Machines, SVM) est utilise pour la conception des mthodes de diagnostic avances.

La mthode SVM est issue de la thorie de lapprentissage statistique (Vapnik, 1998) introduite

par Vapnik dans les annes 90 (Boser et al., 1992). Elle a t conue au dpart pour trouver un

discriminateur optimal entre deux classes de donnes, et a t ensuite tendue pour le cas de la

rgression. La capacit de gnralisation, et l'aspect stochastique ont favoris l'utilisation de cette

mthode d'apprentissage statistique pour le diagnostic de dfauts. Dans ce cas, le diagnostic de

dfaut est assimil un problme de classification (en deux classes : normale et anormale). Dans

cette mthode, le choix et lextraction des caractristiques reprsentatives de chaque dfaut

reprsentent l'tape la plus importante afin dtre sensible aux symptmes du dfaut et dobtenir

ainsi un systme de diagnostic ractif et prcis.

Ce travail contribue dvelopper une nouvelle approche originale de diagnostic de dfauts assez

performante en termes de prcision, temps de dtection et permettant un pourcentage quasi nul

des fausses alarmes. La mthode SVM est utilise en premier choix pour la dtection et

lisolation de dfaut. Dans certains cas, la modlisation par SVM pour la rgression SVR est

ralise en parallle afin dajouter des estimations au vecteur de mesure. Dans dautres cas, une

combinaison avec des mthodes bases sur le modle (principalement lobservateur grand

gain) a t ncessaire afin de garantir une bonne isolation de dfaut. Cette stratgie est applique

aux systmes rels lchelle de laboratoire/pilote dans le cas dun racteur chimique, et en

simulation dans le cas de procd de traitement des eaux uses et du systme olien.

3

Ce mmoire est organis comme suit :

Le premier chapitre est ddi la revue des mthodes de diagnostic et leurs applications suivie

dune prsentation de la thorie des mthodes utilises dans cette thse, savoir la mthode

SVM, SVR, et quelques observateurs non linaires.

Le deuxime chapitre concerne la premire application de cette thse qui est le systme de

traitement des eaux uses Waste Water Traitement Process WWTP . Ce chapitre prsente

tout dabord le procd et son modle utilis pour la simulation. Ensuite, la mthode SVR est

utilise pour la modlisation (entre/sortie) de certaines variables cls. La mthode SVM est

galement utilise pour le diagnostic de dfaut dans ce systme en utilisant les variables estimes

par SVR en plus des variables mesurs en ligne. Enfin, quelques rsultats de simulation sont

discuts.

Le troisime chapitre est consacr au systme olien Wind Turbine en appliquant la

mthode SVM et un observateur de type Kalman pour le diagnostic de dfaut. On utilisera un

benchmark disponible sur internet pour cette application. La stratgie propose dans ce chapitre

par lauteur de cette thse (Laouti et al., 2011a) a dmontr son efficacit en se classant premire

par rapport 12 autres mthodes lors dune comptition internationale, organise par la socit

kk-electronic, sur le diagnostic de dfaut dans les oliennes .

Le quatrime chapitre prsente lapplication de la mthode SVM (classification et rgression)

aux racteurs chimiques parfaitement agits Continuous Stirred Tank Reactor, CSTR .

Dans chaque application, une revue des mthodes de diagnostic employes dans le domaine en

question est prsente ainsi que le systme et son modle. Par la suite la manire choisie pour

appliquer les SVM est dfinie et les rsultats de simulation sont discuts.

Le mmoire se termine par une conclusion gnrale rsumant les contributions de la thse et

prsentant les perspectives de recherche que je souhaite poursuivre dans lavenir ainsi que

quelques rflexions sur ces prochaines voies de recherches.

Parmi les contributions de cette thse on cite :

1. Une revue de la mthode SVM et ses applications pour le diagnostic de dfauts.

2. La combinaison entre une mthode de diagnostic base sur les donnes SVM avec une

mthode base sur le modle Observateur afin de tirer profit des avantages de chaque

mthode.

4

3. Lapplication de la mthode SVM dans trois procds diffrents : un racteur parfaitement

agit, un systme olien et un systme de traitement des eaux uses.

4. Un capteur logiciel bas sur SVM rgression SVR est dvelopp et sa capacit de

prdiction et de gnralisation face un environnement bruit et assez perturb est tudie.

5

CHAPITRE I : Diagnostic de dfauts et thorie des Machines Vecteurs de Supports

7

Dans ce chapitre, nous prsentons dune manire simplifie les concepts basiques de diagnostic

de dfauts, et les fondements thoriques des mthodes utilises dans cette thse telles que les

Machines Vecteurs Supports SVM, Observateurs, Analyse en Composantes Principales, etc.

I.1. Gnralits

La recherche constante dune meilleure comptitivit pousse les entreprises produire des

machines ayant une grande fiabilit et disponibilit. Cependant, un systme quelle que soit sa

modernit et sa robustesse, est affect par des dysfonctionnements qui peuvent compromettre son

bon fonctionnement. Il apparat donc ncessaire didentifier rapidement les changements

inattendus (dfauts).

Dans cette premire partie, nous allons d'abord prsenter les principes de diagnostic de dfauts et

quelques dfinitions de la terminologie dans ce domaine.

I.1.1. Terminologie en matire de diagnostic

Partant du fait que le diagnostic de dfaut est rparti sur plusieurs domaines technologiques, un

comit technique SAFEPROCESS de la Fdration internationale de contrle automatique IFAC

a essay de proposer une terminologie unifie (Isermann and Ball, 1997). La terminologie

dfinie par ce comit sera utilise dans ce mmoire :

Dfaut : cart non autoris d'au moins une proprit caractristique ou variable du systme

partir du comportement acceptable / habituelle /standard du systme.

Panne : Linterruption permanente d'une capacit du systme pour effectuer une fonction requise

dans des conditions de fonctionnement spcifies.

Dysfonctionnement : Lirrgularit intermittente dans l'accomplissement de la fonction

souhaite du systme.

Dtection de dfauts : Dtermination de dfauts prsents dans un systme et l'heure de

dtection.

Isolation des dfauts : Dtermination du type, de l'emplacement et du temps de dtection d'un

dfaut. Cette tape suit ltape de dtection de dfauts.

Identification de dfauts : Dtermination de la taille et variation dans le temps du

comportement d'un dfaut. Cette tape suit ltape de lisolation de dfaut.

8

Diagnostic des dfauts : Dtermination du type, de la taille, de l'emplacement et du temps de

dtection d'un dfaut. Cette tape suit la dtection de dfaut et inclut lisolation et l'identification

de dfaut.

Rsidu : Lindicateur de dfaut, bas sur les carts entre les mesures et un modle bas sur des

calculs d'quations.

Symptme : Le changement d'une grandeur observable du comportement normal.

Surveillance : Cest une tche continue en temps rel dterminant les conditions possibles d'un

systme physique, tout en reconnaissant et en indiquant des anomalies du comportement.

Supervision : La surveillance d'un systme physique tout en prenant des actions appropries

pour maintenir le fonctionnement dans le cas de dfauts.

Scurit : Aptitude d'un systme ne pas causer de danger pour les personnes, le matriel ou

pour l'environnement.

Modle quantitatif : Utilise des relations statiques et dynamiques entre les variables du systme

et des paramtres afin de dcrire le comportement d'un systme en terme quantitatif

mathmatique.

Modle qualitatif : Utilise des relations statiques et dynamiques entre les variables du systme

et des paramtres pour dcrire le comportement du systme en termes qualitatifs tels que les

causalits ou les rgles.

Pour plus de dtails voir (Isermann, 2011, Isermann, 2006).

En rsum, le diagnostic de dfaut consiste dtecter, isoler et estimer le dfaut. La dtection

du dfaut dtermine linstant dapparition dun mauvais fonctionnement dans le systme, tandis

que lisolation du dfaut consiste cerner (identifier) les causes ou les sources de dfaut afin de

dire s'il s'agit d'un dfaut de type capteur, actionneur ou procd, et lidentification du dfaut

donne une estimation de certaines caractristiques du dfaut telle que son amplitude.

Le rle de diagnostic de dfaut est dassurer la scurit et le fonctionnement optimal du systme

par lindication de tout tat non dsir (ou statu hors contrle) permettant ainsi dviter tout

dommage ou accident. Gnralement, le diagnostic de dfauts se fait en ligne. Les tches de

dtection et de localisation sont accomplies paralllement ou bien une tche dclenche l'autre.

9

Nous pouvons souligner que le terme diagnostic a une origine mdicale, qui signifie trouver

les causes de la maladie (dfaut) partir des symptmes perus (les signes observables).

I.1.2. Le principe de dtection de dfaut

La Figure I.1 montre un schma global du fonctionnement dun systme pouvant tre affect par

diffrents types de dfauts. Comme cest le cas dans la plupart des systmes industriels, ce

procd est rgul en boucle ferme avec un contrleur dont lobjectif est de maintenir la sortie

Y le plus proche possible de la consigne Yref. Des instruments de mesure transmettent les

donnes acquises englobant les entres et les sorties mesures ainsi que la sortie du contrleur

vers l'organe de dtection et de diagnostic de dfauts. En plus de ces donnes, le module de

diagnostic de dfaut utilise un modle (fondamental ou statistique) pour raliser la surveillance

du systme et informer le module de reconfiguration de la prsence de dfauts.

Figure I.1 Architecture du fonctionnement dun systme avec une commande tolrante aux

dfauts

Le bloc de reconfiguration permet de garder le systme dans ltat dsir par le rglage des

paramtres du contrleur ou par une adaptation dune nouvelle loi de commande (Blanke et al.,

2006, Blanke et al., 2003, Prakash et al., 2002). On note quil existe plusieurs mthodes de

reconfiguration, toutefois elles ne seront pas discutes dans ce mmoire. Le but de la

reconfiguration est de continuer faire fonctionner le systme tout en maintenant les

performances/conditions de scurit requises malgr la prsence de dysfonctionnement dans

l'attente d'une opration de maintenance (Patton, 1997).

Afin de raliser le diagnostic des dfauts, une premire approche consiste dupliquer les

composants d'instruments de mesure pour augmenter la fiabilit. Cela nous permet de choisir la

mesure saine partir des mesures disponibles. Cette approche sappelle la redondance

10

matrielle. Elle est utilise dans le diagnostic, surtout dans le domaine aronautique, mais elle

entrane une augmentation des cots et une rduction de lautonomie du systme. La deuxime

approche, qui est la redondance analytique, est trs intressante la fois sur le plan financier et

technique puisquelle se base uniquement sur lexploitation de relations existantes entre les

diffrentes variables mesures ou estimes. Aprs la collection des donnes, on essaie dextraire

les informations utiles partir de ces donnes, en dautres termes, de convertir ces donnes

brutes en quelque chose de significatif pour des objectifs bien prcis. Le processus de dtection

de dfauts proprement dit est donc compos essentiellement de deux phases (Chow et al., 1982) :

gnration de rsidus suivie par lanalyse de rsidus, comme le montre la Figure I.2

Figure I.2 Schma classique de dtection des dfauts

Gnration des rsidus : Cette tape consiste crer un signal calculant la diffrence entre la

sortie relle et celle estime. Le rsidu est nul (ou ngatif dans certaines mthodes) dans le cas

du fonctionnement normal, et en cas de dysfonctionnement, il sera proportionnel la gravit du

dfaut.

valuation des rsidus : Cette phase permet d'analyser les indicateurs de dfaut gnrs et de

dfinir un seuil (fixe, adaptatif, ou statistique) qui va dcider de l'instant de changement d'tat de

fonctionnement du systme. En effet, dans le cas rel, les bruits de mesure, les imprcisions de

modlisation et les perturbations ne sont pas des grandeurs dterministes mais de nature alatoire

car ils vont introduire des variations imprvisibles sur le systme. Cette tape est donc capitale

afin de diminuer les taux de fausse alarme ou de non dtection.

I.1.3. FDI en boucle ouverte et en boucle ferme

Un dfaut agit dune manire diffrente sur le systme dpendamment si le fonctionnement (de

la commande) est en boucle ouverte ou en boucle ferme. Il influence les sorties et/ou les entres

mesurables et/ou les paramtres internes du systme ou les variables dtats non mesurables.

11

Lorsquun systme ou procd fonctionne en boucle ouverte et quun dfaut apparat, ce dernier

va influencer la sortie Y par un cart (offset) Y. Par contre, dans le cas de procd fonctionnant

en boucle ferme, la sortie risque de ne montrer quune faible dviation qui disparat

rapidement, surtout si un contrleur de type intgral est utilis pour asservir cette sortie

(contrleur PI). En revanche, la variable dentre manipule U va montrer un offset permanent

U. Il est souligner que la sortie est galement affecte par des bruits, perturbations et des

variations dans U. Cela rend la tche de diagnostic trs difficile.

On note galement que les dfauts peuvent apparatre de diffrentes faons, dune manire

brusque (cest le cas dune coupure de phase dans un moteur lectrique), dune faon progressive

(on parle dune drive lente, cest le cas dencrassement) ou dune faon intermittente qui

apparat selon les conditions de fonctionnement (temprature, pression, concentration).

I.1.4. Domaines concerns par la FDI

La communaut de l'automatique a tabli un cadre thorique bien fond pour le diagnostic de

dfaut pour les systmes linaires (Nyberg, 1999, Chow et al., 1982) et non linaires (Ding,

2008). Une revue dtaille des techniques dveloppes pour le diagnostic de dfauts est donne

dans (Venkatasubramanian V. et al., 2003) et un grand nombre d'applications en ingnierie

jusqu'en 1996 est fourni dans (Isermann and Ball, 1997) .

Dans cette littrature, nous pouvons citer les applications suivantes :

Procds chimiques : (Caccavale et al., 2011, Verron, 2007, Pierri et al., 2008a,

Chetouani, 2006, Ram Maurya et al., 2004)

Moteurs, machines et roulements : (Verucchi et al., 2008, Ding, 2008, Isermann,

2005)

Eoliennes : (Wei, 2010, Dolan, 2010), Donders, 2002)

Procd de traitement des eaux uses : (Baggiani and Marsili-Libelli, 2009,

Wimberger and Verde, 2008, Tharrault, 2008)

Turbine gaz industrielle : (Simani et al., 2003)

Systme hydraulique : (Ding, 2008, Hammouri et al., 2002)

Industrie automobile : (Arnanz et al., 2011,Saludes Rodil et al., 2009, Svard and

Nyberg, 2010)

Rseau de distribution lectrique : (Mohamed and Rao, 1995)

Robot manipulateurs : (Paviglianiti et al., 2010)

12

Circuit lectronique analogique : (Mohsen and El-Yazeed, 2004)

Systme de contrle du vol davion : (Hajiyev, 2012)

On peut trouver aussi une revue dtaille sur le diagnostic de dfauts appliqu sur les

systmes de chauffage, ventilation, et climatisation : (Katipamula and Brambley,

2005).

I.1.5. Performances des techniques FDI

Afin d'valuer la performance d'une technique de diagnostic de dfauts ou la comparer avec

dautres mthodes, il faut dfinir certains critres de performances respecter:

1. La rapidit de dtection du dfaut.

2. La minimisation de fausses alarmes

3. La robustesse de la mthode face la prsence de bruit, perturbation et erreur de

modlisation.

4. Ladaptation face aux variations du procd.

5. La capacit identifier des dfauts multiples.

6. La capacit manipuler diffrents types de dfauts (actionneur, capteur, procd).

7. La diagnosticabilit ou la capacit de distinction entre les diffrents dfauts.

8. La sensibilit face des petits dfauts.

9. La prcision de la localisation.

10. La convenance par rapport aux systmes rels gnralement non linaires.

11. Laptitude inclure la commande tolrante aux dfauts.

12. La simplicit d'implmentation et d'utilisation.

I.2. Les mthodes de diagnostic

Des chercheurs de domaines varis ont essay de raliser la tche de diagnostic pour diffrents

systmes en apportant leur connaissance et outils de certains domaines de recherche. Cela

conduit l'enrichissement de mthodes de diagnostic.

Certains chercheurs dcomposent les mthodes de diagnostic en 3 catgories (Isermann, 2011,

Ping, 2011, Verron, 2007, Frank et al., 2000). Dans cette thse, les approches de diagnostic de

dfauts sont dcomposes en deux grandes catgories, comme propos par (Zhang and Jiang,

2008) et (Venkatasubramanian V. et al., 2003a) :

13

1. Schmas bass sur le modle (Venkatasubramanian V. et al.,

2003a,Venkatasubramanian et al., 2003b)

2. Schmas bass sur les donnes (sans modle a priori) (Venkatasubramanian, 2003c)

Ces approches sont brivement discutes dans les paragraphes suivants.

I.2.1. Mthodes base de modle explicite

Les mthodes bases sur un modle explicite utilisent un modle dcrivant les relations

fondamentales gouvernant le systme afin de gnrer des symptmes de dfauts (Simani et al.,

2003). Ces mthodes ont de nombreux avantages car elles permettent didentifier le type du

dfaut et de remonter la source du dfaut pour diffrentes classes de systmes. La plupart des

mthodes base de modle reposent sur le concept de redondance analytique qui consiste

vrifier la cohrence entre le comportement simul du modle et celui rellement observ, do

la ncessit davoir un modle dtaill et suffisamment prcis du systme afin d'avoir des

rsultats satisfaisants. Ceci est ralis en gnrant des rsidus qui permettent leur tour de

dtecter un cart entre le comportement dfectueux et le comportement normal du systme.

Plusieurs mthodes sont envisageables pour lobtention de rsidus partir de modles

analytiques (Figure I.3). On peut citer par exemple les mthodes par estimation de paramtres,

par estimation d'tat, ou par espace de parit.

Figure I.3 Schma de classification des mthodes de diagnostic de dfauts bases sur le

modle

14

Approche par estimation de paramtres :

Partant de l'ide qu'un dfaut se reflte dans les paramtres physiques du systme, des mthodes

d'estimation paramtriques sont utilises pour estimer la valeur actuelle de ces paramtres. Le

rsidu est ainsi calcul partir de l'cart entre la valeur des paramtres estims et celle de

rfrences obtenue dans le cas sans dfaut (Simani et al., 2003, Gertler, 1998, Fuente et al.,

1996).

Approche par espace de parit :

Cette technique se base sur la rcriture des quations d'tat et de mesure de telle sorte que seules

les variables connues (entres et sorties) sont autorises apparatre. Ces variables connues sont

ensuite utilises afin de construire un rsidu indicateur de dfaut.

Soit le modle

zBzA

G M dcrivant le systme

zBzA

pG . Ainsi le rsidu peut tre dfini

comme suit :

zuzB

zA

zB

zA

zr (I.1)

Plusieurs travaux ont utilis cette mthode pour le diagnostic de dfauts (Gustafsson, 2007,

Gertler, 1998) ou ont combin cette mthode avec la mthode destimation de paramtre

(Isermann, 2005).

Approche par estimation d'tat (observateur)

La construction des observateurs dtat reprsente une des techniques les plus employes dans

lapproche base sur le modle (Ding, 2008, Pierri et al., 2008b, Li et al., 2008, Isermann, 2006,

Simani et al., 2003, Venkatasubramanian V. et al., 2003a, Lootsma, 2001, Lootsma, 1999). La

redondance analytique est obtenue grce aux tats estims partir dun modle adquat et dun

ensemble de mesures appropries. En comparant les variables estimes et mesures, un ensemble

de signaux (rsidus) sensibles aux dfauts est gnr. Ces rsidus sont ensuite analyss pour

dtecter et/ou isoler le dfaut.

Diffrents types dobservateurs ont t proposs dans la littrature pour les systmes linaires et

non linaires. Parmi les techniques les plus utilises, on peut citer les observateurs entre

inconnue (Sotomayor and Odloak, 2005); les observateurs bass sur le placement de structure

propre The eigen structure assignment approach (Patton and Chen, 2000), les observateurs

15

mode glissant (Edwards et al., 2000) , le filtre de Kalman tendu qui a t initialement appliqu

pour la dtection et lisolation des dfauts des systmes non linaires par (Huang et al., 2003).

Le problme fondamental de dtection et disolation des dfauts de systmes non linaires a t

introduit initialement par Frank (Frank, 1990). Depuis lors, plusieurs techniques ont t utilises

pour les systmes non linaires. Une revue sur les principales approches bases sur les

observateurs pour les systmes non linaires a t donne par (Alcorta Garca and Frank, 1997) .

Les auteurs dans (Hammouri et al., 2002), (De Persis and Isidori, 2001), (Kabore et al., 2000) et

(Hammouri et al., 1999) ont propos une solution pour la dtection et lisolation des dfauts des

systmes non linaires en combinant une approche gomtrique de dcouplage avec les

techniques des observateurs non linaires, notamment le grand gain.

Tout l'art de ces approches rside dans le choix du terme correctif et plus particulirement la

synthse de gain qui a pour objectif non seulement de s'assurer de la convergence de l'estimation

vers la sortie relle du procd mais aussi le dcouplage par rapport aux autres dfauts.

Dans cette thse on sintresse deux types dobservateurs ; un observateur grand gain et un

autre de type Kalman cause de leur convergence exponentielle. Lobservateur grand gain

sera appliqu dans lestimation dtat d'un racteur chimique alors que lobservateur de type

Kalman trouvera son application dans le systme olien. Un bref rappel de ces types

dobservateurs est donn ci-dessous.

I.2.1.1. Observateur grand gain

Ce type dobservateur peut sappliquer une large classe de systmes non linaires qui

scrivent sous la forme suivante :

Cxtxty

ttxtstutx

ttxtxtstuxtstuAtx

ttxtstuxtstuAtx

qqq

qqqqqq

)()(

)())(),(),(()(

)())(,),(),(),(())(),(()(

)())(),(),(())(),(()(

1

111111

111211

(I.2)

O nTq Rxxx ,,1 est le vecteur dtat, T

ikii xxx ],,[ 1 , tu est lentre, suAi , est une

matrice carre de dimension ).( nkqkk , s(t) est un signal connu, Tq ],,[ 1 sont des

16

fonctions non linaires et supposs diffrentiables, Tq ],,[ 1 est un vecteur non connu

born, 0,,0, kIC .

Un observateur grand gain peut tre construit pour le systme prcdent en se basant sur les

hypothses suivantes:

H1) est globalement Lipschitz par rapport x.

H2) Les matrices ))(),(( tstuAi et leurs drives sont inversibles et bornes

H3) Les matrices ))(),(( tstuAi sont diffrentiables par rapport au temps et leurs drives sont

bornes.

Dans ce cas, lobservateur grand gain du systme (I.2) est donn par:

)())(),(),(())(),(( 1 yxCKtxtstuxtstuAx (I.3)

O K est une matrice de taille kn tel que KCA est une matrice Hurwitz,

000

))(),((100

0))(),((200

00))(),((10

))(),((

tstuqA

tstuA

tstuA

tstuA (I.4)

),,(

)1,,1,,(1

)1,,(1

),(

xsuq

qxxsuq

xsu

tu

,

q

00

00

20

00

(I.5)

))(),((1))(),((10

00

))(),((10

000

)(

tstuqAtstuA

tstuAk

I

t

(I.6)

0000

000

000

000

kI

kI

kI

A

(I.7)

est un paramtre de rglage positif, Ik est la matrice identit de taille kk .

17

Thorme: (bas sur les rsultats donns dans Farza et al., 1997, Gauthier et al., 1992)

Supposons que le systme (I.2) satisfait les hypothses H1), H2) and H3), alors:

! " )0()0()()( xxetxtx t

O est la norme infinie (L ) de )(t ; 0#! , 0#" et 0# sont des constantes. Cela

implique que, si 0 , alors, le systme (I.3) est un observateur exponentiel du systme (I.2).

I.2.1.2. Observateur du type Kalman

Lobservateur de type Kalman a t initialement propos par (Bornard et al., 1989) et

(Hammouri and de Leon Morales, 1990) pour une classe de systmes non linaires o la matrice

dtat peut dpendre du signal dentre, du signal de sortie ou du temps et toutes les entres sont

rgulirement persistantes. Ce systme peut se mettre sous la forme :

Cxy

uxuAx )()( $ (I.8)

O %y ; nx % ; mu % et $(u) est un vecteur qui dpend non linairement de u.

Notons par ),( 0tsu& , la matrice de transition, la solution unique de lquation :

),(.)(),( 00 tssuAds

tsdu

u &&

(I.9)

Notons par ),,( 100 tttuG le Grammien dobservabilit relatif lentre u sur lintervalle

[t0, t0+ t1] :

'

10

0

),(),(,, 0*

0*

100

tt

t

uu dtttCCtttttuG && (I.10)

O C* reprsente la transpose de C.

Dfinition :

Lentre uRm est dite rgulirement persistante pour le systme (I.8) si ( t1 > 0, ( )1 > 0, ( )2

> 0 and ( t0 * 0 tels que 0tt*+ :

2100max

1100min

,,

,,

),

),

*

tttuG

tttuG (I.11)

18

O min, et max, reprsentent la plus petite et la plus grande valeur propre respectivement.

Thorme: (Bornard and Hammouri, 1991)

Si u est rgulirement persistante, alors pour tout > 0, le systme suivant :

CCuARRuARR

yCxCRuGxuAx

TT

T

)(.)(.

)()( 1

(I.12)

est un observateur exponentiel pour (I.8). Le paramtre de rglage dtermine la vitesse de

convergence de lobservateur qui est garantie si la matrice R est symtrique dfinie positive.

La particularit de lobservateur de type Kalman est son gain variable donn par la rsolution de

lquation algbrique de Riccati.

I.2.2. Mthodes bases sur les donnes

La disponibilit dune grande quantit des donnes ainsi que les inconvnients des mthodes

bases sur le modle (dus la ncessit davoir un modle prcis par exemple), ont encourag la

croissance des mthodes de diagnostic bases sur les donnes. Ces mthodes peuvent permettre

des dveloppements rigoureux des donnes disponibles (mesures historiques ou en temps rel)

mme dans le cas de systmes complexes, do leur succs dans les applications industrielles.

Elles font appel des procdures d'apprentissage et de reconnaissance de forme, la logique

floue ou lintelligence artificielle (Frank and Kppen-Seliger, 1997) afin de gnrer les

symptmes de dfaut qui seront analyss pour fournir la dcision de diagnostic de dfaut (Reiter,

1987).

Les mthodes bases sur les donnes sont appropries pratiquement pour n'importe quel type de

problme pour lequel d'importantes quantits de donnes mesures reprsentatives du

fonctionnement du systme sont disponibles. Elles sont dautant plus intressantes lorsque le

modle mathmatique du systme nest pas disponible, ce qui rend inutilisables les mthodes de

diagnostic bases sur le modle. Lapplication de ces mthodes est ralise en diffrentes tapes

dacquisition et prtraitement des donnes, de modlisation/apprentissage et de validation. La

Figure I.4 rpertorie les diffrentes mthodes de diagnostic de dfauts bases sur les donnes. Un

aperu des mthodes bases sur des donnes est donn dans (Venkatasubramanian, 2003).

19

Figure I.4 Mthodes de diagnostic diriges par les donnes

Vrification de limites et tendances

La mthode la plus simple de supervision dans le cas dabsence de modle est mono variable et

se base sur la vrification de limites (seuils) de la valeur de certaines variables mesurables telles

que : la pression, la temprature, la force, la vitesse et la position. Si cette valeur dpasse la zone

de tolrance ( maxminY YY -- et dt

dYY

dt

maxmindY -- ), une alarme se dclenche. Loprateur doit

ensuite cerner le dfaut (le localiser) afin de prendre les mesures ncessaires pour le retour

ltat normal.

Certes, cette mthode est simple et facile mettre en uvre, mais elle a des limites. En effet, si

une variable mesure dpasse la zone de tolrance, le procd est probablement dj dans un tat

critique. En plus, malgr que ces mthodes fonctionnent quand le procd est ltat dquilibre,

la situation devient plus complique si la variable contrle change de dynamique avec les points

de fonctionnement. Aussi, un dfaut important dans un procd complexe peut dclencher

plusieurs alarmes en mme temps. Cela rend la tche de loprateur qui supervise le procd

difficile pour identifier le dfaut en question afin de ragir immdiatement par les actions

requises.

Mthodes statistiques

Les mthodes statistiques font partie des mthodes bases sur les donnes. En tudiant les

caractristiques dun ensemble dobjets ou dobservations, elles donnent un moyen essentiel

pour la connaissance. A partir de ces donnes, elles fournissent un outil graphique facilement

20

manipulable et interprtable par loprateur. Malheureusement, cela demande la connaissance

complte de la population, ce qui rend ces mthodes coteuses, voire impossibles dans certains

cas (comme dans le cas des systmes rgis par des perturbations inconnues). La solution est donc

dutiliser les statistiques infrentielles qui consistent utiliser la thorie de probabilits afin

dinduire les caractristiques inconnues dune population partir de certains chantillons tirs de

cette population avec une certaine marge derreur, autrement dit la dtermination dune loi de

probabilit partir dune srie dexpriences.

Parmi les mthodes statistiques, on cite lAnalyse en Composantes Principale (ACP), Partial

Least Square (PLS) et Support Vector Machines (SVM). Les mthodes ACP et PLS ont t

utilises dans cette thse titre comparatif avec la mthode de rfrence qui est la mthode

SVM. Dans les deux paragraphes suivants, on propose donc de rappeler la thorie et les

applications de ces deux mthodes.

I.2.2.1. LAnalyse en Composantes Principales (ACP)

Lanalyse en composantes principales (ACP) Principal Component Analysis PCA est une

mthode gomtrique et statistique qui permet de transformer lespace multivariable dentres

corrles en un espace plus petit non corrl tout en conservant le maximum de variance des

donnes dentres. Elle permet de voir les donnes dune manire diffrente (dans un autre

repre) par la rotation des axes des variables originales vers des nouveaux axes, qui sont

orthogonaux et compltement dcorrls pour viter davoir des informations redondantes. Cest

donc une mthode danalyse et de rduction de dimension de donnes. Elle gnre un nouveau

jeu de donnes appel Composantes Principales (CP) (variables latentes, ou facteurs) partir

desquelles le modle va tre construit, et chaque composante a un taux de reprsentation du

modle, comme on peut le voir sur la Figure I.5 . Chaque composante est une combinaison

linaire des variables originales. Donc chaque variable peut contribuer la cration du modle

contrairement la slection des caractristiques (voir section I.2.3.3) qui utilisent juste un sous-

ensemble des variables originales pour la cration du modle (Ramaswami and Bhaskaran,

2009). Plus le nombre de composantes est important, plus la sensibilit au bruit va augmenter.

On se limite gnralement 2 ou 3 composantes, o le maximum dinformation (variance) est

compress.

21

Figure I.5 Taux de reprsentativit des composantes principales dans le modle

Le champ dapplication de cette mthode est trs vari allant de la rduction de dimension ,

rduction et suppression de bruit, visualisation, la compression de donnes, dtection des

dfauts (Sun et al., 2005, Dunia et al., 1996), et aussi au prtraitement des modles empiriques.

Fondement thorique de la mthode ACP

Soit X une matrice de donnes de taille mn constitue de n observations ou chantillons et m

variables :

.

.

.

/

0

111

2

3

nmn1

1m11

xx

xx

X

L'ACP cherche laxe (utilis dans la projection des chantillons) qui va maximiser la capture de

variabilit ou variance (information) des nuages de points. Ceci est fait en utilisant une matrice

de transformation nmP % , qui projette les donnes dans un espace de dimension rduit :

XXEetTPX T (I.13)

Pi est nomm le vecteur poids loading , qui contient linformation qui concerne la relation

entre les variables. X est la nouvelle matrice de donnes qui estime X . E est la matrice des

rsidus et reprsente la source de bruit. Les lments de T sont appels scores, et ils contiennent

la relation entre les chantillons. Les scores reprsentent les valeurs des variables originales

mesures et transformes dans lespace de dimension rduit. Lespace des donnes dorigine

peut tre calcul comme :

EptXETPX Ti

a

i

i

T 4 51

(I.14)

O ti est le vecteur score. Ceci donne la mthode ACP la possibilit denlever le bruit et de

laisser seulement linformation pertinente. La matrice de variance-covariance R est obtenue par

la dcomposition en valeurs singulires :

EEXX

nn

XXUUR TT

TT

1

1

12/1

(I.15)

Variabilit

Explique % Composantes Principales

1 2 3 4 5 6 7 8 9 10 11 12 13

22

O est la matrice diagonale contenant les valeurs propres dans un ordre dcroissant de la

matrice de corrlation R. Les colonnes de la matrice U sont les vecteurs propres de R. La matrice

P est gnre par le choix des vecteurs propres de U.

Le choix du nombre a (a

23

1. La carte de contrle T2 de Hotelling statistique

La carte de contrle T est dfinie comme la majeure partie de variation des donnes lintrieur

du modle (lespace principal). Le processus est considr tant en fonctionnement normal pour

un seuil de confiance )) donn, et une distribution du 6 :

anaFann

naT

kxPPkxktktkT

na

T

TTT

a

,)(

)1(

)()()()()(2

2,,

2112

))

7 (I.17)

O n est le nombre dchantillons, a est le nombre de composantes principales, an,aF ) est la

valeur de la distribution de Fisher-Snedecor. a est la matrice forme par les premires lignes et

colonnes de , ) reprsente le niveau appropri de l'importance pour la ralisation du test qui

prend gnralement la valeur de 0,05 ou 0,01 pour les limites de confiance.

2. Indice Squared Prediction Error SPE

Lindice SPE est dfini comme la somme des carrs de chaque ligne de E. Il est perpendiculaire

l'espace construit par le modle ACP :

5

n

j

T

TT

aa

T

jj XPPIXkekekxkxkSPEQ1

22 )()()()()( 7 (I.18)

5

n

j

T

T

jj

T pktkxEEQ1

22)()( 7

(I.19)

La limite suprieure, ou les seuils de confiance de Q statistique, peuvent tre calculs par sa

distribution approximative comme suit :

01

21

002

1

101

12.. hhhchQ

.

./

0

112

3

))

5

n

aj

i

ji h1

22

310 3

21,

,

(I.20)

O c) est l'cart type normal correspondant la partie suprieure (1-)) centile, ,j est la valeur

propre associe au jme vecteur poids. Q statistique reprsente lerreur de prdiction quadratique

dcrivant le bruit dans les donnes et la variation lextrieur du modle. Q est utilis pour

surveiller et suivre de prs la corrlation entre les variables du procd. Une augmentation de sa

valeur signifie un changement dans les corrlations qui gouvernent les variables ce qui

24

indiquerait un dfaut. Cependant, la distance SPE est sensible aux incertitudes de modlisation

provoquant de nombreuses fausses alarmes si les systmes sont non-linaires.

Des travaux ont t faits utilisant lACP avec les cartes de contrle Q et T2 statistiques afin de

diffrencier entre loccurrence dun dfaut et une condition de fonctionnement normale largie

(Humberstone et al., 2012, Humberstone, 2010). Nanmoins, ces cartes de contrle prsentent

certaines restrictions puisqu'elles font des suppositions sur la distribution des donnes. (Camci et

al., 2008) proposent une carte de contrle base sur la distance noyau utilisant les principes de

SVM et dmontre quil est sensible tous les types de donnes en hors contrle quels que soient

leurs distributions et permet aussi de bnficier et dapprendre de ces donnes.

I.2.2.2. Moindres carrs partiels (PLS)

La mthode de Moindres Carrs Partiels (MCP) ou Projection aux Structures Latentes (PSL)

Partial Least Squares PLS est un algorithme danalyse statistique multivariable propos par

Wold la fin des annes 60 qui combine les fonctionnalits de lACP et la rgression multiple

(Wold, 1966). Il tait destin au dbut pour lconomtrie. Il a trouv un grand succs et pris de

lampleur en chimiomtrie o il est devenu un outil standard danalyse et de calibrage du spectre

pour choisir les longueurs donde appropries. Maintenant, cette technique est applique dans

plusieurs disciplines telles que la mdecine, la modlisation des procds, les sciences

pharmaceutiquesetc. La notation PLS est utilise par la suite dans cette thse pour dsigner

cette mthode.

La PLS cherche les composantes latentes qui maximisent la covariance entre X et Y, afin de

trouver une relation entre les variables indpendantes (entre X) et les variables dpendantes

(sortie Y) en les dcomposant en variables latentes non corrles avec un processus itratif. La

structure latente correspond lextraction du maximum de variation de Y qui explique au mieux

la structure latente de X. Cette mthode est similaire lanalyse de corrlation canonique, et

est lie aux autres mthodes de rgression telles que la rgression en composantes principales.

La PLS a surmont les problmes de colinarit (qui mnent une mauvaise interprtation des

coefficients de rgression ), et les problmes de limitation du nombre de variables prdites par

rapport aux mthodes de rgression standards des moindres carrs. Elle permet danalyser des

donnes avec plus de variables que dobservations et produit des modles avec une grande

stabilit de prdiction car le risque de sur-apprentissage est minimis. Elle est trs efficace dans

la gestion des valeurs manquantes et donc produit des modles trs robustes face aux dfauts

capteurs par exemple. Elle est aussi capable de dtecter les valeurs aberrantes avec une analyse

25

plus soigne des donnes amliorant ainsi la qualit des modles dajustement. Cette mthode

permet de manipuler plus facilement le bruit et les donnes redondantes et corrles et de raliser

une marginalisation des valeurs anormales pour amliorer la robustesse du systme. Elle

reprsente aussi une faon trs propre dinverser des matrices, la diffrence de lanalyse en

composantes principales qui cherche trouver les composantes principales qui expliquent le

maximum de variance dun seul bloc X ou Y sans tenir compte des autres blocs. Enfin, elle a

lavantage de pouvoir prdire soit plusieurs variables rponse la fois (PLS2) soit juste une seule

variable rponse (PLS1). En gnral, plus les variables rponses sont corrles meilleure sera la

performance de PLS2 par rapport PLS1 en termes dinterprtation et de prcision de prdiction.

Les algorithmes PLS sont numriquement stables, leur simplicit dimplmentation et de calcul

leur donne un aspect fort. Une des difficults de rglage du PLS est le choix du nombre de

valeurs latentes qui permet une bonne gnralisation. Cela peut se faire avec une validation

croise.

La PLS est un outil trs polyvalent qui peut raliser plusieurs tches : la rgression (Melssen et

al., 2007, Kim et al., 2005), la rduction de dimension (Tenenhaus et al., 2007), la classification

(Barker and Rayens, 2003, Nguyen and Rocke, 2002), la supervision et le contrle des procds

(Kourti, 2005), la surveillance des procds (Zhou et al., 2010), et la modlisation (Shinzawa et

al., 2011). Elle a aussi t utilise avec succs dans la surveillance et la dtection des dfauts

pour les donnes chimiques (Wise and Gallagher, 1996). La PLS est mieux adapte au

diagnostic de dfauts que l'ACP sur le plan thorique et pratique (Chiang et al., 2000) car lACP

sintresse seulement la capture du maximum de variance sans tenir compte de la relation qui

existe entre les donnes et les dfauts. La performance et lefficacit de la mthode PLS a t

montre dans plusieurs travaux et articles (Ferrer et al., 2008,Yin et al., 2011), et elle a t

combine aussi avec dautres mthodes telles que les SVMs (Rosipal and Trejo, 2003, Lu and

Wang, 2008).

Diffrentes mthodes ont t proposes pour tendre la mthode PLS au cas non linaire. En

utilisant la force des mthodes noyau, la PLS peut tre tendue dune manire simple et efficace

au cas des systmes non linaires. Il y a aussi plusieurs variantes de PLS qui diffrent selon la

faon avec laquelle elles extraient les vecteurs latents. Un des algorithmes les plus lgants qui

reprsentent la faon standard du PLS est le PLS itratif non linaire (Geladi and Kowalski,

1986) qui est le plus appropri pour la supervision des procds par rapport la mthode

SIMPLS (Li et al., 2010). Lalgorithme SIMPLS a cependant lavantage de calculer les facteurs

PLS directement comme une combinaison linaire des variables dorigine en maximisant un

26

critre de covariance et donc vite de calculer des matrices dgonfles comme cest le cas dans

lalgorithme NIPALS (de Jong, 1993).

Fondement thorique de la mthode PLS

Soit un ensemble de donnes compos des deux matrices X des mesures (entres) et Y des

rponses (sorties). La PLS dtermine la relation entre ces deux blocs, en essayant de garder le

maximum de covariance entre eux, par les quations suivantes :

FUQY

ETPXT

T

(I.21)

X est la matrice prdicateurs de donnes de taille nm o chaque ligne reprsente une

observation ou les mesures un chantillon donn, et chaque colonne reprsente les mesures

dune variable. T est la matrice de scores de X, P la matrice de chargement de X, Y la matrice de

rponse de taille nmy , U la matrice des scores de Y, Q la matrice de chargement de Y, E et F

sont les matrices rsiduelles.

La modlisation de X et Y de cette faon suppose que les deux sont observs avec une erreur

(rsidu). Le chargement se fait travers les vecteurs latents T qui peuvent tre choisis de

diffrentes faons, condition quils soient orthogonaux (dcorrls) couvrant lespace des

colonnes de X. Des conditions additionnelles sont requises afin de spcifier T pour que les

vecteurs de T soient orthogonaux, telle la cration dune combinaison linaire des colonnes de X

et Y en multipliant ces dernires par les poids w et c respectivement de telle sorte que leur

covariance soit maximale (Geladi and Kowalski, 1986, Rosipal and Krmer, 2006) :

maximalesoitque tel

1,1,,

ut

ttwwYcuXwt

T

TT (I.22)

t, u sont les vecteurs scores de X et Y respectivement. w et c sont les coefficients de rgression

de X et Y sur u, t respectivement (vecteurs poids de X et Y). Quand les premiers vecteurs latents

(t et u) sont trouvs, ils sont soustraits de X et Y et la procdure est ritre jusqu' ce que X

devienne une matrice nulle.

tYttcetuXuuw TTTT 11 )()( (I.23)

Avant de commencer le processus itratif, le vecteur u est initialis dune faon alatoire par le

choix dune colonne de Y (celle avec la plus grande variance).

27

Ycuctt

tYcXwtw

uu

uXw

T

T

T

T

88 ,1,,,1, (I.24)

On rpte ces tapes jusqu' la convergence. La PLS est une mthode itrative, qui dtermine

chaque itration les vecteurs poids w, c ou les vecteurs scores t, u et les chargements p sont

calculs, ainsi X et Y seront ajusts par ces rsultats :

YttYquYY

XttXptXXTT

TT

.

. (I.25)

O p et q sont les coefficients de rgression de X et Y sur t, u respectivement

uYuuqettXttp TTTT 11 )()( (I.26)

Aprs chaque itration les vecteurs w, t, p et q sont enregistrs dans les matrices W, T, P, et Q

respectivement. On peut voir w comme le vecteur propre droite de la matrice YXS T , et le

problme devient :

Xwt

wXwYYX TT

, (I.27)

Dans PLS rgression le but est de prdire Y en utilisant X et leur structure commune :

XY (I.28)

Daprs (Rosipal and Krmer, 2006), la structure commune est donne par la relation suivante :

TT CWPW 1)( (I.29)

ce qui donne :

YTUXXTUX TTTT 1)( (I.30)

PLS noyau : (KPLS) est une extension non linaire du PLS linaire. Lutilisation de fonction

noyau (Kernel) permet de transformer (mapper) les donnes complexes non linaires de lentre

dans un espace de caractristiques de plus grande dimension dans lequel la modlisation linaire

peut se faire facilement (Rosipal and Trejo, 2002). Cette notion de noyau va tre dtaille par la

suite dans la thorie des SVMs. La fonction noyau est donne comme suit :

jijix xxxxK ,, (I.31)

Avant de commencer le processus itratif, le vecteur u est initialis dune faon alatoire :

1)5)4)31)2)1 88 uYcutYctuKut TxT (I.32)

En utilisant lquation (I.27) en multipliant les deux termes par X on obtient :

28

tYYu

ttYYXX

T

TT

, (I.33)

Considrons $$yK la matrice noyau du Gram (Kernel Gram matrix) de la sortie Y et $ la

transformation de lespace de sortie de Y vers lespace de caractristique, do :

tKu

ttKK

y

yx

, (I.34)

Pour centrer les donnes transformes dans lespace des caractristiques, cela revient :

)111

()111

(

)111

()111

(

T

nnny

T

nnny

T

nnnx

T

nnnx

nIK

nIK

nIK

nIK

9

9 (I.35)

O nI est la matrice identit de taille n, et n1 est le vecteur unit de taille n. Aprs le calcul des

nouveaux scores t et u, on soustrait des matrices xK et yK leurs approxims calculs partir de t

et u :

YttYY

ttIKttIK

T

T

nx

T

nx

9 )()( (I.36)

Et donc on obtient :

YTTYTUKTUKY

YTUKTU

TT

x

T

x

T

x

TT

1

1

)(

)(

(I.37)

I.2.3. Etapes de mise en uvre des mthodes bases sur les donnes

Malgr le fait quon sintresse principalement lutilisation des mthodes bases sur les

donnes pour le diagnostic de dfaut, il est important de noter que ces mthodes peuvent

galement tre utilises pour la modlisation, donc avec un objectif diffrent

Dans lobjectif de diagnostic, les mthodes statistiques permettent de relier les entres et

sorties du systme au type de situation (dfectueuse ou normale pour diffrents dfauts).

Dans lobjectif de modlisation (rgression), on cherche par ces mthodes trouver une

relation empirique entre les entres et les sorties.

Lapplication des mthodes bases sur les donnes pour le diagnostic de dfaut est ralise en

plusieurs tapes : lacquisition et prtraitement des donnes, lextraction des caractristiques

29

importantes, la modlisation (soit entre-sortie soit donnes-type de dfaut) et la validation du

modle. Selon lobjectif vis (modlisation ou diagnostic), ces tapes sont adapter.

I.2.3.1. Acquisition des donnes

Cette tape concerne laccueil (collection) et la prparation (prtraitement) des donnes. Ces

donnes peuvent tre chantillonnes dans le domaine temporel ou frquentiel avec un intervalle

dchantillonnage adapt la dynamique du procd. Des donnes riches et reprsentatives des

diffrentes situations sont ncessaires pour lapprentissage de la dynamique du procd.

On distinguera deux approches de collections des donnes :

pour la modlisation (entres-sorties), la rponse transitoire est ncessaire. Dans ce cas,

il est intressant dexciter le procd par une entre de spectre convenable (par exemple

signal pseudo alatoire) afin de capter le maximum dinformation. La rponse transitoire

dun systme (la sortie face une entre transitoire, tel un chelon ou une impulsion) est

souvent utilise pour la modlisation. Elle permet de comprendre le comportement

dynamique du systme, tel que le retard et les chelles de temps.

pour le diagnostic (relation mesures-type de dfaut), des donnes dans les situations

normale et dfectueuse sont ncessaires.

Supposons X une matrice de donnes (contenant les entres U et les sorties mesures Y) de taille

mn constitue de n rcurrences de mesures (observations, ou encore chantillons) et m

variables caractristiques )( jX (facteurs ou encore proprits) dans les colonnes de la matrice:

mjnmn

m

XXX

xx

xx

YUX ,,,,, 1

1

111

.

.

.

/

0

111

2

3

Les donnes acquises sont gnralement spares en deux groupes : donnes dapprentissage et

donnes de test. Les donnes dapprentissage sont utilises pour le dveloppement du modle

(slection des caractristiques et dveloppement du modle). Les donnes de test sont utilises

pour la validation (valuation ou jugement) du modle et des caractristiques choisies.

30

I.2.3.2. Prtraitement des donnes

Un prtraitement des donnes est ncessaire pour rduire le bruit, la suppression des valeurs

aberrantes, le traitement des valeurs manquantes et la normalisation des donnes.

Normalisation des donnes

La normalisation est trs utile lorsque le systme a plusieurs variables dont les amplitudes et

variances varient dans des plages diffrentes. Elle consiste mettre lchelle la matrice de

donnes X en rendant les variables de la nouvelle matrice XN comparables (la mme plage de

variation). Parmi les mthodes de normalisation de donnes, on peut citer :

1. La mthode min/max : met les valeurs de chaque colonne de X selon le maximum et le

minimum de cette colonne, de telle sorte avoir les valeurs de la matrice normalis XN

dans lintervalle [bas-haut] :

bas)(minimum)(maximum

)(minimumbashaut

XX

XXX N

O )(minimum X et )(maximum X remplace respectivement chaque colonne de X par son

minimum et maximum. Ce type de normalisation avec haut=1 et bas=0 est utilis dans cette

thse au chapitre II.

2. La mthode Z-scores : permet de ramener la moyenne de chaque variable de X zro et sa

variance lunit par lapplication de la formule suivante : )(typecart

)( moyenne

X

XXX N

3. La mthode de mise l'chelle dcimale decimal scaling

4. La mthode de fentre coulissante ou glissante.

Manipulation des donnes manquantes

Dans le monde rel, les donnes ne sont pas toujours propres et compltes. Souvent elles sont

censures et corrompues. Plusieurs techniques existent pour traiter les donnes manquantes, mais

la mthode la plus simple et la plus utilise consiste dterminer la ligne de la matrice o des

donnes sont corrompues puis la supprimer. Malgr sa simplicit, cette mthode rduit la taille

de la matrice de donnes. Cela conduit une perte de puissance (informations) du rsultat. En

plus, il y a des cas o la ligne corrompue contient des donnes importantes quon ne peut pas

supprimer, ou des cas o la matrice de donnes a beaucoup de valeurs manquantes et donc la

suppression de toutes ces lignes mne une matrice avec peu de donnes. Dans ce cas, on a

recours la mthode de substitution qui remplace les donnes manquantes par une

31

approximation raisonnable en supposant que ces donnes sont faciles modliser. Parmi les

diagnostic de defauts par les machines a vecteurs … · table des matières introduction...

Documents