diagnostic de defauts par les machines a vecteurs … · table des matières introduction...

271
HAL Id: tel-00985437 https://tel.archives-ouvertes.fr/tel-00985437 Submitted on 29 Apr 2014 HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. Diagnostic de défauts par les Machines à Vecteurs Supports : application à différents systèmes mutivariables nonlinéaires Nassim Laouti To cite this version: Nassim Laouti. Diagnostic de défauts par les Machines à Vecteurs Supports: application à différents systèmes mutivariables nonlinéaires. Autre. Université Claude Bernard - Lyon I, 2012. Français. <NNT : 2012LYO10161>. <tel-00985437>

Upload: lamthu

Post on 12-Sep-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

  • HAL Id: tel-00985437https://tel.archives-ouvertes.fr/tel-00985437

    Submitted on 29 Apr 2014

    HAL is a multi-disciplinary open accessarchive for the deposit and dissemination of sci-entific research documents, whether they are pub-lished or not. The documents may come fromteaching and research institutions in France orabroad, or from public or private research centers.

    Larchive ouverte pluridisciplinaire HAL, estdestine au dpt et la diffusion de documentsscientifiques de niveau recherche, publis ou non,manant des tablissements denseignement et derecherche franais ou trangers, des laboratoirespublics ou privs.

    Diagnostic de dfauts par les Machines VecteursSupports : application diffrents systmes

    mutivariables nonlinairesNassim Laouti

    To cite this version:Nassim Laouti. Diagnostic de dfauts par les Machines Vecteurs Supports : application diffrentssystmes mutivariables nonlinaires. Autre. Universit Claude Bernard - Lyon I, 2012. Franais..

    https://tel.archives-ouvertes.fr/tel-00985437https://hal.archives-ouvertes.fr

  • N dordre: 161-2012 Anne 2012

    THSE DE L'UNIVERSIT DE LYON Dlivre par

    L'UNIVERSIT CLAUDE BERNARD LYON 1

    Prsente pour obtenir le grade de docteur en automatique

    COLE DOCTORALE EEA DE LYON (arrt du 7 aot 2006)

    Par

    M. Nassim LAOUTI

    Diagnostic de dfauts par les Machines Vecteurs Supports : application diffrents systmes multivariables

    non linaires

    Soutenue le 21 septembre 2012, devant le jury compos de

    Dr. Mazen ALAMIR GIPSA-Lab, Grenoble Rapporteur Professeur Christophe AUBRUN CRAN, Universit de Lorraine Rapporteur Professeur Michel KINNAERT Universit Libre de Bruxelles Examinateur Dr. Sami OTHMAN LAGEP, Universit de Lyon Co-encadrant Dr. Isabelle QUEINNEC LAAS, Universit de Toulouse Prsident Dr. Nida SHEIBAT-OTHMAN LAGEP, Universit de Lyon Directeur de thse

  • Ddicaces

    Je ddie cette thse mes trs chers parents qui je dois tout ce que je suis, et qui m'ont

    donn un vritable modle de travail, et qui m'ont appris le respect de lautre, la gentillesse

    et la persvrance. J'espre qu'ils trouveront dans ce travail toute ma reconnaissance et tout

    mon amour.

    A mes chers frres et surs et qui ont toujours t l pour moi: Leila, Mehdi, Sihem,

    Mohamed, Hafid, Rayane Yasmine

    Je ddie cette thse au directeur de lcole doctorale EEA de Lyon monsieur Grard Scorletti.

    A tous mes amis : Kamel, Kamel, Reda, Bassem, Sidali, Belkacem, Amine, Aziz, Sofiane et

    tous les autres qui mont encourag finir ce travail

    Je ddie cette thse

    Nassim

  • Remerciements

    Je remercie Dieu de mavoir donn la volont et le courage qui mont permis de raliser ce

    travail, veuille-t-il me guider dans le droit chemin.

    Je remercie Madame Nida Othman et Monsieur Sami Othman, pour leurs gentillesses

    ainsi que leurs encouragements rguliers face la difficult.

    Je remercie ma sur Leila pour son aide depuis toujours

    Je remercie aussi les membres du jury pour avoir accept de juger ce travail. Je suis trs

    honor de prsenter mes travaux de thse devant un tel jury.

    Ce travail a t ralis au sein du Laboratoire dAutomatique et de Gnie des Procds de

    luniversit Claude Bernard Lyon1 (LAGEP-UMR 5007). Mes remerciements s'adressent

    tous les membres du laboratoire LAGEP que ce soit les doctorants, les enseignants,

    ingnieurs ou les chercheurs pour mavoir accueilli parmi eux.

  • Table des matires

    Introduction gnrale ................................................................................................................... 1

    CHAPITRE I : Diagnostic de dfauts et thorie des Machines Vecteurs de Supports ....... 5

    I.1. Gnralits ............................................................................................................................ 7

    I.1.1. Terminologie en matire de diagnostic.......................................................................... 7

    I.1.2. Le principe de dtection de dfaut ................................................................................. 9

    I.1.3. FDI en boucle ouverte et en boucle ferme ................................................................. 10

    I.1.4. Domaines concerns par la FDI ................................................................................... 11

    I.1.5. Performances des techniques FDI ............................................................................... 12

    I.2. Les mthodes de diagnostic ................................................................................................ 12

    I.2.1. Mthodes base de modle explicite .......................................................................... 13

    I.2.2. Mthodes bases sur les donnes ................................................................................. 18

    I.2.3. Etapes de mise en uvre des mthodes bases sur les donnes .................................. 28

    I.3. Les Machines Vecteurs de Supports ................................................................................ 39

    I.3.1 Thorie de l'apprentissage statistique ........................................................................... 40

    I.3.2. Les machines Vecteurs de Support pour la classification (SVM) ............................ 41

    I.3.3. Les machines Vecteurs de supports pour la rgression (SVR) ................................. 56

    CHAPITRE II : Systme de traitement des eaux uses ........................................................... 67

    II.1. Description du systme .................................................................................................... 69

    II.1.1. Le procd de traitement des eaux uses par boues actives ..................................... 70

    II.1.2. La modlisation .......................................................................................................... 71

    II.1.3. Le modle BSM1........................................................................................................ 73

  • II.1.4. Variables composites/mesures ................................................................................... 84

    II.2. Commande des systmes de traitement des eaux uses ................................................... 86

    II.3. Revue des mthodes de diagnostic du procd WWTP ................................................... 87

    II.3.1. ACP (PCA en anglais) et dautres mthodes statistiques ........................................... 88

    II.3.2. La Projection aux Structures Latentes ( PLS ) ........................................................... 90

    II.3.3. SVM ........................................................................................................................... 91

    II.4. Stratgie SVR/SVM propose pour le diagnostic du procd WWTP ............................. 92

    II.4.1. Schma SVR/SVM propos ....................................................................................... 92

    II.4.2. Rcapitulatif des variables dtat/ dentre/ et de sortie ............................................. 94

    II.4.3. Les variables superviser ........................................................................................... 95

    II.5. Implmentation de SVR pour la modlisation .................................................................. 97

    II.5.1. Gnration de donnes pour lapprentissage et la validation ..................................... 97

    II.5.2. Prtraitement des donnes (normalisation, filtrage) ................................................... 99

    II.5.3. Analyse de corrlation/Information mutuelle ........................................................... 100

    II.5.4. Rsultats de la modlisation SVR ............................................................................ 103

    II.6. Implmentation de SVM pour le diagnostic de dfauts ................................................. 116

    II.7. Conclusion ...................................................................................................................... 129

    CHAPITRE III : Diagnostic de dfauts dans les oliennes ................................................... 131

    III.1. Introduction ................................................................................................................... 133

    III.1.1. Revue des mthodes de diagnostic sur les oliennes ............................................. 135

    III.1.2. Revue sur la commande des oliennes ................................................................... 138

    III.2. Description du systme olien ...................................................................................... 139

    III.2.1. Modle des pales et pitch ........................................................................................ 141

  • III.2.2. Modle convertisseur et gnratrice ....................................................................... 141

    III.2.3. Modle du systme dentranement ........................................................................ 142

    III.2.4. Le systme de contrle ............................................................................................ 143

    III.2.5. Dfauts considrs dans ce modle olien .............................................................. 144

    III.3. Diagnostic de dfauts dans une olienne ...................................................................... 146

    III.3.1. Les vecteurs des caractristiques pour chaque dfaut ............................................ 148

    III.3.2. Rsultats de lapproche de diagnostic .................................................................... 151

    III.4. Comparaison entre diffrentes mthodes de diagnostic ................................................ 157

    III.5. Combinaison entre lapproche base sur SVM et un observateur ................................ 159

    III.5.1. Conception de lobservateur de type Kalman ......................................................... 161

    III.5.2. Lapproche base SVM pour la dtection/isolation de dfaut actionneur sur le

    systme pitch ....................................................................................................................... 162

    III.6. Conclusion .................................................................................................................... 166

    CHAPITRE IV : Racteur chimique parfaitement agit ...................................................... 169

    IV.1. Revue bibliographique ................................................................................................... 171

    IV.2. Prsentation du systme ................................................................................................. 174

    IV.2.1. Le procd............................................................................................................... 174

    IV.2.2. Le modle ............................................................................................................... 175

    IV.3. Implmentation du diagnostic de dfauts ...................................................................... 176

    IV.3.1 Implmentation des SVMs....................................................................................... 176

    IV.3.2 Implmentation de lobservateur de grand gain ...................................................... 178

    IV.3.3. Rsultats et discussion ............................................................................................ 180

    IV.4. Implmentation de SVR................................................................................................. 189

    IV.4.1. Identification d'une drive de temprature par rgression SVM ............................ 190

  • IV.4.2. Identification des U par rgression SVM ............................................................... 193

    IV.5. Conclusions .................................................................................................................... 196

    Conclusion gnrale .................................................................................................................. 197

    Notations .................................................................................................................................... 201

    Annexes ...................................................................................................................................... 209

    Annexe A ................................................................................................................................ 211

    Annexe B................................................................................................................................. 219

    Annexe C................................................................................................................................. 223

    Bibliographie ............................................................................................................................. 227

  • Table des Figures

    Figure I.1 Architecture du fonctionnement dun systme avec une commande tolrante aux

    dfauts ............................................................................................................................................. 9

    Figure I.2 Schma classique de dtection des dfauts ............................................................... 10

    Figure I.3 Schma de classification des mthodes de diagnostic de dfauts bases sur le modle

    ....................................................................................................................................................... 13

    Figure I.4 Mthodes de diagnostic diriges par les donnes..................................................... 19

    Figure I.5 Taux de reprsentativit des composantes principales dans le modle .................... 21

    Figure I.6 Lhyperplan sparateur pour des donnes bidimensionnelles .................................. 41

    Figure I.7 Sparation linaire .................................................................................................... 42

    Figure I.8 Sparation linaire avec des erreurs ......................................................................... 45

    Figure I.9 Marge souple ............................................................................................................ 46

    Figure I.10 Exemple de projection .............................................................................................. 48

    Figure I.11 Vecteurs support et surface de dcision calcule par la mthode noyau ............... 49

    Figure I.12 La fonction de perte insensible dans la rgression SVR linaire ........................ 58

    Figure I.13 Structure de type Hammerstein ................................................................................ 61

    Figure I.14 Structure de type Wiener .......................................................................................... 62

    Figure II.1 Prsentation gnrale du procd BSM1..74

    Figure II.2 La matire organique dans le modle BSM1 ........................................................... 79

    Figure II.3 Les composs azots dans le modle BSM1 ............................................................ 79

    Figure II.4 Stratgie SVR suivi par SVM pour le diagnostic de dfauts ................................... 93

    Figure II.5 Concentration de nitrites/nitrates dans la 2me cuve utilise pour lapprentissage et le

    test du modle SVR....................................................................................................................... 98

    Figure II.6 Concentration doxygne dissous dans la 5me cuve utilise pour lapprentissage et

    le test du modle SVR ................................................................................................................... 98

    Figure II.7 Bote moustache des variables du procd WWTP non normes ......................... 99

    Figure II.8 Bote moustache des variables du procd WWTP normalises avec la mthode

    min/max ...................................................................................................................................... 100

    Figure II.9 Analyse des relations entre variables avec linformation mutuelle ....................... 102

    Figure II.10 Analyse des relations entre variables avec linformation mutuelle (pour CODe et

    TSSe) ........................................................................................................................................... 102

  • Figure II.11 Evolution temporelle des variables dentre/sortie des matires en suspension ... 104

    Figure II.12 Densit de probabilit Qin ..................................................................................... 105

    Figure II.13 Concentration SNH,in et sa densit de probabilit .................................................. 106

    Figure II.14 L'volution de la variable So5 par rapport Kla5 ................................................... 106

    Figure II.15 Lvolution de la variable Sno2 par rapport Qa ................................................... 107

    Figure II.16 Trac de Sno2 et son estime .................................................................................. 109

    Figure II.17 Zoom sur le trac de Sno2 et son estim................................................................. 110

    Figure II.18 Trac de TSSe et son estim .................................................................................. 110

    Figure II.19 Zoom sur le trac de TSSe et son estim ............................................................... 111

    Figure II.20 Trac de CODe et son estim ................................................................................ 111

    Figure II.21 Trac de So5 et son estim ..................................................................................... 112

    Figure II.22 Rsidu So5.............................................................................................................. 112

    Figure II.23 Rsidu Sno2 ............................................................................................................ 113

    Figure II.24 Rsidu filtre de Sno2 ............................................................................................. 113

    Figure II.25 Densit de probabilit Sno2 .................................................................................... 114

    Figure II.26 Autocorrlation du rsidu TSSe ............................................................................ 114

    Figure II.27 Rsidu sur TSSe .................................................................................................... 115

    Figure II.28 Densit de probabilit TSSe .................................................................................. 115

    Figure II.29 Rsidu CODe ......................................................................................................... 115

    Figure II.30 volution du rsidu Kla5 ........................................................................................ 119

    Figure II.31 Zoom sur le rsidu Kla5 ......................................................................................... 119

    Figure II.32 volution du rsidu Qa .......................................................................................... 120

    Figure II.33 volution du rsidu So5 ......................................................................................... 120

    Figure II.34 Trac de la mesure de loxygne dissous (So5) et son rsidu ................................ 121

    Figure II.35 Zoom sur de la mesure de So5 et son rsidu .......................................................... 121

    Figure II.36 volution du rsidu Sno2 ........................................................................................ 122

    Figure II.37 La mesure de Sno2 et son rsidu............................................................................. 122

    Figure II.38 Mesure TSSe et son rsidu .................................................................................... 123

    Figure II.39 Rsultat de dcision sur le dfaut Qa .................................................................... 124

    Figure II.40 Zoom sur le rsultat du dfaut Qa ......................................................................... 125

    Figure II.41 Rsultat de dcision sur le dfaut Kla5 .................................................................. 126

    Figure II.42 Zoom de dcision sur le dfaut Kla5 ...................................................................... 126

    Figure II.43 Rsultat de dcision sur le dfaut Sno2 .................................................................. 127

    Figure II.44 Zoom sur la dcision du dfaut Sno2 ...................................................................... 127

  • Figure II.45 Rsultat de la dcision sur dfaut TSSe ................................................................ 128

    Figure II.46 Rsultat de la dcision sur dfaut So5 .................................................................... 129

    Figure III.1 Eoliennes offshore.133

    Figure III.2 Destruction dune olienne par prise de feu ......................................................... 134

    Figure III.3 Coupe transversale dune nacelle dolienne ....................................................... 140

    Figure III.4 Une vue d'ensemble du modle de rfrence de lolienne .................................. 140

    Figure III.5 Puissance de lolienne en fonction de la vitesse du vent .................................... 143

    Figure III.6 Squence vitesse du vent ...................................................................................... 144

    Figure III.7 Schma de diagnostic de dfaut pour les oliennes .............................................. 146

    Figure III.8 Stratgie de diagnostic de dfaut classique avec SVM ........................................ 147

    Figure III.9 Schma de diagnostic de dfauts propos ............................................................ 147

    Figure III.10 Stratgie propose de diagnostic de dfaut base sur SVM ................................. 147

    Figure III.11 Vitesse du vent mesure ...................................................................................... 152

    Figure III.12 Puissance lectrique gnre ............................................................................... 152

    Figure III.13 Dtection et isolation du dfaut 2 de type gain (1b) sur le capteur de la position

    pitch 2,2 m

    ................................................................................................................................... 153

    Figure III.14 Dtection et isolation du dfaut 4 valeur fixe (type 2a) sur la vitesse du rotor ... 154

    Figure III.15 Dtection et isolation du dfaut 5 de type gain (2b) sur le capteur de la vitesse

    rotationnelle du rotor 2,mr

    w ......................................................................................................... 155

    Figure III.16 Dtection et isolation du dfaut 5 de type gain (3b) sur le capteur de la vitesse

    rotationnelle de la gnratrice1,mg

    w ........................................................................................... 156

    Figure III.17 Dtection et isolation du dfaut 8 de type offset (4a) sur le convertisseur .......... 156

    Figure III.18 Dtection et isolation du dfaut 9 (6) sur le systme dentrainement ................. 157

    Figure III.19 Schma de combinaison SVM et observateur ..................................................... 161

    Figure III.20 Dtection et isolation du dfaut 6 (5a) sur lactionneur2 et estimation du coefficient

    damortissement e2 et de la pulsation naturelle 2nw avec lobservateur .................................... 164

    Figure III.21 Dtection et isolation du dfaut 7 (5b) sur lactionneur 3 et estimation du

    coefficient damortissement e3 et de la pulsation naturelle 3nw avec lobservateur .................. 164

    Figure IV.1 Schma simplifi du racteur parfaitement agit du laboratoire (Tr1, Tr2, Tj1, Tj2

    et THC sont des sondes de temprature P1, P2, P3 et P4 sont des pompes)...174

    Figure IV.2 Schma de diagnostic de dfauts par SVM en ligne ............................................ 180

    Figure IV.3 Drive dans Tj,in 55min ...................................................................................... 181

  • Figure IV.4 Classification des dfauts de THC. Effet de (variance du noyau gaussien) sur les

    hyperplans optimaux (avec C=100) ............................................................................................ 182

    Figure IV.5 Cas dtude par simulation (avec C=100) et diffrentes valeurs de : Occurrence de

    dfaut dans THC (objective de commande Trd=70C) ................................................................. 183

    Figure IV.6 Classification des defaults de THC. Effet de C (paramtre de rgularisation) sur les

    hyperplans optimaux (avec =10) .............................................................................................. 184

    Figure IV.7 Dfaut dans le systme de chauffe/refroidissement (HC : un actionneur) en

    changeant les paramtres du PID afin dcarter THC de Tjd (Tj

    d=70C) ..................................... 185

    Figure IV.8 Drive dans Tr1 33 min dans le racteur du laboratoire ...................................... 186

    Figure IV.9 Erreur de calibration de -5C est considre dans la sonde Tr2 dans le racteur pilote

    de 250 L ...................................................................................................................................... 187

    Figure IV.10 Une valuation exprimentale de la mthode SVM et de lobservateur dans un

    racteur pilote de 250 L .............................................................................................................. 188

    Figure IV.11 Evolution des tempratures dans le racteur pilote sans dfaut .......................... 188

    Figure IV.12 Schma de SVR pour lestimation de U et lidentification de niveaux de dfauts

    pendant la priode la chauffe du racteur ................................................................................... 189

    Figure IV.13 Validation exprimentale de lidentification dune drive dans la sonde de

    temprature Tr1 avec diffrentes valeurs de (=0.01, C=100, objectif de commande Tjd=70C)

    ..................................................................................................................................................... 191

    Figure IV.14 Identification de la drive dans la sonde Tr1 avec diffrentes valeurs de (=60,

    C=100, objectif de commande Trd=60C) ................................................................................... 192

    Figure IV.15 Identification de la drive du capteur Tr1 avec diffrentes valeurs de C (=0.01,

    =60) ........................................................................................................................................... 193

    Figure IV.16 Estimation du coefficient dchange thermique U pendant la chauffe du racteur

    (simulation avec diffrentes valeurs de U, paramtre de lobservateur =0.04) ........................ 195

    Figure IV.17 Estimation exprimentale du coefficient dchange thermique U pendant la chauffe

    du racteur ................................................................................................................................... 195

  • Liste des tableaux

    Tableau II.1 Les concentrations intervenant dans le modle BSM1 .......................................... 75

    Tableau II.2 Paramtres du modle BSM1 ................................................................................ 77

    Tableau II.3 Paramtres de dcantation ..................................................................................... 83

    Tableau II.4 Corrlation des variables avec CODeff ................................................................ 101

    Tableau II.5 Performances des modles SVR .......................................................................... 109

    Tableau II.6 Les diffrents dfauts considrs ......................................................................... 109

    Tableau II.7 Rsultats de dtection de dfauts ......................................................................... 117

    Tableau III.1 Paramtres du modle de rfrence de lolienne ............................................... 143

    Tableau III.2 Dfauts considrs dans le modle olien de rfrence ...................................... 145

    Tableau III.3 Rsultats de diagnostic du dfaut 1 ..................................................................... 158

    Tableau III.4 Rsultats de diagnostic du dfaut 2 ..................................................................... 159

    Tableau III.5 Rsultats de dtection des dfauts ....................................................................... 166

    Tableau IV.1 Vecteurs dentrs SVM (xi), (i est linstant de temps) ........................................ 177

    Tableau IV.2 Correspondance entre rsidu de la temprature de la double enveloppe et du bain

    thermost (R=rsidu)................................................................................................................... 178

  • 1

    Introduction gnrale Tout ce que je sais, :c'est que je ne sais rien Socrate

    La socit actuelle est trs oriente vers la technologie et dpend ainsi de la disponibilit, la

    scurit et la fiabilit de technologies de plus en plus complexes. Cependant, la matrise parfaite

    de ces systmes reste un sujet important et ouvert. Afin de satisfaire le bon fonctionnement, le

    diagnostic de dfaut Fault detection and isolation FDI apparat ainsi comme une ncessit

    qui consiste identifier les causes du dfaut partir des symptmes ou signaux perus afin

    d'viter toute propagation de ce dfaut. Ce dernier peut occasionner notamment :

    1. Un arrt de fonctionnement du systme,

    2. Des dgts matriels,

    3. La pollution de lenvironnement,

    4. Des dangers pour l'utilisateur.

    Le diagnostic de dfauts est, en fait, lensemble des actions mises en uvre pour dtecter,

    localiser et identifier tout dysfonctionnement sur un systme. Ceci peut se faire partir des

    informations pouvant tre rcupres du systme, telles que les mesures fournies par les

    capteurs, les sorties calcules par les contrleurs, et les connaissances sur la structure ou le

    modle du systme. Parmi les intrts du diagnostic de dfauts figure l'optimisation des

    oprations de maintenance, la minimisation de larrt du service, lassurance dune bonne qualit

    du produit, ainsi que la reconfiguration de la commande.

    La conception d'un systme de diagnostic performant n'est, cependant, pas une tche facile

    raliser, puisque la majorit des systmes rels sont de nature non-linaire faisant intervenir un

    grand nombre de variables et travaillant dans un environnement entach de bruit, et affect par

    diffrents types de perturbations. Depuis des annes, un grand nombre de chercheurs se sont

    intresss la rsolution du problme de diagnostic des dfauts. On trouve ainsi plusieurs tudes

    dans la littrature qui proposent diffrentes techniques de diagnostic de dfauts. Dune faon

    gnrale, on peut dcomposer les mthodes de diagnostic en deux grandes familles : des

    mthodes bases sur le modle, et des mthodes bases sur les donnes rcupres partir du

    systme. Cependant, la complexit des systmes industriels rend difficile, voire impossible,

    lobtention dun modle fondamental exact et prcis reprsentant le systme dans toutes les

    conditions de fonctionnement afin de lutiliser pour raliser un diagnostic de dfaut par modle.

    Dun autre ct, la technologie moderne nous offre un grand bnfice puisquelle fournit un

    grand nombre dinformations (donnes) mais dont lanalyse nest pas vidente, ce qui explique

  • 2

    le recours des mthodes de diagnostic de dfauts bases sur les donnes. En plus la nature des

    signatures(ou symptmes) de dfauts qui sont des grandeurs alatoires rend la dtection dune

    diffrence ventuelle entre la signature nominale et celle mesure ne peut pas se faire facilement

    avec les mthodes dterministes.

    Pour ces raisons, lintrt des industriels pour les mthodes de diagnostic de dfauts diriges par

    des donnes notamment celle de lintelligence artificielle (rseaux de neurones, systmes

    experts,..) prend de plus en plus dampleur. Lintelligence artificielle a pour but dlaborer des

    systmes ayant des capacits intellectuelles comparables lhomme capable de prendre des

    dcisions dune manire automatique dans lenvironnement peru. Dans ce vaste domaine, on

    trouve un axe de recherche assez important qui est lapprentissage automatique Machine

    Learning (Ao et al., 2010) qui permet de bien comprendre un phnomne ou un systme

    illustr par un nombre limit dexemples de donnes afin de construire des modles pouvant tre

    appliqus des nouvelles observations (exemples). Dans cette thse, la mthode dintelligence

    artificielle stochastique Machines Vecteurs Supports (ou Sparateur Vaste Marge, Support

    Vector Machines, SVM) est utilise pour la conception des mthodes de diagnostic avances.

    La mthode SVM est issue de la thorie de lapprentissage statistique (Vapnik, 1998) introduite

    par Vapnik dans les annes 90 (Boser et al., 1992). Elle a t conue au dpart pour trouver un

    discriminateur optimal entre deux classes de donnes, et a t ensuite tendue pour le cas de la

    rgression. La capacit de gnralisation, et l'aspect stochastique ont favoris l'utilisation de cette

    mthode d'apprentissage statistique pour le diagnostic de dfauts. Dans ce cas, le diagnostic de

    dfaut est assimil un problme de classification (en deux classes : normale et anormale). Dans

    cette mthode, le choix et lextraction des caractristiques reprsentatives de chaque dfaut

    reprsentent l'tape la plus importante afin dtre sensible aux symptmes du dfaut et dobtenir

    ainsi un systme de diagnostic ractif et prcis.

    Ce travail contribue dvelopper une nouvelle approche originale de diagnostic de dfauts assez

    performante en termes de prcision, temps de dtection et permettant un pourcentage quasi nul

    des fausses alarmes. La mthode SVM est utilise en premier choix pour la dtection et

    lisolation de dfaut. Dans certains cas, la modlisation par SVM pour la rgression SVR est

    ralise en parallle afin dajouter des estimations au vecteur de mesure. Dans dautres cas, une

    combinaison avec des mthodes bases sur le modle (principalement lobservateur grand

    gain) a t ncessaire afin de garantir une bonne isolation de dfaut. Cette stratgie est applique

    aux systmes rels lchelle de laboratoire/pilote dans le cas dun racteur chimique, et en

    simulation dans le cas de procd de traitement des eaux uses et du systme olien.

  • 3

    Ce mmoire est organis comme suit :

    Le premier chapitre est ddi la revue des mthodes de diagnostic et leurs applications suivie

    dune prsentation de la thorie des mthodes utilises dans cette thse, savoir la mthode

    SVM, SVR, et quelques observateurs non linaires.

    Le deuxime chapitre concerne la premire application de cette thse qui est le systme de

    traitement des eaux uses Waste Water Traitement Process WWTP . Ce chapitre prsente

    tout dabord le procd et son modle utilis pour la simulation. Ensuite, la mthode SVR est

    utilise pour la modlisation (entre/sortie) de certaines variables cls. La mthode SVM est

    galement utilise pour le diagnostic de dfaut dans ce systme en utilisant les variables estimes

    par SVR en plus des variables mesurs en ligne. Enfin, quelques rsultats de simulation sont

    discuts.

    Le troisime chapitre est consacr au systme olien Wind Turbine en appliquant la

    mthode SVM et un observateur de type Kalman pour le diagnostic de dfaut. On utilisera un

    benchmark disponible sur internet pour cette application. La stratgie propose dans ce chapitre

    par lauteur de cette thse (Laouti et al., 2011a) a dmontr son efficacit en se classant premire

    par rapport 12 autres mthodes lors dune comptition internationale, organise par la socit

    kk-electronic, sur le diagnostic de dfaut dans les oliennes .

    Le quatrime chapitre prsente lapplication de la mthode SVM (classification et rgression)

    aux racteurs chimiques parfaitement agits Continuous Stirred Tank Reactor, CSTR .

    Dans chaque application, une revue des mthodes de diagnostic employes dans le domaine en

    question est prsente ainsi que le systme et son modle. Par la suite la manire choisie pour

    appliquer les SVM est dfinie et les rsultats de simulation sont discuts.

    Le mmoire se termine par une conclusion gnrale rsumant les contributions de la thse et

    prsentant les perspectives de recherche que je souhaite poursuivre dans lavenir ainsi que

    quelques rflexions sur ces prochaines voies de recherches.

    Parmi les contributions de cette thse on cite :

    1. Une revue de la mthode SVM et ses applications pour le diagnostic de dfauts.

    2. La combinaison entre une mthode de diagnostic base sur les donnes SVM avec une

    mthode base sur le modle Observateur afin de tirer profit des avantages de chaque

    mthode.

  • 4

    3. Lapplication de la mthode SVM dans trois procds diffrents : un racteur parfaitement

    agit, un systme olien et un systme de traitement des eaux uses.

    4. Un capteur logiciel bas sur SVM rgression SVR est dvelopp et sa capacit de

    prdiction et de gnralisation face un environnement bruit et assez perturb est tudie.

  • 5

    CHAPITRE I : Diagnostic de dfauts et thorie des Machines Vecteurs de Supports

  • 6

  • 7

    Dans ce chapitre, nous prsentons dune manire simplifie les concepts basiques de diagnostic

    de dfauts, et les fondements thoriques des mthodes utilises dans cette thse telles que les

    Machines Vecteurs Supports SVM, Observateurs, Analyse en Composantes Principales, etc.

    I.1. Gnralits

    La recherche constante dune meilleure comptitivit pousse les entreprises produire des

    machines ayant une grande fiabilit et disponibilit. Cependant, un systme quelle que soit sa

    modernit et sa robustesse, est affect par des dysfonctionnements qui peuvent compromettre son

    bon fonctionnement. Il apparat donc ncessaire didentifier rapidement les changements

    inattendus (dfauts).

    Dans cette premire partie, nous allons d'abord prsenter les principes de diagnostic de dfauts et

    quelques dfinitions de la terminologie dans ce domaine.

    I.1.1. Terminologie en matire de diagnostic

    Partant du fait que le diagnostic de dfaut est rparti sur plusieurs domaines technologiques, un

    comit technique SAFEPROCESS de la Fdration internationale de contrle automatique IFAC

    a essay de proposer une terminologie unifie (Isermann and Ball, 1997). La terminologie

    dfinie par ce comit sera utilise dans ce mmoire :

    Dfaut : cart non autoris d'au moins une proprit caractristique ou variable du systme

    partir du comportement acceptable / habituelle /standard du systme.

    Panne : Linterruption permanente d'une capacit du systme pour effectuer une fonction requise

    dans des conditions de fonctionnement spcifies.

    Dysfonctionnement : Lirrgularit intermittente dans l'accomplissement de la fonction

    souhaite du systme.

    Dtection de dfauts : Dtermination de dfauts prsents dans un systme et l'heure de

    dtection.

    Isolation des dfauts : Dtermination du type, de l'emplacement et du temps de dtection d'un

    dfaut. Cette tape suit ltape de dtection de dfauts.

    Identification de dfauts : Dtermination de la taille et variation dans le temps du

    comportement d'un dfaut. Cette tape suit ltape de lisolation de dfaut.

  • 8

    Diagnostic des dfauts : Dtermination du type, de la taille, de l'emplacement et du temps de

    dtection d'un dfaut. Cette tape suit la dtection de dfaut et inclut lisolation et l'identification

    de dfaut.

    Rsidu : Lindicateur de dfaut, bas sur les carts entre les mesures et un modle bas sur des

    calculs d'quations.

    Symptme : Le changement d'une grandeur observable du comportement normal.

    Surveillance : Cest une tche continue en temps rel dterminant les conditions possibles d'un

    systme physique, tout en reconnaissant et en indiquant des anomalies du comportement.

    Supervision : La surveillance d'un systme physique tout en prenant des actions appropries

    pour maintenir le fonctionnement dans le cas de dfauts.

    Scurit : Aptitude d'un systme ne pas causer de danger pour les personnes, le matriel ou

    pour l'environnement.

    Modle quantitatif : Utilise des relations statiques et dynamiques entre les variables du systme

    et des paramtres afin de dcrire le comportement d'un systme en terme quantitatif

    mathmatique.

    Modle qualitatif : Utilise des relations statiques et dynamiques entre les variables du systme

    et des paramtres pour dcrire le comportement du systme en termes qualitatifs tels que les

    causalits ou les rgles.

    Pour plus de dtails voir (Isermann, 2011, Isermann, 2006).

    En rsum, le diagnostic de dfaut consiste dtecter, isoler et estimer le dfaut. La dtection

    du dfaut dtermine linstant dapparition dun mauvais fonctionnement dans le systme, tandis

    que lisolation du dfaut consiste cerner (identifier) les causes ou les sources de dfaut afin de

    dire s'il s'agit d'un dfaut de type capteur, actionneur ou procd, et lidentification du dfaut

    donne une estimation de certaines caractristiques du dfaut telle que son amplitude.

    Le rle de diagnostic de dfaut est dassurer la scurit et le fonctionnement optimal du systme

    par lindication de tout tat non dsir (ou statu hors contrle) permettant ainsi dviter tout

    dommage ou accident. Gnralement, le diagnostic de dfauts se fait en ligne. Les tches de

    dtection et de localisation sont accomplies paralllement ou bien une tche dclenche l'autre.

  • 9

    Nous pouvons souligner que le terme diagnostic a une origine mdicale, qui signifie trouver

    les causes de la maladie (dfaut) partir des symptmes perus (les signes observables).

    I.1.2. Le principe de dtection de dfaut

    La Figure I.1 montre un schma global du fonctionnement dun systme pouvant tre affect par

    diffrents types de dfauts. Comme cest le cas dans la plupart des systmes industriels, ce

    procd est rgul en boucle ferme avec un contrleur dont lobjectif est de maintenir la sortie

    Y le plus proche possible de la consigne Yref. Des instruments de mesure transmettent les

    donnes acquises englobant les entres et les sorties mesures ainsi que la sortie du contrleur

    vers l'organe de dtection et de diagnostic de dfauts. En plus de ces donnes, le module de

    diagnostic de dfaut utilise un modle (fondamental ou statistique) pour raliser la surveillance

    du systme et informer le module de reconfiguration de la prsence de dfauts.

    Figure I.1 Architecture du fonctionnement dun systme avec une commande tolrante aux

    dfauts

    Le bloc de reconfiguration permet de garder le systme dans ltat dsir par le rglage des

    paramtres du contrleur ou par une adaptation dune nouvelle loi de commande (Blanke et al.,

    2006, Blanke et al., 2003, Prakash et al., 2002). On note quil existe plusieurs mthodes de

    reconfiguration, toutefois elles ne seront pas discutes dans ce mmoire. Le but de la

    reconfiguration est de continuer faire fonctionner le systme tout en maintenant les

    performances/conditions de scurit requises malgr la prsence de dysfonctionnement dans

    l'attente d'une opration de maintenance (Patton, 1997).

    Afin de raliser le diagnostic des dfauts, une premire approche consiste dupliquer les

    composants d'instruments de mesure pour augmenter la fiabilit. Cela nous permet de choisir la

    mesure saine partir des mesures disponibles. Cette approche sappelle la redondance

  • 10

    matrielle. Elle est utilise dans le diagnostic, surtout dans le domaine aronautique, mais elle

    entrane une augmentation des cots et une rduction de lautonomie du systme. La deuxime

    approche, qui est la redondance analytique, est trs intressante la fois sur le plan financier et

    technique puisquelle se base uniquement sur lexploitation de relations existantes entre les

    diffrentes variables mesures ou estimes. Aprs la collection des donnes, on essaie dextraire

    les informations utiles partir de ces donnes, en dautres termes, de convertir ces donnes

    brutes en quelque chose de significatif pour des objectifs bien prcis. Le processus de dtection

    de dfauts proprement dit est donc compos essentiellement de deux phases (Chow et al., 1982) :

    gnration de rsidus suivie par lanalyse de rsidus, comme le montre la Figure I.2

    Figure I.2 Schma classique de dtection des dfauts

    Gnration des rsidus : Cette tape consiste crer un signal calculant la diffrence entre la

    sortie relle et celle estime. Le rsidu est nul (ou ngatif dans certaines mthodes) dans le cas

    du fonctionnement normal, et en cas de dysfonctionnement, il sera proportionnel la gravit du

    dfaut.

    valuation des rsidus : Cette phase permet d'analyser les indicateurs de dfaut gnrs et de

    dfinir un seuil (fixe, adaptatif, ou statistique) qui va dcider de l'instant de changement d'tat de

    fonctionnement du systme. En effet, dans le cas rel, les bruits de mesure, les imprcisions de

    modlisation et les perturbations ne sont pas des grandeurs dterministes mais de nature alatoire

    car ils vont introduire des variations imprvisibles sur le systme. Cette tape est donc capitale

    afin de diminuer les taux de fausse alarme ou de non dtection.

    I.1.3. FDI en boucle ouverte et en boucle ferme

    Un dfaut agit dune manire diffrente sur le systme dpendamment si le fonctionnement (de

    la commande) est en boucle ouverte ou en boucle ferme. Il influence les sorties et/ou les entres

    mesurables et/ou les paramtres internes du systme ou les variables dtats non mesurables.

  • 11

    Lorsquun systme ou procd fonctionne en boucle ouverte et quun dfaut apparat, ce dernier

    va influencer la sortie Y par un cart (offset) Y. Par contre, dans le cas de procd fonctionnant

    en boucle ferme, la sortie risque de ne montrer quune faible dviation qui disparat

    rapidement, surtout si un contrleur de type intgral est utilis pour asservir cette sortie

    (contrleur PI). En revanche, la variable dentre manipule U va montrer un offset permanent

    U. Il est souligner que la sortie est galement affecte par des bruits, perturbations et des

    variations dans U. Cela rend la tche de diagnostic trs difficile.

    On note galement que les dfauts peuvent apparatre de diffrentes faons, dune manire

    brusque (cest le cas dune coupure de phase dans un moteur lectrique), dune faon progressive

    (on parle dune drive lente, cest le cas dencrassement) ou dune faon intermittente qui

    apparat selon les conditions de fonctionnement (temprature, pression, concentration).

    I.1.4. Domaines concerns par la FDI

    La communaut de l'automatique a tabli un cadre thorique bien fond pour le diagnostic de

    dfaut pour les systmes linaires (Nyberg, 1999, Chow et al., 1982) et non linaires (Ding,

    2008). Une revue dtaille des techniques dveloppes pour le diagnostic de dfauts est donne

    dans (Venkatasubramanian V. et al., 2003) et un grand nombre d'applications en ingnierie

    jusqu'en 1996 est fourni dans (Isermann and Ball, 1997) .

    Dans cette littrature, nous pouvons citer les applications suivantes :

    Procds chimiques : (Caccavale et al., 2011, Verron, 2007, Pierri et al., 2008a,

    Chetouani, 2006, Ram Maurya et al., 2004)

    Moteurs, machines et roulements : (Verucchi et al., 2008, Ding, 2008, Isermann,

    2005)

    Eoliennes : (Wei, 2010, Dolan, 2010), Donders, 2002)

    Procd de traitement des eaux uses : (Baggiani and Marsili-Libelli, 2009,

    Wimberger and Verde, 2008, Tharrault, 2008)

    Turbine gaz industrielle : (Simani et al., 2003)

    Systme hydraulique : (Ding, 2008, Hammouri et al., 2002)

    Industrie automobile : (Arnanz et al., 2011,Saludes Rodil et al., 2009, Svard and

    Nyberg, 2010)

    Rseau de distribution lectrique : (Mohamed and Rao, 1995)

    Robot manipulateurs : (Paviglianiti et al., 2010)

  • 12

    Circuit lectronique analogique : (Mohsen and El-Yazeed, 2004)

    Systme de contrle du vol davion : (Hajiyev, 2012)

    On peut trouver aussi une revue dtaille sur le diagnostic de dfauts appliqu sur les

    systmes de chauffage, ventilation, et climatisation : (Katipamula and Brambley,

    2005).

    I.1.5. Performances des techniques FDI

    Afin d'valuer la performance d'une technique de diagnostic de dfauts ou la comparer avec

    dautres mthodes, il faut dfinir certains critres de performances respecter:

    1. La rapidit de dtection du dfaut.

    2. La minimisation de fausses alarmes

    3. La robustesse de la mthode face la prsence de bruit, perturbation et erreur de

    modlisation.

    4. Ladaptation face aux variations du procd.

    5. La capacit identifier des dfauts multiples.

    6. La capacit manipuler diffrents types de dfauts (actionneur, capteur, procd).

    7. La diagnosticabilit ou la capacit de distinction entre les diffrents dfauts.

    8. La sensibilit face des petits dfauts.

    9. La prcision de la localisation.

    10. La convenance par rapport aux systmes rels gnralement non linaires.

    11. Laptitude inclure la commande tolrante aux dfauts.

    12. La simplicit d'implmentation et d'utilisation.

    I.2. Les mthodes de diagnostic

    Des chercheurs de domaines varis ont essay de raliser la tche de diagnostic pour diffrents

    systmes en apportant leur connaissance et outils de certains domaines de recherche. Cela

    conduit l'enrichissement de mthodes de diagnostic.

    Certains chercheurs dcomposent les mthodes de diagnostic en 3 catgories (Isermann, 2011,

    Ping, 2011, Verron, 2007, Frank et al., 2000). Dans cette thse, les approches de diagnostic de

    dfauts sont dcomposes en deux grandes catgories, comme propos par (Zhang and Jiang,

    2008) et (Venkatasubramanian V. et al., 2003a) :

  • 13

    1. Schmas bass sur le modle (Venkatasubramanian V. et al.,

    2003a,Venkatasubramanian et al., 2003b)

    2. Schmas bass sur les donnes (sans modle a priori) (Venkatasubramanian, 2003c)

    Ces approches sont brivement discutes dans les paragraphes suivants.

    I.2.1. Mthodes base de modle explicite

    Les mthodes bases sur un modle explicite utilisent un modle dcrivant les relations

    fondamentales gouvernant le systme afin de gnrer des symptmes de dfauts (Simani et al.,

    2003). Ces mthodes ont de nombreux avantages car elles permettent didentifier le type du

    dfaut et de remonter la source du dfaut pour diffrentes classes de systmes. La plupart des

    mthodes base de modle reposent sur le concept de redondance analytique qui consiste

    vrifier la cohrence entre le comportement simul du modle et celui rellement observ, do

    la ncessit davoir un modle dtaill et suffisamment prcis du systme afin d'avoir des

    rsultats satisfaisants. Ceci est ralis en gnrant des rsidus qui permettent leur tour de

    dtecter un cart entre le comportement dfectueux et le comportement normal du systme.

    Plusieurs mthodes sont envisageables pour lobtention de rsidus partir de modles

    analytiques (Figure I.3). On peut citer par exemple les mthodes par estimation de paramtres,

    par estimation d'tat, ou par espace de parit.

    Figure I.3 Schma de classification des mthodes de diagnostic de dfauts bases sur le

    modle

  • 14

    Approche par estimation de paramtres :

    Partant de l'ide qu'un dfaut se reflte dans les paramtres physiques du systme, des mthodes

    d'estimation paramtriques sont utilises pour estimer la valeur actuelle de ces paramtres. Le

    rsidu est ainsi calcul partir de l'cart entre la valeur des paramtres estims et celle de

    rfrences obtenue dans le cas sans dfaut (Simani et al., 2003, Gertler, 1998, Fuente et al.,

    1996).

    Approche par espace de parit :

    Cette technique se base sur la rcriture des quations d'tat et de mesure de telle sorte que seules

    les variables connues (entres et sorties) sont autorises apparatre. Ces variables connues sont

    ensuite utilises afin de construire un rsidu indicateur de dfaut.

    Soit le modle

    zBzA

    G M dcrivant le systme

    zBzA

    pG . Ainsi le rsidu peut tre dfini

    comme suit :

    zuzB

    zA

    zB

    zA

    zr (I.1)

    Plusieurs travaux ont utilis cette mthode pour le diagnostic de dfauts (Gustafsson, 2007,

    Gertler, 1998) ou ont combin cette mthode avec la mthode destimation de paramtre

    (Isermann, 2005).

    Approche par estimation d'tat (observateur)

    La construction des observateurs dtat reprsente une des techniques les plus employes dans

    lapproche base sur le modle (Ding, 2008, Pierri et al., 2008b, Li et al., 2008, Isermann, 2006,

    Simani et al., 2003, Venkatasubramanian V. et al., 2003a, Lootsma, 2001, Lootsma, 1999). La

    redondance analytique est obtenue grce aux tats estims partir dun modle adquat et dun

    ensemble de mesures appropries. En comparant les variables estimes et mesures, un ensemble

    de signaux (rsidus) sensibles aux dfauts est gnr. Ces rsidus sont ensuite analyss pour

    dtecter et/ou isoler le dfaut.

    Diffrents types dobservateurs ont t proposs dans la littrature pour les systmes linaires et

    non linaires. Parmi les techniques les plus utilises, on peut citer les observateurs entre

    inconnue (Sotomayor and Odloak, 2005); les observateurs bass sur le placement de structure

    propre The eigen structure assignment approach (Patton and Chen, 2000), les observateurs

  • 15

    mode glissant (Edwards et al., 2000) , le filtre de Kalman tendu qui a t initialement appliqu

    pour la dtection et lisolation des dfauts des systmes non linaires par (Huang et al., 2003).

    Le problme fondamental de dtection et disolation des dfauts de systmes non linaires a t

    introduit initialement par Frank (Frank, 1990). Depuis lors, plusieurs techniques ont t utilises

    pour les systmes non linaires. Une revue sur les principales approches bases sur les

    observateurs pour les systmes non linaires a t donne par (Alcorta Garca and Frank, 1997) .

    Les auteurs dans (Hammouri et al., 2002), (De Persis and Isidori, 2001), (Kabore et al., 2000) et

    (Hammouri et al., 1999) ont propos une solution pour la dtection et lisolation des dfauts des

    systmes non linaires en combinant une approche gomtrique de dcouplage avec les

    techniques des observateurs non linaires, notamment le grand gain.

    Tout l'art de ces approches rside dans le choix du terme correctif et plus particulirement la

    synthse de gain qui a pour objectif non seulement de s'assurer de la convergence de l'estimation

    vers la sortie relle du procd mais aussi le dcouplage par rapport aux autres dfauts.

    Dans cette thse on sintresse deux types dobservateurs ; un observateur grand gain et un

    autre de type Kalman cause de leur convergence exponentielle. Lobservateur grand gain

    sera appliqu dans lestimation dtat d'un racteur chimique alors que lobservateur de type

    Kalman trouvera son application dans le systme olien. Un bref rappel de ces types

    dobservateurs est donn ci-dessous.

    I.2.1.1. Observateur grand gain

    Ce type dobservateur peut sappliquer une large classe de systmes non linaires qui

    scrivent sous la forme suivante :

    Cxtxty

    ttxtstutx

    ttxtxtstuxtstuAtx

    ttxtstuxtstuAtx

    qqq

    qqqqqq

    )()(

    )())(),(),(()(

    )())(,),(),(),(())(),(()(

    )())(),(),(())(),(()(

    1

    111111

    111211

    (I.2)

    O nTq Rxxx ,,1 est le vecteur dtat, T

    ikii xxx ],,[ 1 , tu est lentre, suAi , est une

    matrice carre de dimension ).( nkqkk , s(t) est un signal connu, Tq ],,[ 1 sont des

  • 16

    fonctions non linaires et supposs diffrentiables, Tq ],,[ 1 est un vecteur non connu

    born, 0,,0, kIC .

    Un observateur grand gain peut tre construit pour le systme prcdent en se basant sur les

    hypothses suivantes:

    H1) est globalement Lipschitz par rapport x.

    H2) Les matrices ))(),(( tstuAi et leurs drives sont inversibles et bornes

    H3) Les matrices ))(),(( tstuAi sont diffrentiables par rapport au temps et leurs drives sont

    bornes.

    Dans ce cas, lobservateur grand gain du systme (I.2) est donn par:

    )())(),(),(())(),(( 1 yxCKtxtstuxtstuAx (I.3)

    O K est une matrice de taille kn tel que KCA est une matrice Hurwitz,

    000

    ))(),((100

    0))(),((200

    00))(),((10

    ))(),((

    tstuqA

    tstuA

    tstuA

    tstuA (I.4)

    ),,(

    )1,,1,,(1

    )1,,(1

    ),(

    xsuq

    qxxsuq

    xsu

    tu

    ,

    q

    00

    00

    20

    00

    (I.5)

    ))(),((1))(),((10

    00

    ))(),((10

    000

    )(

    tstuqAtstuA

    tstuAk

    I

    t

    (I.6)

    0000

    000

    000

    000

    kI

    kI

    kI

    A

    (I.7)

    est un paramtre de rglage positif, Ik est la matrice identit de taille kk .

  • 17

    Thorme: (bas sur les rsultats donns dans Farza et al., 1997, Gauthier et al., 1992)

    Supposons que le systme (I.2) satisfait les hypothses H1), H2) and H3), alors:

    ! " )0()0()()( xxetxtx t

    O est la norme infinie (L ) de )(t ; 0#! , 0#" et 0# sont des constantes. Cela

    implique que, si 0 , alors, le systme (I.3) est un observateur exponentiel du systme (I.2).

    I.2.1.2. Observateur du type Kalman

    Lobservateur de type Kalman a t initialement propos par (Bornard et al., 1989) et

    (Hammouri and de Leon Morales, 1990) pour une classe de systmes non linaires o la matrice

    dtat peut dpendre du signal dentre, du signal de sortie ou du temps et toutes les entres sont

    rgulirement persistantes. Ce systme peut se mettre sous la forme :

    Cxy

    uxuAx )()( $ (I.8)

    O %y ; nx % ; mu % et $(u) est un vecteur qui dpend non linairement de u.

    Notons par ),( 0tsu& , la matrice de transition, la solution unique de lquation :

    ),(.)(),( 00 tssuAds

    tsdu

    u &&

    (I.9)

    Notons par ),,( 100 tttuG le Grammien dobservabilit relatif lentre u sur lintervalle

    [t0, t0+ t1] :

    '

    10

    0

    ),(),(,, 0*

    0*

    100

    tt

    t

    uu dtttCCtttttuG && (I.10)

    O C* reprsente la transpose de C.

    Dfinition :

    Lentre uRm est dite rgulirement persistante pour le systme (I.8) si ( t1 > 0, ( )1 > 0, ( )2

    > 0 and ( t0 * 0 tels que 0tt*+ :

    2100max

    1100min

    ,,

    ,,

    ),

    ),

    *

    tttuG

    tttuG (I.11)

  • 18

    O min, et max, reprsentent la plus petite et la plus grande valeur propre respectivement.

    Thorme: (Bornard and Hammouri, 1991)

    Si u est rgulirement persistante, alors pour tout > 0, le systme suivant :

    CCuARRuARR

    yCxCRuGxuAx

    TT

    T

    )(.)(.

    )()( 1

    (I.12)

    est un observateur exponentiel pour (I.8). Le paramtre de rglage dtermine la vitesse de

    convergence de lobservateur qui est garantie si la matrice R est symtrique dfinie positive.

    La particularit de lobservateur de type Kalman est son gain variable donn par la rsolution de

    lquation algbrique de Riccati.

    I.2.2. Mthodes bases sur les donnes

    La disponibilit dune grande quantit des donnes ainsi que les inconvnients des mthodes

    bases sur le modle (dus la ncessit davoir un modle prcis par exemple), ont encourag la

    croissance des mthodes de diagnostic bases sur les donnes. Ces mthodes peuvent permettre

    des dveloppements rigoureux des donnes disponibles (mesures historiques ou en temps rel)

    mme dans le cas de systmes complexes, do leur succs dans les applications industrielles.

    Elles font appel des procdures d'apprentissage et de reconnaissance de forme, la logique

    floue ou lintelligence artificielle (Frank and Kppen-Seliger, 1997) afin de gnrer les

    symptmes de dfaut qui seront analyss pour fournir la dcision de diagnostic de dfaut (Reiter,

    1987).

    Les mthodes bases sur les donnes sont appropries pratiquement pour n'importe quel type de

    problme pour lequel d'importantes quantits de donnes mesures reprsentatives du

    fonctionnement du systme sont disponibles. Elles sont dautant plus intressantes lorsque le

    modle mathmatique du systme nest pas disponible, ce qui rend inutilisables les mthodes de

    diagnostic bases sur le modle. Lapplication de ces mthodes est ralise en diffrentes tapes

    dacquisition et prtraitement des donnes, de modlisation/apprentissage et de validation. La

    Figure I.4 rpertorie les diffrentes mthodes de diagnostic de dfauts bases sur les donnes. Un

    aperu des mthodes bases sur des donnes est donn dans (Venkatasubramanian, 2003).

  • 19

    Figure I.4 Mthodes de diagnostic diriges par les donnes

    Vrification de limites et tendances

    La mthode la plus simple de supervision dans le cas dabsence de modle est mono variable et

    se base sur la vrification de limites (seuils) de la valeur de certaines variables mesurables telles

    que : la pression, la temprature, la force, la vitesse et la position. Si cette valeur dpasse la zone

    de tolrance ( maxminY YY -- et dt

    dYY

    dt

    maxmindY -- ), une alarme se dclenche. Loprateur doit

    ensuite cerner le dfaut (le localiser) afin de prendre les mesures ncessaires pour le retour

    ltat normal.

    Certes, cette mthode est simple et facile mettre en uvre, mais elle a des limites. En effet, si

    une variable mesure dpasse la zone de tolrance, le procd est probablement dj dans un tat

    critique. En plus, malgr que ces mthodes fonctionnent quand le procd est ltat dquilibre,

    la situation devient plus complique si la variable contrle change de dynamique avec les points

    de fonctionnement. Aussi, un dfaut important dans un procd complexe peut dclencher

    plusieurs alarmes en mme temps. Cela rend la tche de loprateur qui supervise le procd

    difficile pour identifier le dfaut en question afin de ragir immdiatement par les actions

    requises.

    Mthodes statistiques

    Les mthodes statistiques font partie des mthodes bases sur les donnes. En tudiant les

    caractristiques dun ensemble dobjets ou dobservations, elles donnent un moyen essentiel

    pour la connaissance. A partir de ces donnes, elles fournissent un outil graphique facilement

  • 20

    manipulable et interprtable par loprateur. Malheureusement, cela demande la connaissance

    complte de la population, ce qui rend ces mthodes coteuses, voire impossibles dans certains

    cas (comme dans le cas des systmes rgis par des perturbations inconnues). La solution est donc

    dutiliser les statistiques infrentielles qui consistent utiliser la thorie de probabilits afin

    dinduire les caractristiques inconnues dune population partir de certains chantillons tirs de

    cette population avec une certaine marge derreur, autrement dit la dtermination dune loi de

    probabilit partir dune srie dexpriences.

    Parmi les mthodes statistiques, on cite lAnalyse en Composantes Principale (ACP), Partial

    Least Square (PLS) et Support Vector Machines (SVM). Les mthodes ACP et PLS ont t

    utilises dans cette thse titre comparatif avec la mthode de rfrence qui est la mthode

    SVM. Dans les deux paragraphes suivants, on propose donc de rappeler la thorie et les

    applications de ces deux mthodes.

    I.2.2.1. LAnalyse en Composantes Principales (ACP)

    Lanalyse en composantes principales (ACP) Principal Component Analysis PCA est une

    mthode gomtrique et statistique qui permet de transformer lespace multivariable dentres

    corrles en un espace plus petit non corrl tout en conservant le maximum de variance des

    donnes dentres. Elle permet de voir les donnes dune manire diffrente (dans un autre

    repre) par la rotation des axes des variables originales vers des nouveaux axes, qui sont

    orthogonaux et compltement dcorrls pour viter davoir des informations redondantes. Cest

    donc une mthode danalyse et de rduction de dimension de donnes. Elle gnre un nouveau

    jeu de donnes appel Composantes Principales (CP) (variables latentes, ou facteurs) partir

    desquelles le modle va tre construit, et chaque composante a un taux de reprsentation du

    modle, comme on peut le voir sur la Figure I.5 . Chaque composante est une combinaison

    linaire des variables originales. Donc chaque variable peut contribuer la cration du modle

    contrairement la slection des caractristiques (voir section I.2.3.3) qui utilisent juste un sous-

    ensemble des variables originales pour la cration du modle (Ramaswami and Bhaskaran,

    2009). Plus le nombre de composantes est important, plus la sensibilit au bruit va augmenter.

    On se limite gnralement 2 ou 3 composantes, o le maximum dinformation (variance) est

    compress.

  • 21

    Figure I.5 Taux de reprsentativit des composantes principales dans le modle

    Le champ dapplication de cette mthode est trs vari allant de la rduction de dimension ,

    rduction et suppression de bruit, visualisation, la compression de donnes, dtection des

    dfauts (Sun et al., 2005, Dunia et al., 1996), et aussi au prtraitement des modles empiriques.

    Fondement thorique de la mthode ACP

    Soit X une matrice de donnes de taille mn constitue de n observations ou chantillons et m

    variables :

    .

    .

    .

    /

    0

    111

    2

    3

    nmn1

    1m11

    xx

    xx

    X

    L'ACP cherche laxe (utilis dans la projection des chantillons) qui va maximiser la capture de

    variabilit ou variance (information) des nuages de points. Ceci est fait en utilisant une matrice

    de transformation nmP % , qui projette les donnes dans un espace de dimension rduit :

    XXEetTPX T (I.13)

    Pi est nomm le vecteur poids loading , qui contient linformation qui concerne la relation

    entre les variables. X est la nouvelle matrice de donnes qui estime X . E est la matrice des

    rsidus et reprsente la source de bruit. Les lments de T sont appels scores, et ils contiennent

    la relation entre les chantillons. Les scores reprsentent les valeurs des variables originales

    mesures et transformes dans lespace de dimension rduit. Lespace des donnes dorigine

    peut tre calcul comme :

    EptXETPX Ti

    a

    i

    i

    T 4 51

    (I.14)

    O ti est le vecteur score. Ceci donne la mthode ACP la possibilit denlever le bruit et de

    laisser seulement linformation pertinente. La matrice de variance-covariance R est obtenue par

    la dcomposition en valeurs singulires :

    EEXX

    nn

    XXUUR TT

    TT

    1

    1

    12/1

    (I.15)

    Variabilit

    Explique % Composantes Principales

    1 2 3 4 5 6 7 8 9 10 11 12 13

  • 22

    O est la matrice diagonale contenant les valeurs propres dans un ordre dcroissant de la

    matrice de corrlation R. Les colonnes de la matrice U sont les vecteurs propres de R. La matrice

    P est gnre par le choix des vecteurs propres de U.

    Le choix du nombre a (a

  • 23

    1. La carte de contrle T2 de Hotelling statistique

    La carte de contrle T est dfinie comme la majeure partie de variation des donnes lintrieur

    du modle (lespace principal). Le processus est considr tant en fonctionnement normal pour

    un seuil de confiance )) donn, et une distribution du 6 :

    anaFann

    naT

    kxPPkxktktkT

    na

    T

    TTT

    a

    ,)(

    )1(

    )()()()()(2

    2,,

    2112

    ))

    7 (I.17)

    O n est le nombre dchantillons, a est le nombre de composantes principales, an,aF ) est la

    valeur de la distribution de Fisher-Snedecor. a est la matrice forme par les premires lignes et

    colonnes de , ) reprsente le niveau appropri de l'importance pour la ralisation du test qui

    prend gnralement la valeur de 0,05 ou 0,01 pour les limites de confiance.

    2. Indice Squared Prediction Error SPE

    Lindice SPE est dfini comme la somme des carrs de chaque ligne de E. Il est perpendiculaire

    l'espace construit par le modle ACP :

    5

    n

    j

    T

    TT

    aa

    T

    jj XPPIXkekekxkxkSPEQ1

    22 )()()()()( 7 (I.18)

    5

    n

    j

    T

    T

    jj

    T pktkxEEQ1

    22)()( 7

    (I.19)

    La limite suprieure, ou les seuils de confiance de Q statistique, peuvent tre calculs par sa

    distribution approximative comme suit :

    01

    21

    002

    1

    101

    12.. hhhchQ

    .

    ./

    0

    112

    3

    ))

    5

    n

    aj

    i

    ji h1

    22

    310 3

    21,

    ,

    (I.20)

    O c) est l'cart type normal correspondant la partie suprieure (1-)) centile, ,j est la valeur

    propre associe au jme vecteur poids. Q statistique reprsente lerreur de prdiction quadratique

    dcrivant le bruit dans les donnes et la variation lextrieur du modle. Q est utilis pour

    surveiller et suivre de prs la corrlation entre les variables du procd. Une augmentation de sa

    valeur signifie un changement dans les corrlations qui gouvernent les variables ce qui

  • 24

    indiquerait un dfaut. Cependant, la distance SPE est sensible aux incertitudes de modlisation

    provoquant de nombreuses fausses alarmes si les systmes sont non-linaires.

    Des travaux ont t faits utilisant lACP avec les cartes de contrle Q et T2 statistiques afin de

    diffrencier entre loccurrence dun dfaut et une condition de fonctionnement normale largie

    (Humberstone et al., 2012, Humberstone, 2010). Nanmoins, ces cartes de contrle prsentent

    certaines restrictions puisqu'elles font des suppositions sur la distribution des donnes. (Camci et

    al., 2008) proposent une carte de contrle base sur la distance noyau utilisant les principes de

    SVM et dmontre quil est sensible tous les types de donnes en hors contrle quels que soient

    leurs distributions et permet aussi de bnficier et dapprendre de ces donnes.

    I.2.2.2. Moindres carrs partiels (PLS)

    La mthode de Moindres Carrs Partiels (MCP) ou Projection aux Structures Latentes (PSL)

    Partial Least Squares PLS est un algorithme danalyse statistique multivariable propos par

    Wold la fin des annes 60 qui combine les fonctionnalits de lACP et la rgression multiple

    (Wold, 1966). Il tait destin au dbut pour lconomtrie. Il a trouv un grand succs et pris de

    lampleur en chimiomtrie o il est devenu un outil standard danalyse et de calibrage du spectre

    pour choisir les longueurs donde appropries. Maintenant, cette technique est applique dans

    plusieurs disciplines telles que la mdecine, la modlisation des procds, les sciences

    pharmaceutiquesetc. La notation PLS est utilise par la suite dans cette thse pour dsigner

    cette mthode.

    La PLS cherche les composantes latentes qui maximisent la covariance entre X et Y, afin de

    trouver une relation entre les variables indpendantes (entre X) et les variables dpendantes

    (sortie Y) en les dcomposant en variables latentes non corrles avec un processus itratif. La

    structure latente correspond lextraction du maximum de variation de Y qui explique au mieux

    la structure latente de X. Cette mthode est similaire lanalyse de corrlation canonique, et

    est lie aux autres mthodes de rgression telles que la rgression en composantes principales.

    La PLS a surmont les problmes de colinarit (qui mnent une mauvaise interprtation des

    coefficients de rgression ), et les problmes de limitation du nombre de variables prdites par

    rapport aux mthodes de rgression standards des moindres carrs. Elle permet danalyser des

    donnes avec plus de variables que dobservations et produit des modles avec une grande

    stabilit de prdiction car le risque de sur-apprentissage est minimis. Elle est trs efficace dans

    la gestion des valeurs manquantes et donc produit des modles trs robustes face aux dfauts

    capteurs par exemple. Elle est aussi capable de dtecter les valeurs aberrantes avec une analyse

  • 25

    plus soigne des donnes amliorant ainsi la qualit des modles dajustement. Cette mthode

    permet de manipuler plus facilement le bruit et les donnes redondantes et corrles et de raliser

    une marginalisation des valeurs anormales pour amliorer la robustesse du systme. Elle

    reprsente aussi une faon trs propre dinverser des matrices, la diffrence de lanalyse en

    composantes principales qui cherche trouver les composantes principales qui expliquent le

    maximum de variance dun seul bloc X ou Y sans tenir compte des autres blocs. Enfin, elle a

    lavantage de pouvoir prdire soit plusieurs variables rponse la fois (PLS2) soit juste une seule

    variable rponse (PLS1). En gnral, plus les variables rponses sont corrles meilleure sera la

    performance de PLS2 par rapport PLS1 en termes dinterprtation et de prcision de prdiction.

    Les algorithmes PLS sont numriquement stables, leur simplicit dimplmentation et de calcul

    leur donne un aspect fort. Une des difficults de rglage du PLS est le choix du nombre de

    valeurs latentes qui permet une bonne gnralisation. Cela peut se faire avec une validation

    croise.

    La PLS est un outil trs polyvalent qui peut raliser plusieurs tches : la rgression (Melssen et

    al., 2007, Kim et al., 2005), la rduction de dimension (Tenenhaus et al., 2007), la classification

    (Barker and Rayens, 2003, Nguyen and Rocke, 2002), la supervision et le contrle des procds

    (Kourti, 2005), la surveillance des procds (Zhou et al., 2010), et la modlisation (Shinzawa et

    al., 2011). Elle a aussi t utilise avec succs dans la surveillance et la dtection des dfauts

    pour les donnes chimiques (Wise and Gallagher, 1996). La PLS est mieux adapte au

    diagnostic de dfauts que l'ACP sur le plan thorique et pratique (Chiang et al., 2000) car lACP

    sintresse seulement la capture du maximum de variance sans tenir compte de la relation qui

    existe entre les donnes et les dfauts. La performance et lefficacit de la mthode PLS a t

    montre dans plusieurs travaux et articles (Ferrer et al., 2008,Yin et al., 2011), et elle a t

    combine aussi avec dautres mthodes telles que les SVMs (Rosipal and Trejo, 2003, Lu and

    Wang, 2008).

    Diffrentes mthodes ont t proposes pour tendre la mthode PLS au cas non linaire. En

    utilisant la force des mthodes noyau, la PLS peut tre tendue dune manire simple et efficace

    au cas des systmes non linaires. Il y a aussi plusieurs variantes de PLS qui diffrent selon la

    faon avec laquelle elles extraient les vecteurs latents. Un des algorithmes les plus lgants qui

    reprsentent la faon standard du PLS est le PLS itratif non linaire (Geladi and Kowalski,

    1986) qui est le plus appropri pour la supervision des procds par rapport la mthode

    SIMPLS (Li et al., 2010). Lalgorithme SIMPLS a cependant lavantage de calculer les facteurs

    PLS directement comme une combinaison linaire des variables dorigine en maximisant un

  • 26

    critre de covariance et donc vite de calculer des matrices dgonfles comme cest le cas dans

    lalgorithme NIPALS (de Jong, 1993).

    Fondement thorique de la mthode PLS

    Soit un ensemble de donnes compos des deux matrices X des mesures (entres) et Y des

    rponses (sorties). La PLS dtermine la relation entre ces deux blocs, en essayant de garder le

    maximum de covariance entre eux, par les quations suivantes :

    FUQY

    ETPXT

    T

    (I.21)

    X est la matrice prdicateurs de donnes de taille nm o chaque ligne reprsente une

    observation ou les mesures un chantillon donn, et chaque colonne reprsente les mesures

    dune variable. T est la matrice de scores de X, P la matrice de chargement de X, Y la matrice de

    rponse de taille nmy , U la matrice des scores de Y, Q la matrice de chargement de Y, E et F

    sont les matrices rsiduelles.

    La modlisation de X et Y de cette faon suppose que les deux sont observs avec une erreur

    (rsidu). Le chargement se fait travers les vecteurs latents T qui peuvent tre choisis de

    diffrentes faons, condition quils soient orthogonaux (dcorrls) couvrant lespace des

    colonnes de X. Des conditions additionnelles sont requises afin de spcifier T pour que les

    vecteurs de T soient orthogonaux, telle la cration dune combinaison linaire des colonnes de X

    et Y en multipliant ces dernires par les poids w et c respectivement de telle sorte que leur

    covariance soit maximale (Geladi and Kowalski, 1986, Rosipal and Krmer, 2006) :

    maximalesoitque tel

    1,1,,

    ut

    ttwwYcuXwt

    T

    TT (I.22)

    t, u sont les vecteurs scores de X et Y respectivement. w et c sont les coefficients de rgression

    de X et Y sur u, t respectivement (vecteurs poids de X et Y). Quand les premiers vecteurs latents

    (t et u) sont trouvs, ils sont soustraits de X et Y et la procdure est ritre jusqu' ce que X

    devienne une matrice nulle.

    tYttcetuXuuw TTTT 11 )()( (I.23)

    Avant de commencer le processus itratif, le vecteur u est initialis dune faon alatoire par le

    choix dune colonne de Y (celle avec la plus grande variance).

  • 27

    Ycuctt

    tYcXwtw

    uu

    uXw

    T

    T

    T

    T

    88 ,1,,,1, (I.24)

    On rpte ces tapes jusqu' la convergence. La PLS est une mthode itrative, qui dtermine

    chaque itration les vecteurs poids w, c ou les vecteurs scores t, u et les chargements p sont

    calculs, ainsi X et Y seront ajusts par ces rsultats :

    YttYquYY

    XttXptXXTT

    TT

    .

    . (I.25)

    O p et q sont les coefficients de rgression de X et Y sur t, u respectivement

    uYuuqettXttp TTTT 11 )()( (I.26)

    Aprs chaque itration les vecteurs w, t, p et q sont enregistrs dans les matrices W, T, P, et Q

    respectivement. On peut voir w comme le vecteur propre droite de la matrice YXS T , et le

    problme devient :

    Xwt

    wXwYYX TT

    , (I.27)

    Dans PLS rgression le but est de prdire Y en utilisant X et leur structure commune :

    XY (I.28)

    Daprs (Rosipal and Krmer, 2006), la structure commune est donne par la relation suivante :

    TT CWPW 1)( (I.29)

    ce qui donne :

    YTUXXTUX TTTT 1)( (I.30)

    PLS noyau : (KPLS) est une extension non linaire du PLS linaire. Lutilisation de fonction

    noyau (Kernel) permet de transformer (mapper) les donnes complexes non linaires de lentre

    dans un espace de caractristiques de plus grande dimension dans lequel la modlisation linaire

    peut se faire facilement (Rosipal and Trejo, 2002). Cette notion de noyau va tre dtaille par la

    suite dans la thorie des SVMs. La fonction noyau est donne comme suit :

    jijix xxxxK ,, (I.31)

    Avant de commencer le processus itratif, le vecteur u est initialis dune faon alatoire :

    1)5)4)31)2)1 88 uYcutYctuKut TxT (I.32)

    En utilisant lquation (I.27) en multipliant les deux termes par X on obtient :

  • 28

    tYYu

    ttYYXX

    T

    TT

    , (I.33)

    Considrons $$yK la matrice noyau du Gram (Kernel Gram matrix) de la sortie Y et $ la

    transformation de lespace de sortie de Y vers lespace de caractristique, do :

    tKu

    ttKK

    y

    yx

    , (I.34)

    Pour centrer les donnes transformes dans lespace des caractristiques, cela revient :

    )111

    ()111

    (

    )111

    ()111

    (

    T

    nnny

    T

    nnny

    T

    nnnx

    T

    nnnx

    nIK

    nIK

    nIK

    nIK

    9

    9 (I.35)

    O nI est la matrice identit de taille n, et n1 est le vecteur unit de taille n. Aprs le calcul des

    nouveaux scores t et u, on soustrait des matrices xK et yK leurs approxims calculs partir de t

    et u :

    YttYY

    ttIKttIK

    T

    T

    nx

    T

    nx

    9 )()( (I.36)

    Et donc on obtient :

    YTTYTUKTUKY

    YTUKTU

    TT

    x

    T

    x

    T

    x

    TT

    1

    1

    )(

    )(

    (I.37)

    I.2.3. Etapes de mise en uvre des mthodes bases sur les donnes

    Malgr le fait quon sintresse principalement lutilisation des mthodes bases sur les

    donnes pour le diagnostic de dfaut, il est important de noter que ces mthodes peuvent

    galement tre utilises pour la modlisation, donc avec un objectif diffrent

    Dans lobjectif de diagnostic, les mthodes statistiques permettent de relier les entres et

    sorties du systme au type de situation (dfectueuse ou normale pour diffrents dfauts).

    Dans lobjectif de modlisation (rgression), on cherche par ces mthodes trouver une

    relation empirique entre les entres et les sorties.

    Lapplication des mthodes bases sur les donnes pour le diagnostic de dfaut est ralise en

    plusieurs tapes : lacquisition et prtraitement des donnes, lextraction des caractristiques

  • 29

    importantes, la modlisation (soit entre-sortie soit donnes-type de dfaut) et la validation du

    modle. Selon lobjectif vis (modlisation ou diagnostic), ces tapes sont adapter.

    I.2.3.1. Acquisition des donnes

    Cette tape concerne laccueil (collection) et la prparation (prtraitement) des donnes. Ces

    donnes peuvent tre chantillonnes dans le domaine temporel ou frquentiel avec un intervalle

    dchantillonnage adapt la dynamique du procd. Des donnes riches et reprsentatives des

    diffrentes situations sont ncessaires pour lapprentissage de la dynamique du procd.

    On distinguera deux approches de collections des donnes :

    pour la modlisation (entres-sorties), la rponse transitoire est ncessaire. Dans ce cas,

    il est intressant dexciter le procd par une entre de spectre convenable (par exemple

    signal pseudo alatoire) afin de capter le maximum dinformation. La rponse transitoire

    dun systme (la sortie face une entre transitoire, tel un chelon ou une impulsion) est

    souvent utilise pour la modlisation. Elle permet de comprendre le comportement

    dynamique du systme, tel que le retard et les chelles de temps.

    pour le diagnostic (relation mesures-type de dfaut), des donnes dans les situations

    normale et dfectueuse sont ncessaires.

    Supposons X une matrice de donnes (contenant les entres U et les sorties mesures Y) de taille

    mn constitue de n rcurrences de mesures (observations, ou encore chantillons) et m

    variables caractristiques )( jX (facteurs ou encore proprits) dans les colonnes de la matrice:

    mjnmn

    m

    XXX

    xx

    xx

    YUX ,,,,, 1

    1

    111

    .

    .

    .

    /

    0

    111

    2

    3

    Les donnes acquises sont gnralement spares en deux groupes : donnes dapprentissage et

    donnes de test. Les donnes dapprentissage sont utilises pour le dveloppement du modle

    (slection des caractristiques et dveloppement du modle). Les donnes de test sont utilises

    pour la validation (valuation ou jugement) du modle et des caractristiques choisies.

  • 30

    I.2.3.2. Prtraitement des donnes

    Un prtraitement des donnes est ncessaire pour rduire le bruit, la suppression des valeurs

    aberrantes, le traitement des valeurs manquantes et la normalisation des donnes.

    Normalisation des donnes

    La normalisation est trs utile lorsque le systme a plusieurs variables dont les amplitudes et

    variances varient dans des plages diffrentes. Elle consiste mettre lchelle la matrice de

    donnes X en rendant les variables de la nouvelle matrice XN comparables (la mme plage de

    variation). Parmi les mthodes de normalisation de donnes, on peut citer :

    1. La mthode min/max : met les valeurs de chaque colonne de X selon le maximum et le

    minimum de cette colonne, de telle sorte avoir les valeurs de la matrice normalis XN

    dans lintervalle [bas-haut] :

    bas)(minimum)(maximum

    )(minimumbashaut

    XX

    XXX N

    O )(minimum X et )(maximum X remplace respectivement chaque colonne de X par son

    minimum et maximum. Ce type de normalisation avec haut=1 et bas=0 est utilis dans cette

    thse au chapitre II.

    2. La mthode Z-scores : permet de ramener la moyenne de chaque variable de X zro et sa

    variance lunit par lapplication de la formule suivante : )(typecart

    )( moyenne

    X

    XXX N

    3. La mthode de mise l'chelle dcimale decimal scaling

    4. La mthode de fentre coulissante ou glissante.

    Manipulation des donnes manquantes

    Dans le monde rel, les donnes ne sont pas toujours propres et compltes. Souvent elles sont

    censures et corrompues. Plusieurs techniques existent pour traiter les donnes manquantes, mais

    la mthode la plus simple et la plus utilise consiste dterminer la ligne de la matrice o des

    donnes sont corrompues puis la supprimer. Malgr sa simplicit, cette mthode rduit la taille

    de la matrice de donnes. Cela conduit une perte de puissance (informations) du rsultat. En

    plus, il y a des cas o la ligne corrompue contient des donnes importantes quon ne peut pas

    supprimer, ou des cas o la matrice de donnes a beaucoup de valeurs manquantes et donc la

    suppression de toutes ces lignes mne une matrice avec peu de donnes. Dans ce cas, on a

    recours la mthode de substitution qui remplace les donnes manquantes par une

  • 31

    approximation raisonnable en supposant que ces donnes sont faciles modliser. Parmi les