cours1www - carraro · title: cours1 author: laurent carraro created date: 1/16/2006 6:20:28 pm
TRANSCRIPT
1L. Carraro
Introduction à la régressioncours n°1
ENSM.SE – axe MSA
2L. Carraro
Présentation• Objectifs
– Comprendre la problématique générale de la régression.– Savoir mettre en œuvre la régression linéaire dans un
cas simple, mais réaliste.• Evaluation
– TP le 21 novembre : 20%– Etude critique le 23 novembre : 20%– TP le 12 décembre : 20%– Examen avec documents : 40%
3L. Carraro
Calendrier• mardi 8 novembre (8h15-11h30) :introduction, régression, moindres carrés• mercredi 9 novembre (8h15-11h30) :analyse de variance (ANOVA), modèle probabiliste• lundi 21 novembre (8h15-11h30) :TP sur les données de taille• mardi 22 novembre (8h15-11h30) :ANOVA complète, résidus
4L. Carraro
Calendrier (suite)• mercredi 23 novembre (8h15-11h30)étude critique• mardi 29 novembre (8h15-11h30)prévision + régression non paramétrique• lundi 12 décembre (8h15-9h45)TP régression non paramétrique• vendredi 16 décembre (8h15-9h45)examen
5L. Carraro
Problématique de la régression
Lien entre une réponse yet des prédicteurs x1,…, xp
… dans un contexte incertain
… à partir d’expériences
… dans un but prédictif
6L. Carraro
Classification
• réponse quantitative/qualitative
• régression paramétrique/non paramétrique
• régression linéaire/non linéaire
• prédicteurs contrôlés/non contrôlés
7L. Carraro
Exemple 1 : Société de crédit
Variables
Client
• âge
• sexe
• situation
• nombre de voitures
• revenus
• ...
Modèle
StatistiqueScore
Aide à la décision :
acceptation ou rejet
du client
But : cibler au mieux un client potentiel
8L. Carraro
Exemple 2 : Société d’autoroute
Variables
trafic• date
• heure
• station de mesure
• débit
• type de véhicule
• vitesse instantanée
• ...
Modèle
Statistique
Indicateurs du
trafic
Aide à la prévision :
optimiser le trafic, la
gestion des sections à péage
But : prévoir le trafic sur une section d’autoroute de son réseau
9L. Carraro
Exemple 3 : Calcination de la chaux
Variables
four
• température
• pression
• ...
Modèle
Statistiquequantité produite
aide à la production :
maximiser la plus-value
But : optimiser la réaction
10L. Carraro
Aspects formels
• L'espérance conditionnelle commeespérance
• L'espérance conditionnelle commeprojection
• L'espérance conditionnelle linéaire• Cas gaussien• Prédicteurs qualitatifs
11L. Carraro
Exemple 1Récupération de cartons dans la
grande distribution• Réponse = tonnage de cartons annuel• Prédicteur = CA HT
+ surface commerciale + prestataire + catégorie• 102 observations
12L. Carraro
exemple 1
0 20000 40000 60000 80000
02
00
40
06
00
80
01
00
01
20
0
CA en keuros
cart
ons e
n tonnes
13L. Carraro
cartons = β0 + βCA CA
0 20000 40000 60000 80000
02
00
40
06
00
80
01
00
01
20
0
CA en keuros
cart
ons e
n tonnes
14L. Carraro
exemple 1 – différents modèles
0 20000 40000 60000 80000
02
00
40
06
00
80
01
00
01
20
0
CA en keuros
cart
ons e
n tonnes
degré 1degré 2degré 3
15L. Carraro
0 20000 40000 60000 80000
-4000
400
CA
résidus
cartons ~ CA - degré 1
0 20000 40000 60000 80000
-4000
400
CA
résidus
cartons ~ CA - degré 2
0 20000 40000 60000 80000
-4000
400
CA
résidus
cartons ~ CA - degré 3
comportementnon satisfaisant
16L. Carraro
Questions/objectifs
• Estimer "au mieux" l'équation de la droite• Utilité de la variable CA ?• Effet des autres variables ?• Validation• Précision des résultats• Prévisions et contrôles• …
17L. Carraro
Les moindres carrés
• Notations
• Equation normale
• Interprétation géométrique
• Un premier indicateur de validation
18L. Carraro
0 200 400 600 800
-200
200
tonnage cartons estimé
résid
us
cartons ~ CA - degré 1
0 200 400 600 800
-300
0200
tonnage cartons estimé
résid
us
cartons ~ CA - degré 2
0 200 400 600 800
-300
0200
tonnage cartons estimé
résid
us
cartons ~ CA - degré 3
19L. Carraro
0 200 400 600
-20
0200
tonnage cartons estimé
résid
us
cartons ~ CA - degré 1
0 200 400 600 800
-30
00
200
tonnage cartons estimé
résid
us
cartons ~ CA - degré 2
0 200 400 600 800
-30
00
300
tonnage cartons estimé
résid
us
cartons ~ CA - degré 3
20L. Carraro zoom sur le modèle de degré 1
0 200 400 600
-20
00
20
04
00
tonnage cartons estimé
résid
us
cartons ~ CA - degré 1
21L. Carraro exemple 1après transformation logarithmique
8.0 8.5 9.0 9.5 10.0 10.5 11.0
12
34
56
7
log(CA) en keuros
log(c
art
ons)
en tonnes
22L. Carraro
exemple 1 transformé – modèles
8.0 8.5 9.0 9.5 10.0 10.5 11.0
12
34
56
7
log(CA) en keuros
log(c
art
ons)
en tonnes
degré 1degré 2degré 3
23L. Carraro
8 9 10 11 12
-3-1
13
log(CA)
résidus
log(cartons) ~ log(CA) - degré 1
8 9 10 11 12
-3-1
13
log(CA)
résidus
log(cartons) ~ log(CA) - degré 2
8 9 10 11 12
-3-1
13
log(CA)
résidus
log(cartons) ~ log(CA) - degré 3
24L. Carraro
2 3 4 5 6
-20
12
log(tonnage cartons) estimé
résid
us
log(cartons) ~ log(CA) - degré 1
3 4 5 6 7
-20
2
log(tonnage cartons) estimé
résid
us
log(cartons) ~ log(CA) - degré 2
3 4 5 6
-20
2
log(tonnage cartons) estimé
résid
us
log(cartons) ~ log(CA) - degré 3
25L. Carraro
Zoom sur le modèle de degré 1
8 9 10 11 12
-3-1
13
log(CA)
résid
us
log(cartons) ~ log(CA) - degré 1
2 3 4 5 6
-20
2
log(tonnage cartons) estimé
résid
us
26L. Carraro
Et les autres variables ?
8 9 10 11 12
-3-2
-10
12
3
log(CA)
résid
us
log(cartons) ~ log(CA) - degré 1
prestataire 0prestataire C
27L. Carraro
Variable surface
0 2000 4000 6000 8000 10000 12000
-2-1
01
2
surface
résidus
log(cartons) ~ log(CA) - degré 1
28L. Carraro
Variable prestataire
prestataire C prestataire O
-2-1
01
2
log(cartons) ~ log(CA) - degré 1résidus
29L. Carraro
Variable catégorie
hyper super
-2-1
01
2
log(cartons) ~ log(CA) - degré 1résidus