cours1www - carraro · title: cours1 author: laurent carraro created date: 1/16/2006 6:20:28 pm

Post on 18-Jan-2021

1 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

1L. Carraro

Introduction à la régressioncours n°1

ENSM.SE – axe MSA

2L. Carraro

Présentation• Objectifs

– Comprendre la problématique générale de la régression.– Savoir mettre en œuvre la régression linéaire dans un

cas simple, mais réaliste.• Evaluation

– TP le 21 novembre : 20%– Etude critique le 23 novembre : 20%– TP le 12 décembre : 20%– Examen avec documents : 40%

3L. Carraro

Calendrier• mardi 8 novembre (8h15-11h30) :introduction, régression, moindres carrés• mercredi 9 novembre (8h15-11h30) :analyse de variance (ANOVA), modèle probabiliste• lundi 21 novembre (8h15-11h30) :TP sur les données de taille• mardi 22 novembre (8h15-11h30) :ANOVA complète, résidus

4L. Carraro

Calendrier (suite)• mercredi 23 novembre (8h15-11h30)étude critique• mardi 29 novembre (8h15-11h30)prévision + régression non paramétrique• lundi 12 décembre (8h15-9h45)TP régression non paramétrique• vendredi 16 décembre (8h15-9h45)examen

5L. Carraro

Problématique de la régression

Lien entre une réponse yet des prédicteurs x1,…, xp

… dans un contexte incertain

… à partir d’expériences

… dans un but prédictif

6L. Carraro

Classification

• réponse quantitative/qualitative

• régression paramétrique/non paramétrique

• régression linéaire/non linéaire

• prédicteurs contrôlés/non contrôlés

7L. Carraro

Exemple 1 : Société de crédit

Variables

Client

• âge

• sexe

• situation

• nombre de voitures

• revenus

• ...

Modèle

StatistiqueScore

Aide à la décision :

acceptation ou rejet

du client

But : cibler au mieux un client potentiel

8L. Carraro

Exemple 2 : Société d’autoroute

Variables

trafic• date

• heure

• station de mesure

• débit

• type de véhicule

• vitesse instantanée

• ...

Modèle

Statistique

Indicateurs du

trafic

Aide à la prévision :

optimiser le trafic, la

gestion des sections à péage

But : prévoir le trafic sur une section d’autoroute de son réseau

9L. Carraro

Exemple 3 : Calcination de la chaux

Variables

four

• température

• pression

• ...

Modèle

Statistiquequantité produite

aide à la production :

maximiser la plus-value

But : optimiser la réaction

10L. Carraro

Aspects formels

• L'espérance conditionnelle commeespérance

• L'espérance conditionnelle commeprojection

• L'espérance conditionnelle linéaire• Cas gaussien• Prédicteurs qualitatifs

11L. Carraro

Exemple 1Récupération de cartons dans la

grande distribution• Réponse = tonnage de cartons annuel• Prédicteur = CA HT

+ surface commerciale + prestataire + catégorie• 102 observations

12L. Carraro

exemple 1

0 20000 40000 60000 80000

02

00

40

06

00

80

01

00

01

20

0

CA en keuros

cart

ons e

n tonnes

13L. Carraro

cartons = β0 + βCA CA

0 20000 40000 60000 80000

02

00

40

06

00

80

01

00

01

20

0

CA en keuros

cart

ons e

n tonnes

14L. Carraro

exemple 1 – différents modèles

0 20000 40000 60000 80000

02

00

40

06

00

80

01

00

01

20

0

CA en keuros

cart

ons e

n tonnes

degré 1degré 2degré 3

15L. Carraro

0 20000 40000 60000 80000

-4000

400

CA

résidus

cartons ~ CA - degré 1

0 20000 40000 60000 80000

-4000

400

CA

résidus

cartons ~ CA - degré 2

0 20000 40000 60000 80000

-4000

400

CA

résidus

cartons ~ CA - degré 3

comportementnon satisfaisant

16L. Carraro

Questions/objectifs

• Estimer "au mieux" l'équation de la droite• Utilité de la variable CA ?• Effet des autres variables ?• Validation• Précision des résultats• Prévisions et contrôles• …

17L. Carraro

Les moindres carrés

• Notations

• Equation normale

• Interprétation géométrique

• Un premier indicateur de validation

18L. Carraro

0 200 400 600 800

-200

200

tonnage cartons estimé

résid

us

cartons ~ CA - degré 1

0 200 400 600 800

-300

0200

tonnage cartons estimé

résid

us

cartons ~ CA - degré 2

0 200 400 600 800

-300

0200

tonnage cartons estimé

résid

us

cartons ~ CA - degré 3

19L. Carraro

0 200 400 600

-20

0200

tonnage cartons estimé

résid

us

cartons ~ CA - degré 1

0 200 400 600 800

-30

00

200

tonnage cartons estimé

résid

us

cartons ~ CA - degré 2

0 200 400 600 800

-30

00

300

tonnage cartons estimé

résid

us

cartons ~ CA - degré 3

20L. Carraro zoom sur le modèle de degré 1

0 200 400 600

-20

00

20

04

00

tonnage cartons estimé

résid

us

cartons ~ CA - degré 1

21L. Carraro exemple 1après transformation logarithmique

8.0 8.5 9.0 9.5 10.0 10.5 11.0

12

34

56

7

log(CA) en keuros

log(c

art

ons)

en tonnes

22L. Carraro

exemple 1 transformé – modèles

8.0 8.5 9.0 9.5 10.0 10.5 11.0

12

34

56

7

log(CA) en keuros

log(c

art

ons)

en tonnes

degré 1degré 2degré 3

23L. Carraro

8 9 10 11 12

-3-1

13

log(CA)

résidus

log(cartons) ~ log(CA) - degré 1

8 9 10 11 12

-3-1

13

log(CA)

résidus

log(cartons) ~ log(CA) - degré 2

8 9 10 11 12

-3-1

13

log(CA)

résidus

log(cartons) ~ log(CA) - degré 3

24L. Carraro

2 3 4 5 6

-20

12

log(tonnage cartons) estimé

résid

us

log(cartons) ~ log(CA) - degré 1

3 4 5 6 7

-20

2

log(tonnage cartons) estimé

résid

us

log(cartons) ~ log(CA) - degré 2

3 4 5 6

-20

2

log(tonnage cartons) estimé

résid

us

log(cartons) ~ log(CA) - degré 3

25L. Carraro

Zoom sur le modèle de degré 1

8 9 10 11 12

-3-1

13

log(CA)

résid

us

log(cartons) ~ log(CA) - degré 1

2 3 4 5 6

-20

2

log(tonnage cartons) estimé

résid

us

26L. Carraro

Et les autres variables ?

8 9 10 11 12

-3-2

-10

12

3

log(CA)

résid

us

log(cartons) ~ log(CA) - degré 1

prestataire 0prestataire C

27L. Carraro

Variable surface

0 2000 4000 6000 8000 10000 12000

-2-1

01

2

surface

résidus

log(cartons) ~ log(CA) - degré 1

28L. Carraro

Variable prestataire

prestataire C prestataire O

-2-1

01

2

log(cartons) ~ log(CA) - degré 1résidus

29L. Carraro

Variable catégorie

hyper super

-2-1

01

2

log(cartons) ~ log(CA) - degré 1résidus

top related