note to users › obj › s4 › f2 › dsk1 › tape7 › pqdd_001… · .k mon père sylvestre...

NOTE TO USERS

The original manuscript received by UMI contains pages with indistinct print. Pages were

microfilmed as received.

This reproduction is the best copy available.

UMI

DIMITRI MWAKAPOYA SANGA

ESTIM44TION DES MODÈLES ÉCONOMÉTRIQUES DE CHOIX DISCRETS/CONTINUS AVEC CHOIX POLYTOMIQUES INTERDÉPENDANTS: UNE

APPROCHE PAR SIMULATION.

Thèse

présentée

à la Faculté des études supérieures

de 1'U niversité Laval

pour l'obtention

du grade de Philosophiae Doctor (Ph. D.)

Départeriient d'économique

FACULTÉ DES SCIENCES SOCIALES

JUILLET 1999

@ Dimitn Mwakapoya SANGA, 1999

National Library of Canada

Bibliothèque nationale du Canada

Acquisitions and Acquisitions et Bibliographie Services services bibliographiques

395 Wellington Street 395, rue Wellington Ottawa ON K1A ON4 Ottawa ON K1 A ON4 Canada Canada

The author has granted a non- exclusive licence allowing the National Library of Canada to reproduce, loan, distribute or sel1 copies of this thesis in microforni, paper or electronic formats.

The author retains ownership of the copyright in this thesis. Neither the thesis nor substantial extracts fiom it may be printed or otherwise reproduced without the author's permission.

Your hfe Votre reterence

Our hle Noire relerence

L'auteur a accordé une licence noii exclusive permettant à la Bibliothèque nationale du Canada de reproduire, prêter, distribuer ou vendre des copies de cette thèse sous la forme de microficheffilm, de reproduction sur papier ou sur format électronique.

L'auteur conserve la propriété du droit d'auteur qui protège cette thèse. Ni la thèse ni des extraits substantiels de celle-ci ne doivent être imprimés ou autrement reproduits sans son autorisation.

Résumé

iious proposons une méthode efficiente pour estimer les modèles économétriques de

choix discrets/continus avec choix polytorniques interdépendants. La difficulté prin-

cipale lors de l'estimation de tels modèles est la présence d'intégrales multidimen-

sionnelles apparaissant dans les expressions des probabilités de choix et ceux des

espérances conditionnelles. L'utilisation des techniques de simulation nous a permis

de contourner cette difficulté lors de l'évaluation de ces dernières expressions. Yous

abordons le problème de deux façons différentes à savoir dans un cadre du maximum

de vraisembhce a information complète et celui du maximum de waisemblance à in-

formation incomplète. Des évaluations empiriques basées sur la demande d'électricité

nous servent de cadre d'application des méthodes ainsi développées.

nis BOLDUC

Résumé

L'objectif de ce travail est de fournir une manière efficiente d'estimer les modèles

économétriques de choix discrets/continus lorsque les choix discrets sont interdépendants.

Ce cas où les interdépendances sont admises entre les modalités discrètes donne

lieu au modèle probit. Ce dernier est un modèle qui comporte un certain nombre

d'avantages théoriques: une grande flexibilité dans la spécification et l'usage; la pos-

sibilité d'inclure le phénomène d'hétérogénéité entre les individus et de permettre

des formes d'interdépendances très générales entre les modalités; une bonne pro-

priété d'agrégation; une grande utilité pour traiter les observations discrètes avec

données de panel longitudinales et une capacité de traiter les données agrégées ... Son utilisation pratique, a toutefois souvent été limitée à cause de deux obstacles ma-

jeurs, à savoir, la présence inévitabie d'intégrales multidimensionneiles de loi normale

définissant les probabilités de choix et le nombre de paramètres de nuisance a estimer

dans la structure de corrélation des erreurs. Les recherches effectuées pour résoudre

ces problèmes ont donné lieu, entre autres, à la mise sur pied de simulateurs per-

mettant de remplacer les probabilités de choix dans les fonctions objectives par des

simulations stochastiques effectuées sur le modèle latent. Cette thèse vient mettre

en lumière l'ampleur de l'évolution des méthodes de simulation en proposant une

manière pratique d'estimer les modèles de choix discrets/continus peu restrictifs en

termes d'interdépendances. Cela est réalisé, premièrement, dans un cadre du maxi-

mum de vraisemblance à information complète, puis dans un cadre du maximum de

vraisemblance à information limitée où nous utilisons particulièrement une méthode

basée sur le principe de correction pour le biais de sélection. Les dérivations théoriques

sont assorties d'évaluations empiriques appliquées à la demande de l'électricité pour

les ménages québécois.

Avant-propos

La réalisation de cette thèse a été possible grâce à la collaboration de plusieurs per-

sonnes. En effet, il a fallu non seulement maintenir un rythme de travail soutenu

mais aussi compter sur l'appui de ces dernières. C'est ainsi que j'exprime ma pro-

fonde gratitude à l'égard de mon directeur de recherche, Denis Bolduc, pour m'avoir

toujours encouragé et soutenu durant ces années de dur labeur, à mon épouse, Marie

Ahamada et Darcy Sanga, mon filso pour les sacrifices consentis, le support moral et

l'attention dont j'ai été l'objet quand le besoin se faisait sentir. Ma reconnaissance va

aussi à tous ceux qui de près ou de loin ont contribué à leur façon à cet aboutissement.

Je pense tout d'abord à la famille Sanga pour avoir supporté cet éloignement pendant

tant d'années. Aux collègues, aux amis et compagnons d'exil qui nous a été imposé

par les circonstances que d'aucuns n'ignorent en ces années 90 en RD Congo. Merci

à Kane Yahya Ousmane pour avoir accepté de lire la version finale du manuscrit de

cette thèse. Que l'accomplissement de ce travail puisse répondre à ne fusse qu'une

infime partie de ce que les Basanga, les Katangais et les Congolais attendent de moi,

est le voeu le plus ardent que je puisse émettre à cette occasion.

Je remercie, enfin, le ministère de l'Énergie, Mines et Ressources Naturelles du

Canada ainsi que le Groupe de Recherche en économie de l'énergie, de l'environnement

et des ressources natureiles (GREEN) pour le soutien financier dont j'ai bénéficié

durant la réalisation de ce travail.

.k mon père Sylvestre Mwakapoya Sanga et ma mère Liberata Mpangwe Shamuabi

qui ont su mettre à ma disposition les atouts nécessaires pour aborder la vie de la

manière la plus prometteuse au meilleur de leurs moyens.

.k Darcy, mon fils : "bwana bulume i kwi tela".

.k Adèie, Sylvie, Mimy, Alain, Rudy, Alex, Eddy, professeur Baruti, Mathieu

Kalenga, merci pour le soutien.

A tous les miens qui ont disparu pendant ma longue absence, je dédie ce tra-

vail: Brigitte Mpangwe Shamuabi, Prisca Sato Sanga, Filly Luabwe Sanga, Eustache

Mulembwa, Jean-Marie Mbayo, Leandre, Justin Ilunga, Renilde.. .

Table des Matières

Résumé

Résumé iii

Avant-propos v

1 Introduction 1

2 Revue de littérature 7

2.1 Modélisation en une étape . . . . . . . . . . . . . . . . . . . . . . . . 7

2.2 Modélisation en deux étapes . . . . . . . . . . . . . . . . . . . . . . . 10

2.3 Évolution des techniques d'estimation . . . . . . . . . . . . . . . . . . 17

3 Le cadre économétrique général 19

3.1 La partie discrète (P(2 IX)) . . . . . . . . . . . . . . . . . . . . . . . . 20

3.1.1 Modèles pour données ordonnées . . . . . . . . . . . . . . . . 21

3.1.2 Modèles pour données de rang . . . . . . . . . . . . . . . . . . 22

3.1.3 Modèles pour données non ordonnées . . . . . . . . . . . . . . 23

3.2 La partie continue. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4 Estimation économétrique: Méthode d'estimation en une étape (Max-

imum de Vraisemblance B Information Compléte) 32

vii

5.2.3 Le modèle cie choix . . . . . . . . . . . . . . . . . . . . . . . . 112

5.2.4 Le modèle de demande conditionnelle . . . . . . . . . . . . . 114

5.2.5 Estimation de la partie discrète . . . . . . . . . . . . . . . . . 115

5.2.6 Estimation de la partie continue . . . . . . . . . . . . . . . . . 116

5.2.7 Données et spécification du modèle . . . . . . . . . . . . . . . 123

5.2.8 Résultats e t interprétations . . . . . . . . . . . . . . . . . . . 124

5.2.9 Élasticités prix et revenu . . . . . . . . . . . . . . . . . . . . . 132

5.2.10 Conclusion . . . . . . . . - . . . . . . . . . . . . . . . . . . . 132

6 Conclusions 135

Annexes 137

A Correction à la Heckman 137

B Espérance conditionnelle 139

C Le Logit Polytomique 141

D Le simulateur GHK 144

E Les dérivées premières 148

F Calculs théoriques des moments conditionnels 151

Bibliographie 160

Liste des Tableaux

4.1 Nombre de type de systèmes de chauffage de l'eau et des locaux par

. . . . . . . . . . . . . . . . . . . . . . . source d'énergie (pour cent)

4.2 Variables pour le modèle de choix de chauffage de l'eau et des locaux

4.3 Résultats de l'estimation PARTIE 1: Le modèle de choix (T=20) . . 4.4 Résultats de l'estimation: PARTIE 2: La demande d'électricité condi-

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . tionnelle

. . . . . . . . . . . . . . . . . . . . . . . . 4.5 Élasticités prix et revenu

5.6 Moments conditionnels pour rho = - 0.9 . . . . . . . . . . . . . . . . 5.7 Moments conditionnels pour rho = - 0.7 . . . . . . . . . . . . . . . . 5.8 Moments conditionnels pour rho = . 0.2 . . . . . . . . . . . . . . . . 5.9 Moments conditionnels pour rho = 0.0 . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . S 10 Moments conditionnels pour rho = 0.2

. . . . . . . . . . . . . . . . . 5.1 1 Moments conditionnels pour rho = 0.7

. . . . . . . . . . . . . . . . . 5.12 Moments conditionnels pour rho = 0.9

5.13 Résultats de l'estimation: Le modèle de choix (T=100) . . . . . . . . 5.14 Résultats de llestimation(suite): Le modèle de choix (T=100) . . . . 5.15 Résultats de l'estimation: La demande conditionnelle d'électricité . .

. . . . . . . . . . . . . . . . . . . . . . . . 5.16 Élasticités prix et revenu

Chapitre 1

Introduction

Dans le cadre de l'évaluation empirique de la demande des consommateurs à l'aide des

données micro économiques, nous nous trouvons souvent confrontés à des situations où

les choix qualitatifs (discrets) et ceux continus sont combinés. Bon nombre d'exemples

dans les problèmes économiques peuvent illustrer ce phénomène:

a Un consommateur qui doit décider d'acheter ou louer une maison (choix discret)

en même temps que la grandeur de la dite maison (choix continu);

Un consommateur qui doit décider de l'achat d'un appareil ménager fonc-

tionnant à l'électricité ou au gaz en même temps que la quantité de gaz ou

d'électricité a consommer;

Un consommateur qui doit choisir la marque d'un bien durable donné en même

temps que la quantité demandée pour celui-ci;

a Un médecin qui doit choisir la localisation de son premier endroit de pratique

ainsi que la durée de son séjour dans la contrée;

Un investisseur qui doit choisir la composition de son portefeuille ainsi que le

montant à investir;

Un individu qui doit choisir le type de couverture (couverture maximale, par-

tielle, pas de couverture) ainsi que le montant d'assurance.

Il apparah clairement que le chok discret optimal (acheter ou louer, quelle marque

du produit acheter, acheter un appareil au gaz ou à l'électricité, choix de localisation,

composition du portefeuille, type de couverture) dépend dans une certaine mesure

de la réalisation du choix continu (la grandeur de maison. la quantité de produit à

acheter, la quantité d'électricité ou de gaz à consommer, la durée de séjour, le montant

à investir, le montant d'assurance). 11 en est de même du choix continu qui n'est pas

indépendant de celui discret. De ce qui précède, les chercheurs se sont mis d'accord

sur le fait que ce genre de problème devrait être modélisé de façon simultanée. Forts

de cette évidence, ils ont formellement démontré que toute modélisation qui ignor-

erait cette interdépendance conduirait à des estirnateurs biaisés et non convergents

(King (1980), Dubin et McFadden (1984), Hanernann (1984)), ce qui entraherait des

conséquences néfastes sur le plan des prévisions des politiques.

La nature du problème considéré laisse voir que celui-ci est divisé en deux parties,

une discrète et l'autre continue. Les techniques d'estimation de chacune des deux

parties pnses séparément sont assez connues.

Pour la partie discrète, nous rencontrons différents types de modèles:

0 Selon le type de données, nous avons les modèles avec données de rang, avec

données ordonnées et les modèles avec données non ordonnées;

0 Selon le degré d'interdépendance entre les modalités, nous distinguons le modèle

Logit Polytomique (MNL) lorsqu'il y a indépendance entre les modalités de la

partie discrète, le Logit ~ m b o k é ((NMNL) pour permettre des formes relative-

ment restrictives d'interdépendances entre les modalités, la classe des modèles à

Valeurs Extrêmes Généralisées (GEV) (McFadden (1978)) qui est une classe de

modèles plus générale dont les deux premiers sont des cas particuliers, et enfin,

le Probit Polytomique (MNP) lorsque les modalités en présence admettent une

structure très générale d'interdépendances.

La partie continue, quant à elle, donne souvent Lieu à deux grands types de modèles

selon le type de variable dépendante:

a Les modèles à données limitées. Comme cas particulier, il e-xiste les modèles

de durée qui concernent une variable dépendante à caractère continu prenant

des valeurs réelles positives (durée de la période de chômage, durée d'un crédit

hypothécaire).

0 Le modèle de régression classique lorsque la variable dépendante est une variable

continue non limitée.

La clé de l'estimation des modèles de choix diçcrets/continus réside dans la prise

en compte du fait que l'estimation de la partie continue doit être effectuée en tenant

compte du choix observé dans la partie discrète. En pratique, cette estimation peut

s'effectuer de deux manières différentes:

La méthode en une étape ou a information complète; dans ce cadre, les paramètres

des parties discrètes et continues sont estimés simultanément sur base de la den-

sité conjointe des variables des deux parties.

a La méthode en deux étapes. Généralement, celle-ci consiste en l'estimation des

paramètres de la partie discrète par l'une ou l'autre des approches précitées,

puis en l'estimation de ceux de la partie continue en une deuxième étape en

tenant compte de la correction pour le biais de sélection (Heckman (1979))'

dénotant ainsi le conditionnement de la deuxième partie sur la première.

La plupart des études effectuées à ce sujet ont utilisé des modèles de choix dis-

crets plus restrictifs en termes d'interdépendances entre les modalités même si la

structure du modèle de choix laissait voir la possibilité que les modalités soient in-

terdépendantes (Dubin et McFadden (1984)). Notre étude va porter sur les cas où les

interdépendances sont admises, donnant ainsi lieu au MNP. Ce dernier est un modèle

qui comporte un certain nombre d'avantages théoriques dont:

Une grande flexibilité dans la spécification et l'usage;

La possibilité d'inclure le phénomène d'hétérogénéité entre les individus et de

permettre des interdépendances quelconques entre modalités;

a Une bonne propriété d'agrégation;

une grande utilité pour traiter les observations discrètes avec données de panel

longitudinales;

0 Une capacité à traiter les données agrégées, les données mixtes (combinaison de

données a coupes transversales et de panel).

Par contre, deux obstacles majeurs ont limité son utilisation pratique:

a La présence inévitable d'intégrales multidimensionnelles de loi normale définissant

les probabilités de choix;

Le nombre de paramètres de nuisance à estimer dans la structure de corrélation

des erreurs qui augmente de façon quadratique avec le nombre de modalités.

Les recherches effectuées aiin de résoudre ces problèmes ont donné lieu, entre

autres, à la mise sur pied de simulateurs permettant de remplacer les probabilités de

choix dans les fonctions objectives, ainsi que dans les fonctions critères intervenant

dans les scores par des simulations stochastiques faites sur le modèle non observable.

Ceci donne lieu à des méthodes telles que le maximum de vraisemblance simulée

(SML) et la méthode des moments simulés (MSM).

Dans le cadre de ce travail, nous d o n s privilégier la méthode du maximum de

vraisemblance simulée. Ce choix est basé sur les tendances récentes des chercheurs

à favoriser cette approche parce que plus simple à mettre en oeuvre: plus stable

numériquement et plus économique étant donné qu'elle ne demande que l'évaluation

de la probabilité de la modalité choisie, alors que la méthode des moments simulés

nécessite l'évaluation des probabilités de choix de toutes les modalités impliquées dans

le modèle de choix. Cette dernière méthode devient laborieuse pour des ensembles de

choix de taille importante.

Notre travail vient mettre en lumière l'ampleur de l'évolution des méthodes de

simulation en s'attaquant à l'estimation d7.m modèle de choix discrets/continus peu

restrictif en termes d'interdépendances. Cela est réalisé, premièrement, dans un cadre

du maximum de vraisemblance à information complète, question qui n'a pas été

souvent abordée compte tenu des difficultés précitées, puis dans un cadre du maximum

de vraisemblance à information limitée où l'on utilise particulièrement la méthode

basée sur la correction pour le biais de sélection, méthode qui n'a pas été abordée

dans un cadre MNP à cause de la complexité qui s'y rattache.

Tout en restant dans un cadre purement statique (coupe transversale), nous

présentons dans un premier chapitre, un aperçu des applications qui ont été faites dans

le cadre de l'estimation du maximum de vraisemblance des modèles éconornétriques de

chok discrets/continus. Dans un deuxième chapitre, nous présentons un cadre général

englobant la majorité des applications rencontrées dans la littérature. Par la suite,

nous abordons les deux méthodes principales d'estimation concernant le cas spécifique

du MNP. Dans le troisième chapitre, nous abordons l'estimation en une seule étape

des paramètres des parties discrètes et continues dans un contexte de Maximum de

Vraisemblance Simulé à Information Complète (MVSIC). Nous terminons ce chapitre

par l'évaluation empirique d'un modèle de la demande d'électricité pour les ménages

québécois conditionnelle au choix effectué panni neuf modes de chauffage de l'eau

et des locaux. Le quatrième chapitre quant à lui présente la modélisation en deux

étapes dans un cadre du Maximum de Vraisemblance à Information Limitée (MVSIL)

consistant en l'évaluation des paramètres du modèle de la partie discrète par un MNP

à l'aide de simulateurs de probabilité, pour enfin les utiliser dans l'estimation de la

demande dans la partie continue. Pour ce faire, la technique nécessite l'évaluation

de moments conditionnels simulés afin de produire un terme de correction du type

Heckman (1979) dénotant du conditionnement de la demande sur le choix effectué

dans la partie discrète. -4 l'aide d'un modèle simple à trois modalités, nous corn-

parons différents simulateurs des moments conditionnels aux vraies valeurs obtenues

par intégration numérique et choisissons le simulateur le plus approprié pour les ap-

plications. Une évaluation empirique en deux étapes est effectuée sur les données

exploitées au chapitre précédent. Finalement, un cinquième chapitre vient clore le

travail par une conclusion. Les propriétés asymptotiques des estimateurs et simula-

teurs utilisés dans ce travail peuvent être trouvés dans Gouriéroux et Monfort (1996),

Hajivassiliou et McFadden (1994). Il convient de noter que la présentation de ce

travail laisse voir qu'il y a certaines répétitions en ce qui a trait principalement aux

sections sur la présentation des données et le système économétrique discret /continu.

Ceci se justifie en ce que cette thèse a été effectuée sur base des papiers différents

constituant des ensembles à part entière et dans le souci de ne pas perdre le fil

des idées pour chaque papier, nous reproduisons certains aspects nécessaires pour la

compréhension de chacun d'entre eux.

Chapitre 2

Revue de littérature

La littérature relative à la modélisation des modèles économétriques de choix dis-

crets/continus peut être abordée de différentes façons. Nous allons, au cours de

ce chapitre, passer en revue un certain nombre de travaux en les regroupant selon

les critères évoqués dans la partie introductive à savoir la modélisation en une ou

deuu étapes, la modélisation selon les formes d'interdépendances postulées, et enfin

l'évolution dans les techniques de modélisation.

2.1 Modélisation en une étape

En ce qui concerne les études qui ont considéré le problème en une seule étape, Yervin

King (1980) s'est attardé sur la modélisation du choix du type d'habitation ainsi que

la demande des seMces pour la maison conditionnelle au choix effectué. Le choix

discret porte sur le fait d'être:

- Propriétaire;

- Locataire;

- Locataire subsidié.

Le choix continu porte sur la demande des services pour la maison. Dans ce

travail, King fait déjà état de l'importance de la prise en compte du fait que les deux

problèmes à savoir ceux de choix discret (propriétaire, locataire, locataire subsidié) et

du choix continu (la demande des services pour la maison) sont reliés contrairement

à ce qui se faisait dans les études antérieures dans le domaine. En effet, ces dernières

traitaient la partie discrète indépendamment de celle continue.

Pour chaque ménage, il définit un vecteur de réalisation tel que

où X, : est la quantité des services pour la maison lorsque le choix est la modalité

choisie est i,

1 si .i est choisie ch,: variable indicatrice telle que ch, =

O autrement. Il dénote la probabilité qu'un ménage n choisisse l'alternative i (i= propriétaire,

locataire, locataire subsidié) comme Pin et la fonction de densité de la demande des

services pour la maison f in(&), où Xi, est un vecteur à k composantes représentant

la quantité des services pour la maison lorsque le choix i est effectué.

En général la densité de la réalisation du vecteur v, à composantes v,, i = 1, -, J

pour le ménage n est:

La logvraisemblance d'un tel modèle est donnée par:

Pour estimer le modèle, il utilise les observations sur les variables Xin et c h , et

un cadre théorique pour déterminer P i n et fh. En ce qui concerne la partie discrète,

il considère une fonction d'utilitb aléatoire linéaire dans les paramètres:

où uin est un terme d'erreur normalement distribué avec moyenne O et variance a,?. - -

Il fait une hypothèse sur les composantes du vecteur ,d en posant = ;7k i gk où - I, est la moyenne et 3k .u id(0, ai), k = 1,2, ..., K.

La fonction d'utilité devient:

- OÙ &in = XinP + 'Idin.

Par ailleurs, il considère que les ménages font le choix entre les modalités 1 (pro-

priétaire) et 2 (locataire) et ils ne choisissent 3 (locataire subsidié) que loaqu'ils sont

rationnés dans l'une ou l'autre des deux autres modalités. ?\insi la probabilité que le

ménage n choisisse la modalité 1 est donnée par:

où 77, = ~2~ - Eln est de loi normde hétéroscédastique.

Pour la partie continue, à l'aide des identités de Roy, il arrive à la forme suivante:

où en - N(O, O:) avec an = 0:(1)~ + O;( 2 lw(g!y

PHn PCn ), avec ptn le prix normalisé (prix /revenu) du bien L, les préférences ayant été définies sur deux biens a savoir H

services relatifi à la maison et C consommation des biens autres que ceux relatifs à

la maison.

Les composantes de la log-vraisemblance prennent donc la forme suivante:

où Qi représente l'ensemble des individus du groupe 2 , i = 1 , 2 , 3 . Les paramètres

du modèle ont été estimés à partir d'un échantillon de 4238 ménages et tous étaient

significatifs.

Signalons que si King a réussi à estimer le modèle aussi facilement, c'est parce

que son ensemble de choix ne contenait que trois modalités. Il s'est donc permis

d'utiliser une méthode du maximum de vraisemblance à information complète. Par

ailleurs, Lz est formée de /,(Xi,) (densités non conditionnelles) au lieu de fin(&,$)

(densités conditionnelles), c'est dire que King n'avait pas réellement tenu compte de

la simultanéité dans les deux décisions. Toutefois, cette étude, a le mérite de mettre

en lumière les tenants et les aboutissants de la méthode en une étape.

2.2 Modélisation en deux étapes

Murphy et Tope1 (1985) estiment un modèle du salaire demandé par les tramilleurs

contre rémunération d'un travail avec risque de congédiement. Les deux étapes con-

sistent en:

Une première où ils estiment les probabilités de se retrouver au chômage ou pas.

Ceci est fait à partir d'une variable dichotomique telle que:

1 si l'individu n est au travail et

O si l'individu n est au chômage.

La probabilité que l'individu n soit au chômage est donnée par :

où u(B, Xi,) est une fonction de 0 et ?il, représentant les caractéristiques de l'individu.

La probabilité de travailler est donnée par 1 - P,. La log-vraisemblance de ce modèle

s'écrit:

0 La partie continue repose sur l'équation:

où

w,: salaire moyen hebdomadaire de l'individu n;

X2n : vecteur des caractéristiques affectant la productivité;

R, : proportion de la perte de revenu de travail qui sera remplacée par l'assurance

emploi.

Sous certaines conditions de régularité et certaines formes fonctionnelles (voir

Tope1 (l984)), ils obtiennent des estimateurs convergents de 8 et V(B), la matrice des

variances et des covariances, à l'aide du maximum de vraisemblance. Le problème

a été estimé facilement étant donné que la partie discrète ne comportait que deux

possibilités.

Dubin et McFadden (1984) ont travaillé sur l'un des modèles les plus intéressants

du point de vue tant théorique que pratique. Au niveau de I'estimation, une approche

en deux étapes fut utilisée.

Dans ce travail, deux types de décision sont prises:

O Une décision discrète sur le choix de types d'appareils pour le chauffage résidentiel

eu égard au type d'énergie utilisée pour leur fonctionnement. Leur modèle con-

cerne le chauffage de l'eau, de l'air et l'utilisation des climatiseurs d'air.

0 Une décision continue sur la consommation d'électricité.

l'instar de King, ils prennent en compte le fait que les deux problèmes devraient

être traités simultanément tout en ayant le mérite de considérer plusieurs modalités.

Les méthodes économétriques utilisées pour dériver les systèmes de demande sont

inspirées de Heckman (1978)' en ce qui a trait aux variables endogènes dichotomiques

et les systèmes d'équations simultanées, Lee et Trost (1978) concernant la demande

des maisons et Hausman (1979) pour ce qui touche le fait de retrouver des fonctions

d'utilité indirecte particulières à partir de systèmes économétriques de demandes par-

tielles.

Ils considèrent la fonction d'utilité suivante:

où

LIjn: utilité non observée associée au système i telle que perçue par le ménage n,

5,: caractéristiques non observées de l'alternative i,

77, : caractéristiques non observées propres au ménage n,

Pm: prix de l'électricité,

Pm: prix d'une autre forme d'énergie,

Q,: vecteur des caractéristiques socio-économiques spécifiques au ménage n,

rin = PIOP, +pPICP,: coût annuel d'opération du système i pour le ménage n,

p = po + pi yn : taux d'escompte considéré comme étant une fonction héai re du

revenu y,

PIOP,,: coût total annuel fixe d'opération dû à l'utilisation du système i,

PICP,,: coût total annuel du capital relatif à l'utilisation du système i.

Par les identités de Roy, la fonction de demande relative à la partie continue se

présente alors comme suit:

Dans une première étape, ils dérivent les probabilités qu'un ménage choisisse un

type d'appareil ménager donné. Ils postulent alors que les termes d'erreur de la

partie discrète sont indépendamment et identiquement distribués de loi Gumbel, ce

qui n'admet aucune forme d'interdépendance.

La probabilité de choisir l'alternative i est donnée par:

La deuxième étape consiste en l'estimation de la demande d'électricité condition-

nelle au choix effectué. Ils se servent de la fonction de demande suivante

6 , : variable indicatrice valant 1 si i = j et O autrement alors que i est la

modalité choisie par le ménage n,

qen : consommation totale annuelle de base d'électricité par le ménage n,

den-qen : demande d'électricité résiduelle compte tenu de l'appareil choisi à l'étape

Pour estimer le modèle ci-dessus, ils dénombrent quatre possibilités:

1. Faire les moindres canés ordinaires (MCO) sur ( 2 4 , il en résultera des estima-

teus des paramètres du modéle qui sont biaisés et non convergents.

2. Méthode des variables instrumentales:

- Estimer le modèle de choix.

- Utiliser les estimations des probabilités de choix comme variables instrumen-

tales pour remplacer bji,, dans La deuxième partie du problème.

3. Formes réduites:

Appliquer !VICO a l'équation (2.1) où les P,(i) qui sont substitués au 6 j i , s n ~ ~ n t

remplacés par les estimations P,(i) du modèle de choix de l'étape initiale.

4. Méthode avec correction basée sur les moments conditionnek.

Ils ont alors applique les M C 0 à:

où E(qli) est une composante de la correction due au biais de sélection.

Dans ce cas, ils ont trouvé que E(qli) = (Pj In Pj)/(i - Pj) + hP,. Cette étude a été faite à l'aide d'un échantillon de 3249 ménages. A pan la

première méthode, les autres produisent des estimations convergentes des paramètres

présents dans l'équation de demande (2.1).

De leur côté, Bolduc, Bernard et Bélanger (BBB) (1996) ont considéré une généralisation

du modèle précédent pour estimer la demande d'électricité au Québec conditionnelle

au choix de neuf modes de chauffage de l'eau et des locaux. Ils abordent le probkme

en deux étapes:

-Une première relative au choix du mode de chauffage;

-Une deuxième relative à la demande d'électricité conditionnelie au choix effectué.

La partie discrète utilise un MNP pour tenir compte de la présence de choix in-

terdépendants. Si le MNP s'avère le choix le plus approprié, il n'en demeure pas moins

que les problèmes de la dimension d'intégrales et celui du nombre des paramètres de

nuisance restent présents.

Pour le problème de dimension d'intégrales, des études qui prennent source en

McFadden (1989) suggèrent de remplacer ces probabilités de choix par des simula-

teurs lisses calculés à partir du modèle latent. Eu égard au problème du nombre

des paramètres de nuisance, BBB utilisent une formulation probit particulièrement

intéressante proposée par Ben-Akiva et Bolduc (1991). Celle-ci est basée sur la

présence d'un terme d'erreur supplémentaire (qu'on ajoute au modèle probit conven-

tionnel) qui est indépendamment et identiquement distribué (i.i.d.) Gumbel faisant

ainsi du MYL un cas spécial après imposition de certaines restrictions.

La structure adoptée dans BBB part d'une fonction d'utilité très proche de celle

adoptée par Dubin et McFadden (1984) mais linéaire dans les paramètres:

avec les hypothèses suivantes sur le terme d'erreur:

1. Le terme d'erreur est divisé en deux composantes

où ci est l'écart type spécifique à l'alternative i,

Jn 2. Ein = p x* wijrn Ejn + C,, avec Gin N i id N(O, 1) OÙ Mi j fn représentent des poids

j $3

et p un coefficient de corrélation et

3. vi, N Gumbel i.2.d. standardisée.

Ces hypothèses définissent un modèle YNP hybride avec des termes d'erreur

autorégressifs généralisés de premier ordre (GAR(1)) (Ben--4kiva et Bolduc ( lgg l ) ,

Bolduc (1992)).

Avec ces spécifications, la probabilité de choisir la modalité i est donnée par

( 1 , , , ? ) = eXtnfi-"m' / c exlnB+M' ln(, Mn = T,Pn1 avec Tn une matrice l€Cn

( J , x J,,) diagonale contenant les écarts types sur la diagonale principale, P, =

(IJn - pWn) et Ir, une matrice identité et W. la matrice des W i j , , . Ces hypothèses

définissent un MHP avec noyau logistique.

La partie continue a été estimée en suivant de très près l'approche de Dubin et

YcFadden (1984) à la seule différence que les formes fonctionnelles sont linéaires dans

ce cas. Ils se sont servis de la fonction de demande suivante:

d, = oi$5ii,, i al PEL, + a2POIL, + (r3 PG.427, + i

Cette équation montre bien que la quantité totale d'électricité est une fonction des

prix des dinérentes formes d'énergie et des variables représentant les caractéristiques

du ménage (Q,,) ainsi que le revenu y,. A l'instar de Dubin et McFadden (1984),

il5 ont utilisé les formes réduites et les variables instrumentales mais pas la méthode

basée sur la correction pour le biais de sélection car la dérivation des espérances

conditionnelles devient très complexe à cause de la structure de corrélation des termes

d'erreur de la partie discrète qui sont normalement distribués.

Michael Hanemanri (1984) présente une façon de formuler les modèles économétriques

de choix discrets/continus conformes avec la modélisation conjointe telle que spéciiiée

antérieurement. Pour illustrer son modèle, il l'applique au choix d'un consomma-

teur parmi un ensemble de marques d'un bien donné ainsi que la quantité (nombre

d'unités) du bien qu'il achète. Étant donné que les biens sont substituts, les gens

ne choisissent qu'une marque dans l'ensemble de choix. Le choix discret consiste en

quelle marque choisir tandis que celui continu est relatif à combien d'unités du bien

se procurer. Pour le choix des marques du bien qui varient dans les prix et les car-

actéristiques, il s'est inspiré des études théoriques de Lancaster (1979) et Yovshek et

Sonnenschein (1979). Toutefois, on constate que du point de vue technique, il s'est

limité à l'utilisation de termes d'erreur distribués selon une loi GEV.

2.3 Évolution des techniques d'estimation

Du coté purement technique, les efforts pour résoudre le problème lié à la dimension

des intégrales commencent avec la proposition de limiter la dimension des intégrales

à cinq et d'utiliser l'intégration numérique (Hausmm et Wise (1979)' Owen (1966)).

Puis s'en est suivi les approximations des intégrales. C'est ainsi que Daganzo (1979)

développe des estimateurs de maximum de vraisemblance basés sur les approximations

originales de Clark (1961). Ces dernières comportent cependant un inconvénient

majeur, celui de ne pas augmenter en précision en augmentant la taille de l'échantillon.

L'approche des simulateurs est venu révolutionner la façon d'aborder ces intégrales

multidimensionnelles. Albright, Lerman et Mançki (1977) furent les premiers à suggérer

cette méthodologie. Depuis ce temps, les simulateurs ont évolué et pour avoir une

idée de cette évolution, le travail de Hajivassiliou, McFadden et Ruud (1996) fait une

synthèse des différents simulateurs qui ont été mis au point pour évaluer les intégrales

multidimensionnelles apparaissant dans les expressions de certaines fonctions objec-

tives dont l'applicabilité était mise en cause suite aux formes non manipulables du

point de vue estimation qu'elles contenaient.

Ils ont inventorié une dizaine de simulateurs dignes d'intérêt. Ces simulateurs ont

été présentés du point de vue de leurs caractéristiques, leur applicabilité, leurs per-

formances ... On note entre autres le "Crude Frequency simulator" (CFS), le "Normal

Importance Sampling" (NIS) , le "Kernel-Smoothed Frequency" (KSF) , le "Stern's De-

composition Simulator" (SDS), le "Geweke-Hajivassiliou-Keane Simulator" (GHK), le

"Parabolic Cylinder Function Simulator" (PCF) , le "Deak's Chi-Squared Simulator"

(DCS) , le ".-2cceptance/Rejection Simulator" (.ARS), le "Gibbs Sampler Simulator"

(GSS)' le "Sequentiaily Unbiaised Simulator" (SUS) et le ".4pproximately Unbiased

Simulator" (AUS). Ces simulateurs ont généralement en commun le fait qu'ils sont des

approximations des fonctions objectives obtenues en remplaçant ces dernières par des

moyennes empiriques basées sur des valeurs simulées du terme d'erreur étant donné la

connaissance de sa fonction de distribution des probabilités. Leur travail s'est terminé

par une comparaison, pour la moins minutieuse, des différents simulateurs à l'aide

d'expériences Monte Cado sur base de la convergence, du biais, de la continuité dans

les paramètres ... Il ressort de ces comparaisons que le simulateur GHK est de loin le

plus performant et donc le plus recommandable.

A travers cette revue de littérature, on peut voir que beaucoup d'efforts ont

été consacrés à l'estimation des modèles de choix discrets/continus. Il convient,

toutefois, de signaler que très peu d'études ont été faites dans le cadre du MNP

conventionnel suite aux deux inconvénients majeurs signalés antérieurement. Par

ailleurs, l'évolution des connaissances ainsi que de la puissance des ordinateurs nous

permettent de revenir sur le problème du MNP dans ce cadre précis des choix dis-

crets/continus. Nous allons donc utiliser des simulateurs pour évaluer les probabilités

de choix de la partie discrète ainsi que des fonctions objectives dans lesquelles eues

se retrouvent et les moments conditiomek lors de l'estimation en deux étapes. Par

ailleurs des corrections aux matrices de Mnance covariance seront apportées lors de

l'estimation en deux étapes en nous inspirant des travaux de Murphy et Topel (1985).

Chapitre 3

Le cadre économétrique général

Dans ce chapitre, nous présentons, d'une façon assez générale. la structure des modèles

éconornétriques de choix discrets/continus via ses différentes composantes. La problématique

de départ est la recherche de la modélisation conjointe des deux décisions de choix à

savoir celle portant sur le choix discret et celle sur le choix continu.

Soit la fonction de densité de probabilité jointe suivante:

qui est continue en d, la fonction de demande pour n'importe laquelle des commodités

présentes dans le modèle, discrète en i, la modalité choisie par le consommateur et où

X est un vecteur des paramètres du modèle. A l'aide des propriétés des probabilités

conditionnelles, on peut réécrire la fonction ci-haut comme

où

P(ilh) est la probabilité de choisir i étant donné A,

g(dli,X) est la fonction de densité de probabilité de la demande pour une com-

modité conditionnelle au choix effectué.

L'expression (3.2) montre bien que les choix discrets et ceux continus sont tribu-

taires de la même décision de maximisation de l'utilité aléatoire. Par ailleurs, P(i, dlX)

englobe tous les cas discutés dans la partie introductive.

Une présentation systématique des cas couverts exploite la décomposition en (3.2).

Les Lignes qui suivent présentent les deux composantes de cette dernière expression.

3.1 La partie discrète (P(i1X))

Le but de cette partie est de trouver la probabilité qu'une modalité quelconque soit

sélectionnée dans l'ensemble de choix? étant donné les caractéristiques de l'individu ou

du ménage, les variables socio-économiques ainsi que tout autre facteur quantifiable

qui peut influencer le choix.

Les modèles rencontrés dans ce genre d'estimation peuvent être regroupés soit

selon le type de données à l'étude, soit selon ie degré d'interdépendance considéré.

Selon le premier type, nous observons:

Les modèles avec données de rang;

O Les modèles avec données ordonnées;

O Les modèles avec données non ordonnées.

Selon le deuxième type, nous rencontrons :

L e modèle MNL lorsque l'on postule que les modalités considérées sont indépendantes

entre elles;

O Le modèle NMNL lorsque l'on admet certaines formes d'interdépendances entre

les modalités;

0 La classe des modèles GEV qui n'est autre qu'une classe de modèles plus

générale dont les deux premiers sont des cas particuliers;

0 Le MNP lorsque l'on admet des formes très générales d'interdépendances entre

les modalités.

Notre présentation va se faire via le premier type de subdivision et le deuxième

type ne sera considéré en profondeur que lors de la présentation des données non

ordonnées.

3.1.1 Modèles pour données ordonnées

On parle de données ordonnées lorsque les données sont présentées en ordre de

grandeur. C'est le cas d'une étude qui s'intéresse à la situation où l'individu n a

fait les études secondaires, collégiales ou encore universitaires.

Soient les catégories 1, I = 1, ... , L de la variable y,, représentant le niveau d'études

de l'individu n et y: la valeur d'une variable latente continue représentant les capacités

de l'individu a effectuer des études avancées. On obsew y, = 2 (la catégorie) et non

la valeur individuelle de y:.

Le modèle latent (non observable) associé à ce problème est donné par

avec rl 5 y: 5 rl+l.

Par hypothèse, la probabilité d'observer une certaine catégorie est donnée par

qui est un probit ordonné avec @ ( a ) la fonction de distribution cumulative et si Un

Gumbel 2.i.d. , on a

qui est un logit ordonné avec A(.) la fonction de distribution cumulative.

3.1.2 Modèles pour données de rang

Pour définir les données de rang, partons d'une situation avec J modalités. i = 1: ..., J .

L'utilité procurée par l'alternative i telle que perçue par l'individu n est donnée par

où on omet l'indice n pour simplifier la notation.

Soit r,, m = 1, ..., LM, l'indice de l'alternative rangée mihe, la probabilité d'observer

Le rangement r = (rl , rzi ... ! rdM) est donnée par:

Cas particuliers

Logit rangé

Dans le cas précis qui découle de la forme particulière du Logit, la probabilité

d'observer le rangement r est donnée par

Dans ce cadre, P(T, Xlfl) est une fonction très complexe d'intégrales multidimen-

sionneiles.

3.1.3 Modèles pour données non ordonnées

Dans ce genre de modèle, les données sur la variable dépendante peuvent être définies

dans n'importe quel ordre. Pour bien cerner le problème des choix discrets dans

ce contexte, partons d'un consommateur ayant une fonction d'utilité définie sur un

vecteur de biens d = (dl , ..., d J , z). Sa fonction d'utilité peut être représentée de façon

compacte comme:

U = U(d , z),

avec z un bien composite représentant les biens autres que celui qui sera choisi et qui

est pris comme numéraire.

Par ailleurs, si pour le consommateur la fonction d'utilité est déterministe, cela

ne l'est pas pour le chercheur pour qui certaines composantes sont non obsenmbles

et qu'il traite par le fait même comme variables aléatoires. C'est ce qui donne lieu

au concept d'utilité aléatoire. Introduisons donc une composante aléatoire dam la

fonction d'utilité contenue dans un vecteur des termes d'erreur ( reflétant la variation

dans les goûts des individus dans la population et plus précisément les variables non

observées quand on parle de modèle économétrique.

Notre fonction d'utilité devient donc:

où V(d , z ) représente la partie déterministe et 5 la partie aléatoire.

Pour le consommateur1 < est un ensemble fixe et constant (ou une fonction) alors

que le chercheur le considère comme une variable aléatoire avec une fonction de densité

jointe f (El. .... E N ) et une cumulative F(ti, & , .... SN). Le choix des di optimaux représente une décision a la fois discrète et continue. La

décision discrète concerne lesquels des biens se procurer tandis que celle continue est

relative aux quantités des différents biens choisis.

Si le consommateur décide de choisir le bien i, la fonction d'utilité conditionnelle

à sa décision est donnée par:

11 s'agit de la fonction d'utilité directe conditionnelle au choix du bien i. De façon

plus compacte, nous aurons:

Le consommateur va donc maximiser (3.3) sujet à la contrainte budgétaire condi-

tionnelle pi& + z = y où y est le revenu, pi le prix du bien i et pz = 1.

La solution à ce problème donne les fonctions de demande conditionnelles:

- di =%(pi, Y,<),

et la fonction d'utilité indirecte conditionnelle est donnée par:

tandis que les identités de Roy donnent:

Pour caractériser les modèles de choix discrets, considérons la fonction d'utilité

indirecte (3.5) que nous réécrivons de façon i simplifier la notation comme

où Uin est l'utilité aléatoire procurée par la modalité i telle que perçue par le con-

sommateur n, V,, est une fonction des paramètres du modèle et &, un terme d'erreur

ayant une fonction de distribution de probabilités conjointe J ( { ) et une cumulative

F ( 0

Dans un contexte d'agent maximisant, un consommateur donné n choisira la

modalité i si celle-ci lui procure plus d'utilité comparativement aux autres. La prob-

abilité que la modalité i soit choisie est donnée par:

&(i) = prob(Qn 2 Uj,,Vj # i)

p&) = ~ o b ( K , +G 2 4, + S j , , V j # i)

pn(i) = prob(G, - Q I K, - &,, V j # 2 )

Pn(i) = jf(<)d<, 4

ou J' f (<)d< peut prendre différentes formes et donner lieu à différents modèles selon €

la distribution qui est postulée pour le terme d'erreur.

Quelques modèles dignes d'intérêt

Le logit Polytomique (MNL)

Nous obtenons ce modèle de choix discret lorsque les termes d'erreur dans l'équation

(3.6) sont indépendamment et identiquement distribués (i.i.d.) de loi Gurnbel. Alors

les probabilités de choix prennent la forme':

La difficulté avec ce modèle est qu'il est sujet au problème d'indépendance par

rapport aux alternatives non pertinentes ( H A ) . En effet, si l'on a d e w modalités 1

et i, le rapport des probabilités de choisir chacune des modalités ne dépend que des

deux alternatives en cause:

Dans un modèle logit, l'ajout ou le retrait d'alternatives ne change pas le rap-

port ci-dessus, ce qui est peu raisonnable si l'on considère que les modalités sont

interdépendantes.

La solution au problème de IL4 se trouve dans ie logit emboîté (N'VIL) et plus

généralement dans les modèles à valeurs extrêmes généralisées dont le MNL et le

NMNL sont des cas particuliers ainsi que dans le probit polytornique (MNP).

Le modèle à valeurs extremes généralisées (GEV)

McFadden (1978) décrit une forme plus générale de modèle comprenant le logit

polytomique et le logit emboîté. Elle se présente de la façon suivante2:

Soit la fonction G(y, , ...yJ) avec y,, y,, ..., y, 2 0. ( Notons que y dans ce cas est

une variable et non le revenu). Elle doit satisfaire les conditions suivantes:

1. Xon négativité : G(y,, ...,y,) 2 O pour y,, ...,yJ 2 O.

2. Homogénéité de degré 0 > 0 :

G ( c r ~ , 9 ..*3 a ~ J ) = Q ~ G ( Y , 9 .**, Y,)*

'Voir L'annexe C pour la preuve. 'McF'adden, D. (1978): "Modehg the Choice of Residential Location".

3. Condition limite: lim G(y,, ..., y,) = +DO pour i = 1, .... J . Yi -++O0

4. La dérivée lahe de G par rapport à n'importe quelle combinaison de yi, i =

1, ..., J est non négative si 1 est impair e t non positive si 1 est pair.

11 montre que si la fonction G(evl, ... eu') remplit les conditions précitées, la prob-

abilité que la modalité i soit choisie est donnée par

Gi(eul, ... eV') est la dérivée de la fonction G par rapport au @me argument.

Cas particulier: e

Le MNL: Paw ce faire, on pose G(yl , ...y,) = [i y!] avec yj = eV) et on a

Dans ce cas, on voit bien que les différents yj sont indépendants.

Le NMNL: Pour illustrer ce modèle, supposons les modalités 1, 2 et 3 cor-

respondant respectivement au choix du mode de transport par bus bleu, auto et

bus rouge. Le modèle relatif à ce problème est obtenu en posant G(yl, y2, g3) = -

+ y3kl 'l-ei + y2 avec y, = e 5 . Dans ce cas, on voit bien que les modalités 1 et L J

3 sont reliés par une certaine corrélation o et celle 2 est indépendante des deux autres.

On voit bien une flexibilité du NMNL qui permet ce genre d'interdépendances qu'on

n'observe pas dans le cas du MNL. Ainsi, on peut avoir toute sorte de probabilité:

Celle-ci est la probabilité de choisir le bus bleu qui est celle de choisir le bus (1'3)

dans tout l'ensemble (1,2,3) multipliée par celle de choisir le bus bleu dans l'ensemble

des bus (1,3). La probabilité de choisir le bus rouge est donnée par

tandis que celle de choisir l'auto par:

Le probit polytomique (MNP)

Pour définir le modèle probit polytomique, nous allons considérer le cas d'un

consommateur n(n = 1. ..., iV) qui choisit la modalité i qui lui procure la plus grande

utilité dans un ensemble de choix C = 1, ..., J comprenant J possibilités. Dans un

contexte d'agent optimisant, l'individu n choisira la modalité ayant la plus grande

probabilité de réalisation. Autrement dit, l'individu n choisira la modalité z si (U& 2

U&,V j E C, j # i), ce qui est équivalent à (U; - U$ 5 O, V j E Cl j # i). Pour

cette raison, les modèles de choix sont souvent estimés en déviation par rapport à une

modalité donnée. Plus bas, nous utiliserons la dernière modalité comme référence.

En supposant une forme linéaire pour l'utilité, nous avons:

où:

Uk: une variable aléatoire représentant l'utilité de la modalité i telle que perçue

par l'individu n,

XI;: un vecteur (1 x K) de variables explicatives caractérisant la modalité i et

l'individu n,

8: un vecteur (K x 1) de paramètres fixes considéré comme étant le même pour

chaque individu,

6: un terme d'erreur aléatoire de loi normale, de moyenne nulle qui admet

la corrélation avec les erreurs des autres modalités auxquelles est confronté

l'individu.

Pour fins d'estimation, le modèle MNP est souvent écrit en déviation par rapport

a une modaiité (voir Bolduc (1999)). Le modèle de choix en déviation par rapport à

l'utilité correspondant à la dernière modalité peut s'écrire:

- UJn = (XI: - XJn)0 + <:' - <in, i E Cl i # J.

Cette dernière expression peut être alternativement réécrite comme:

où m = J - 1, ,Y,@ représente la partie déterministe du modèle et un terme

d'erreur, les deux exprimés en déviation par rapport à la dernière modalité. Par

commodité, réécrivons aussi X,,P comme K,. En notation vectorielle, nous avons:

où en .V N(0, C). À l'aide de la décomposition de Cholesky pour le terme d'erreur, le

modèle peut être réécrit comme

où S est une matrice (m x m) triangulaire inférieure de Cholesky, telle que C = SS'.

La probabilité de choisir la modalité J va s'écrire comme suit:

Notons que la probabilité de choisir la modalité J peut être vue comme la proba-

bilité de l'intersection de m événements interdépendants:

Cette probabilité prend la forme d'une intégrale de dimension rn = J - 1.

où n(.) désigne ici une densité conjointe normale multidimensionnelle avec moyenne

nulle et matrice des variances covariances C.

Si le MNP constitue la manière la plus appropriée pour approcher les proba-

bilités de choix lorsque la structure du modèle laisse croire que les modalités sont

interdépendantes, son utilisation souléve des difficultés à cause des intégrales multi-

dimensionnelles.

3.2 La partie continue

La partie continue est représentée par la forme générale g(dl i , O ) qui peut être con-

stituée de deux grands groupes:

a) Modèles de régression lorsque nous avons des variables continues limitées. Pour

l'estimation, on envisage don les MCO, MCG ou toute autre méthode a propriétés

désirables.

b) Modèles à données limitées: comme exemple, les modèles de durées sont em-

ployés lorsque les variables représentent une durée entre deux évènements. Les lois

suivantes sont souvent postulées pour la variable de durée:

- Exponentielle avec f ( s ) = ye-7C, F 2 0;

- Weibull avec j(<) = akb-'e-acb a et b étant deux paramètres;

- LognormaJe avec f(<) = f 9 (e) avec (F) .- N(o , 1).

Chapitre 4

Estimation économétrique:

Méthode d'estimation en une étape

(Maximum de Vraisemblance à

Informat ion Complète)

4.1 Cadre théorique

Dans cette partie du travail, nous présentons une façon assez générale d'estimer

simultanément les parambtres de la partie discrkte et celle continue des modèles

économétriques de choix discrets/contious. Il s'agit d'écrire la distribution conjointe

des variables aléatoires impliquées dans les deux parties considérées et de maximiser

la log-vraisemblance complète.

Considérons la fonction de densité de probabilité suivante:

P(im LI&; A) (4.12)

qui est continue en d, la fonction de demande pour n'importe laquelle des commodités

(bien, service) et discrète en in la modalité choisie par le consommateur n et où H, est

le vecteur contenant les variables exogènes du modèle et X le vecteur des paramètres

du modèle.

a l'aide des propriétés des probabilités conditionnelles, nous pouvons décomposer

1'e.xpression (4.12) en

ou alternativement en

avec

O P(I, /Ifn; A) est la probabilité de choisir i étant donné H,,,

O g(&ii,, H,; A) est la fonction de densité de probabilité caractéris ant la d emande

dn, conditionnelle au choix effectué par le consommateur pour une commodité

donnée faisant partie de l'ensemble de choix,

a P (in 1 cin: Hn; A ) est la probabilité de choisir i étant donné la demande d'élect~cité,

g(&j H,; A) est la demande non conditionnelle.

La méthode d'estimation qui se prête bien A ce genre de modéles est celle du

maximum de vraisemblance. La fonction de vraisemblance du modèle est de la forme

dors que la log-vraisemblance s'écrit

Cette approche est équivalente à celle décrite par Hanernann (1984) dans le cadre

de l'évaluation de la demande des marques d'un produit avec la fonction de distribu-

tion de d, qui est la consommation observée de la marque i qui a été sélectionnée par

l'individu n lors de son problème de maximisation et P(i, j Hn; A) la probabilité que

la marque i soit sélectionnée dans un ensemble donné. Pour l'estimation, par con-

tre. comme le dit Hanemann dans son article, une estimation de tous !os paramètres

du modèle par le maximum de vraisemblance B information complete s'avère très

complexe, surtout dû au fait que tant P(i,) que g(dnJin) comportent des intégrales

multidimensionnelles (voir section sur le MXP). C'est ce qui l'a amené a préconiser

une méthode en deux étapes.

En effet, une difficulté particulière reliée à l'approche du FIML telle que décrite

ci-haut est de dériver la fonction de distribution conditionnelle (demande condition-

nelle) au choix effectué dans la partie discrète. Une façon alternative d'aborder le

problème, compatible avec la simultanéité dans les décisions discrètes et celles con-

tinues, est de considérer une décomposition de la loi conjointe P(in, &) plus pratique

que la précédente. II s'agit, en fait, d'exploiter la forme P(in l&) .g(dn). Revenant à

la situation initiale, le modèle s'écrit comme:

où la première relation décrit l'utilité, les U'n étant des utilités en dS6rence par

rapport a celle qui est choisie (i) (U& = Li;;, - U&) dors que la deuxième est relative

à la demande d'électricité du ménage et

La contribution à la vraisemblance, pour toute modalité, lorsque la modalité i a

été choisie, est donnée par:

p ( K <O,&). (4.15)

La loi des latentes relative à cette formulation est donnée par:

En conditionnant, l'expression (4.15) peut s'écrire comme

ou alternativement

Il convient de noter que la relation (4.16) est équivalente à celle qui a été décrite

en premier lieu dans cette partie du travail et correspond à celle préconisée par Hane-

mann (1984) et dont une des composantes n'est pas facile ê. dériver comme signalé

antérieurement. La deuxième relation (4.17) peut amener à des expressions qui sont

relativement faciles à obtenir connaissant la loi conjointe de l'utilité et de la demande.

En effet, sachant que

on obtient directement

Les deux composantes de l'équation (4.17) peuvent être réécrites comme suit:

Dans le cas simple (dichotomique), P(U; 5 014) peut prendre la forme suivante:

Avec ces expressions, nous pouvons finalement écrire

alors que la formulation générale nous amène à:

Cette formulation nous permet l'utilisation du simulateur GHK pour l'évaluer au

même titre que nous le faisons pour les probabilités de choix marginales.

À partir de cette formulation, nous pouvons méme définir un modèle conditionnel

en utilisant la transformation suivante:

où < = TV avec FI'' = Cu, - O ~ ~ O ~ ~ O ~ , et u - N ( 0 , I ) . Avec cette transformation,

nous pouvons écrire:

Les deux façons de spécifier la loi conjointe constituent la clé permettant d'aborder

l'estimation des modèles économétriques de choix discrets/continus dans un contexte

du maximum de vraisemblance à information complète. Toutefois, ces équations,

dans le cas particulier où les termes d'erreur dans la fonction d'utilité aléatoire sont

normalement distribués, donnent lieu à des fonctions de vraisemblance qui ne sont

pas facilement manipulables. C'est pourquoi les chercheurs ont souvent évité cette

procédure en une étape lorsque les équations devenaient complexes. De nos jours, les

ordinateurs étant plus puissants et les techniques de simulation ayant évolué, nous

pouvons nous permettre d'aborder ces problèmes. Nous d o n s donc parler d'une

méthode de vraisemblance simulée à information complète.

Il convient de noter que l'on pourrait tout autant utiliser la méthode des moments

simulés sauf que cela aurait nécessité la simulation de toutes les probabilités de choix

impliquées dans l'ensemble de choix alors que le maximum de vraisemblance ne re

quiert que la simulation de la probabilité pour l'alternative choisie. Pour des grands

ensembles de choix. il devient clair que le maximum de vraisemblance est préférable

à la méthode des moments.

Enfin, si la méthode en une seule étape nous permet d'estimer simultanément les

paramètres qui entrent d m les composantes discrete et continue, il n'en demeure

pas moins que certains chercheurs argumentent qu'en raison de cette simultanéité de

traitement, une erreur de spécification sur l'une ou l'autre des deux parties aura des

répercussions sur les propriétés des estimateurs de tous les paramètres. Par contre,

dans un contexte d'estimation en deux étapes, une erreur sur une des parties lors de

l'application de la méthode est limitée à l'étape en question. Cet aspect de robustesse

prêche souvent en faveur des méthodes à étapes. Le gain de la modélisation simultanée

des deux composantes est clairement celui de l'efficacité.

4.2 Évaluation empirique: Estimation

d'un modèle discret /continu de

une étape

demande

d'électricité dans le secteur résidentiel québécois.

4.2.1 Introduction

Depuis le travail de Dubin et McFadden (l984), la demande d'électricité est explicite-

ment considérée comme le résultat d'une décision conjointe sur le choix des appareils

ménagers en fonction de la forme d'énergie utilisée pour leur fonctionnement et la con-

sommation d'électricité par les dits appareils. Ils sont convaincus, à juste titre, que

toute modélisation qui ignorerait le fait que les deux décisions sont interdépendantes

conduirait a des estimateurs et des élasticités prix et revenu biaisés et non convergents.

Dans leur travail, le choix entre les appareils était modélisé à l'aide d'un modble MNL.

L'estimation du modèle discret/continu a été faite à l'aide d'une approche en deux

étapes où une correction du type Heckman a été faite pour assurer des estimateurs

convergents. BBB ont fait une extension de l'approche de Dubin et McFadden en

permettant une structure peu restrictive lors de la modélisation de la partie discréte

B l'aide d'une formulation MNP. Le MNP est réputé être la formule recommandée

lorsque les alternatives sont interdépendantes entre elles.

Dans BBB (1996)' parmi les neuf modes de chauffage de l'eau et des locaux con-

sidérés, la présonce des interdépendances était évidente et le processus d'estimation

devait en tenir compte sous peine de donner lieu à des estirnateurs non convergents.

La présence des interdépendances entre les modalités a été introduite dans le modele

via la structure de corrélation des termes d'erreur normalement distribués. Pour

l'estimation, une méthode en deux étapes a été utilisée. La dimension discrète a été

modélisée à l'aide du maximum de vraisemblance simulé où les probabilités de choix

probit ont été remplacées par des simulateurs efficients. La deuxième étape a été

estimée à l'aide d'une régression instrumentale linéaire de façon à tenir compte de la

simultanéité dans les deux décisions.

La contribution du présent chapitre est d'estimer le modèle considéré dans BBB

à l'aide d'une approche du maximum de vraisemblance à information complète. Les

formes fonctionnelles ainsi que la spécification du modèle suivent de très près l'étude

de Dubin et McFadden (1984). En effet, les fonctions de demande conditionnelles

d'électricité sont linéaires dans les prix et proviennent de l'application des identités

de Roy à une fonction d'utilité indirecte non linéaire spécifique. À notre connaissance,

cette étude constitue la première estimation d'un modèle discret/continu dans le cadre

du maximum de vraisemblance à information complète où la dimension discrète est

décrite à l'aide d'une spécification MNP non linéaire. Nous appliquons cette formu-

lation pour modéliser la demande d'électricité dans le secteur résidentiel québécois

étant donné le système de chauffage de l'eau et des locaux dans l'habitation.

Dans la province de Québec, il existe une vaste gamme de sources d'énergie pour

le chauffage de l'eau et des locaux. En 1989, 64% des ménages utilisaient l'électricité

pour le chauffage des locaux, alors que 16% utiiisaient le mazout, 7% le gaz naturel,

6% la bi-énergie (électricité/rnazout ou électricité/bois), et 6% d'autres sources et

principalement le bois. L'électricité, le gaz naturel et le mazout sont aussi utilisés

dans le chauffage de l'eau. Durant les vingt dernières années, le Québec a observé le

délaissement du mazout en faveur de l'électricité. La popularité de l'électricité a été

acquise aux dépens exclusivement du mazout alors que les autres sources d'énergie

ont gardé les mêmes parts. Il y a aussi une utilisation significative de la &énergie:

électricité/mazout ou électricité/bois. Étant donné la part importante de l'électricité

dans le chauffage de l'eau et des locaux, il appardt important de voir si les phénomènes

observés peuvent être expliqués ai termes des variables économiques de base comme

les prix relatifs, le revenu et les caractéristiques des ménages.

Dans la section suivante, à l'instar de Dubin et McFadden (1984), nous présentons

un modèle de la demande d'électricité compatible avec le choix discret des appareils

en fonction de l'énergie qu'ils utilisent pour leur fonctionnement. Par la suite, le

modèle économétrique relatif au système discret/continu étudié est dérivé. Dans le

cadre de l'analyse empirique proprement dite, les estimations des élasticités prix et

revenu de long terme et de court terme sont obtenues à l'aide de l'approche conjointe

stipulée ci-haut. Les résultats sont comparés à ceux obtenus dans BBB à l'aide d'une

méthode en deux étapes et ils sont semblables. Par ailleurs, les résultats sont très

proches de nos attentes.

4.2.2 Le système économétrique discret /continu

La modélisation d'un système discret/continu part du problème d'un agent n(n =

1, .... iV) qui est appelé à prendre une décision sur le chok d'un mode de chauffage de

l'eau et des locaux dans un ensemble de choix comportant neuf modalités en même

temps que la quantité d'électricité à consommer. Techniquement, cela suppose la

description de la réalisation de (i, d ) où i représente un mode de chauffage de l'eau et

des locaux donné panni l'ensemble de J, possibilités disponibles à n individus et où

d est la demande d'électricité.

Comme on peut le comprendre, chaque ménage a un ensemble de choix qui lui

est propre et dont le nombre d'éléments est J,. Nous permettons cette possibilité de

telle sorte que nous prenions en compte le fait que le gaz naturel n'est pas disponible

dans tous les ménages que nous étudions.

Étant donné que le choix i et la quantité d'électricité consommée dépendent des

mêmes facteurs, il devient important de modéliser les deux de façon simultanée. Une

méthode de vraisemblance à information complhte permettra de déterminer A', le

vecteur des paramètres du modèle qui va maximiser la densité jointe P(i, dlX) associée

a (2, d). Soit in la modalité choisie par le ménage n et soit d, sa demande d'électricité.

L'approche du maximum de vraisemblance à information complète peut être faite en

spécifiant une forme pour la fonction de densité jointe:

qui est continue en d, ( la demande d'électricité), discrète en in et où

Hn est un vecteur de variables exogènes, et

X un vecteur des paramètres à estimer.

.k l'aide des propriétés des probabilités conditionnelles, nous pouvons aussi écrire

la fonction de densité jointe comme un produit d'une probabilité et une fonction de

densité conditionnelle. Nous obtenons:

où

P(i , 1 H,; A) est la probabilité de choisir i étant donné Hn,

g(&lin, H,,; A) est la fonction de densité de la demande d'électricité conditionnelle

au mode de chauffage sélectionné.

Dans le but de maintenir une certaine cohérence entre les décisions sur le choix des

appareils de chauffage en fonction de la forme d'énergie qu'ils utilisent et celle continue

sur la décision de leur usage, nous dérivons la fonction de demande d'électricité a

l'aide des identités de Roy appliquées a la fonction d'utilité relative à chaque mode

de chaufFage. À 1Ynsta.r de Dubin et McF'adden (1984), dans le but d'obtenir des

demandes linéaires dans les prix et le revenu, nous spécifions la fonction d'utilité

indirecte comme suit:

Ut\: utilité non observée associée au système i telle que perçue par l'agent n,

Pm: prix de l'électricité,

P,: prix du gaz naturel,

Pm,: prix du mazout,

y, - r;n: le revenu net du coût annuel d'achat et d'opération du système i par le

ménage n,

Q,: le vecteur des caractéristiques du ménage,

y: un vecteur des paramètres.

Côté notation, nous avons ajouté une étoile à ri,, ce qui nous permettra de définir

plus loin des coûts des systèmes en relation avec un système de référence. Comme

dans Dubin et McFadden (l984), le coût annuel est défini comme:

où

p = p, + p, y,: est le taux d'escompte supposé linéaire dans le revenu,

PIO&: le coût annuel d'opération imputable à l'utilisation du système i dans le

ménage n, lequel est exogène étant donné qu'il est calculé comme un produit du prix

de l'énergie et de la demande de celle-ci calculée en fonction des caractéristiques d'un

ménage typique.

PICPin: le coût annuel du capital pour le système considéré.

Pour les détails sur les deux quantités précédentes voir Bélanger (1992). Les autres

termes nécessitent une discussion plus poussée. C'est le cas de q,, qui est un terme

d'erreur spécifique au ménage n alors que <:n est un terme d'erreur qui varie avec les

alternatives et les ménages. Dans Dubin e t McFadden (1984), les c,, sont supposés

distribués de Loi Gumbell i.i.d, e t cela donne lieu au MNL. Comme mentionné, pour

plus de flexibilité nous avons postulé une distribution normale multivariée pour les

termes d'erreur t:n, i = 1, ..., Jn. D'autres détails sur les hypothèses des termes

d'erreur sont présentées dam les lignes qui suivent. Finalement, notons que les CE;

jouent le rôle des constantes spécifiques aux modalités.

De façon plus simplifiée, nous posons:

qui nous permet de réécrire la fonction d'utilité indirecte comme:

U& = iS;n,3 + 6(yn - rin) + G] e-"." i &:. (4.22)

Appliquant les identités de Roy, nous obtenons la demande conditionnelle d'électricité:

Dans les lignes qui suivent nous présentons une discussion plus détaillée de chacune

des deux dimensions du problème.

4.2.3 Le modèle de choix

.4fin de tenir compte des interdépendances entre les modalités présentes dans notre

modèle, la partie discrète que nous présentons utilise une formulation probit poly-

tomique. Pour un ménage donné n, n = 1, ..., N , et une modalité i, i = 1, ..., Jn où

J,, est le nombre de modalités dans l'ensemble de choix C,, nous pouvons écrire le

modèle comme suit:

1 si U& 2 U& pour j = 1, ..., J,, et chi, =

( O autrement,

où ch, est Le choix observé et UA est l'utilité procurée par la modalité i telle que

perçue par le ménage n et telle que définie dans l'équation(4.22).

Réécrivant le modble sous forme vectorielle et supposant que chacun des ménages

considérés a accès à tous les neuf modes de chauffage, nous obtenons:

où [1; = [&: ..., {in] - N ( 0 , C ) et où C est la matrice de wriancecovariance décrivant

la structure d'interdépendances entre les utilités. Dans le but de réduire le nom-

bre de paramètres de nuisance lors de l'estimation des éléments de C: nous faisons

l'hypothèse que les (i proviennent d'un processus autoregréssif généraiisé d'ordre 1

(GAR(1)) (voir Ben-Akiva et Bolduc (1991) et Bolduc (1992)). Cette hypothése a

été utilisée dans BBB (1996) et elle s'avère tri% utile car elle réduit de beaucoup les

difficultés de calcul lors de l'estimation du modèle. Par ailleurs, il est connu que

certaines restrictions d'identification devraient être imposées pour que les paramètres

de la partie discrète soient estimables. En règle générale, les paramètres qui peuvent

être estimés sont ceux présents dans une version du modèle écrite en déviation par

rapport à une modalité donnée. De plus, pour fixer l'échelle, une variance doit être

maintenue ii une certaine valeur. Par convention, nous prenons le modèle en déviation

par rapport à la dernière modalité J. Le modèle en déviation s'écrit:

OÙ les variables Uinl Xint Tivn et & , sont en déviation.

Pour estimer les paramètres dans cette dernière équation par la méthode du max-

imum de vraisemblance, nous avons besoin de calculer la probabilité Pn(i) associée à

l'alternative i sélectionnée. Prenant la dernière modalité comme référence, un ménage

donné choisira l'alternative J si Ui, < UJn Vi, ce qui implique que:

pour tout i, i = 1. ..., 8. Pour évaluer cette probabilité de choix, nous devons calculer

des intégrales normales de dimension 8. Ceci ne peut pas être fait de façon numérique.

Étant donné ces difficultés, nous suggérons le remplacement de P.(J) par le simu-

lateur de Geweke, Hajivassiliou et Keane (GHK) que nous écrivons comme Fn(~). Comme stipulé dans L'annexe D? ce simulateur peut être calculé comme une moyenne

empirique prise sur T tirages différents des ci,n:

où &,( J) est calculé à l'aide de produits des fonctions de densité cumulatives calculées

de façon bien précise. (Voir Bolduc (1999) pour détails)

4.2.4 Le modèle de demande conditionnelle

Étant donné la fonction d'utilité dans l'équation (4.22), nous dérivons la demande

d'électricité conditionnelle au système choisi à l'aide des identités de Roy. Laissant

tomber l'indice n par simplification de la notation et dénotant la demande d'électricité

par d, nous obtenons:

Sachant que

au ae - = [a, - &(a8 + - + a.Pe + u,Pg + amPm + Qty + 6(y - r i ) + ?)] ëJPe ape 6

considérant g dans ri camrne exogènes, la fonction de demande devient:

Tenant compte du fait que certaines caractéristiques sont spécifiques à la demande

(les facteurs qui n'apparaissent pas dans la fonction d'utilité), nous introduisons un

terme supplémentaire ZiO. Ré-introduisant l'indice n, nous obtenons finalement:

qui peut être réécrit de façon plus compacte comme:

où, une fois de plus, in représente la modalité sélectionnée par le ménage n.

4.2.5 Estimation du modèle discret /continu

Comme mentionné précédemment, la probabilité de choix va être remplacée par

un simulateur. Ceci implique l'usage de F,., (in) .g(d,, lin, H,, A) en remplacement de

P(in 1 H,; A) g(& lin, H,; A) dans un contexte du maximum de vraisemblance simulé.

Sachant que:

où in est la modalité choisie et qn - N (0, g), nous avons:

où p(.) est la densité de probabilité d'une variable normale standard. La sélection de

la variable indicée in à inclure dans g(d,J-) fait ressortir l'aspect conditionnel de la

demande. La distribution jointe simulée à l'aide du GHK est donnée par:

et la fonction de vraisemblance simulée est:

Ceci nous amène a la fonction de log-vraisemblance simulée suivante:

La fonction de vraisemblance dérivée dans cette partie du tramil ne fait pas état

de la corrélation entre la partie discrète et celle continue de façon explicite. C'est ce

qui nous amène à croire qu'elle suppose l'indépendance entre le terme d'erreur q et

le vecteur 5. Dans le cadre de cette thèse, nous allons nous en tenir à la formulation

telle que présentée dans cette section, ce qui n'altère pas la méthodologie utilisée mais

pour des considérations futures, nous dons utiliser la formulation (4.17). Les calculs

relatifs aux dérivées premières apparaissent à l'annexe E.

4.2.6 Données et spécification du modèle

Les données utilisées dans la présente étude proviennent d'une enquête postale faite

par Hydro-Québec en 1989 sur la consommation d'électricité. Pour l'estimation,

nous avons utilisé la même banque de données que BBB (1996). Le taux de réponse

à ce questionnaire était de 44.9% alors que 45833 ménages ont répondu sur un total

de 101977 questionnaires envoyés. Le sous-échantillon sélectionné pour cette étude

était composé de maisons unifamiliales (détachées, semi-détachées ou en rang avec

entrées séparées), qui étaient soit construites ou converties à une autre source d'énergie

de chauffage de locaux durant la période allant de 1986 à 1989. Celles-ci étaient

des restrictions imposées pour avoir une période où les prix des différentes sources

d'énergie étaient relativement stables après la chute du prix du mazout en 1986 et

aussi pour avoir un échantillon homogène. L'échantillon retenu est composé de 3090

observations.

Le questionnaire comprenait outre l'information sur les caractéristiques des ménages,

celle sur les variables socio-économiques. L'information sur la consommation a été

obtenue de Hydro-Québec, alors que les données sur les prix utilisés dans le calcul des

coûts d'usage et de capital des systémes de chauffage de l'eau et des locaux ont été

recueillies du gouvernement de Québec (1992). La disponibilité en gaz pour chacun

des ménages a été déterminée sur base du code postal e t de l'information recueillie

auprés de Gaz Métropolitain. Les valeurs et détails sur les calculs des coûts de capital

et d'opération se retrouvent dans Bélanger (1992).

Pour aider le lecteur à comprendre la collecte des données, nous reproduisons les

tableaux 1 et 2 de BBB (1996) qui donnent une bonne description des statistiques

relatives à l'échantillon que nous considérons.

Du tableau 1, on peut constater que 80% des ménages dans l'échantillon utilisent

l'électricité cornme unique source d'énergie pour chauffer et l'eau et les locaux. Sur

les 18 combinaisons possibles, 9 systemes ont été retenus. Le tableau 2 quant à lui

montre la répartition actuelle entre les 9 systèmes de chauffage ainsi que la description

des variables explicatives, leurs noms et leurs moyennes échantillonales.

Tableau 1.1: Nombre de type de systèmes de chauffage de l'eau et des locaux par source d'énergie (pour cent)

Chauffage des locaux Chauffage de l'eau Gaz naturel Mazout Electricité Totai

Gaz naturel 32 - 13 45

Mazout

Électricité

Bois

Total

SOURCE: Bernard, Bolduc and Bélanger (1996)

Tableau 4.2: Variables pour le modèle de choix de chauffage de l'eau et des locaux

Variables Nom Moyenne échantillonale

Options (Locaux-Eau) Gaz/gaz 1 0.010 Gazlélectricité 2 0.004 Bi-énergie/mazout 3 0.024 Bi-énergie/électricité 4 0.072 Yazout/mazout 5 0.005 Mazout/électricité 6 0.007 Électricité/électricité 7 0.801 Bois/électricité 8 0.050 Bois-électricité/électricité 9 0.028

Secteur SECT Rural 0.254 Peu urbain 0.103 Urbain 0.031 Haute densité 0.622

Degrés-j ours de chauffage HDD 4844.0 Année de conversion (1986-9) DATCONV 1987.1 Année de construction (1920-89) DATCON 1977.4 Xombre de personnes par ménage NBPERS 3.09 Surface (pieds carrés) SURF 1656.5 Âge du chef de famille AGE 42.1 Revenu du ménage ($) Y 42536.4 Coût d'opération annuel ($) PIOP 1394.9 Coût fixe annuel ($) PICP 392.2 Coût 6xe annuels revenu (lo3 x s2) fICPY 1744.9

SOURCE: Bernard, Bolduc and Bélanger (1996)

Spécification du modèle

Tel qu'il a été fait mention précédemment, pour fins d'identification, une alternative

devrait être considérée comme base et les autres prises en déviation par rapport à

elle. Yous considérons l'dternative 1 (gaz/gaz) comme base. Ainsi, tous les effets sont

modélisés relativement à celle-ci. Comme stipulé dans la notation antérieurement, cer-

taines vanables (Xi,, y, et ri*) apparaissent aussi bien dans la partie discrète que celle

continue, certaines d'autres (&,) dans la partie continue seulement. D'autres vari-

ables étaient exclues de certains groupes spécifiques sur base des statistiques basées

sur le ratio de vraisemblance. En ce qui concerne la structure de corrélation des

termes d'erreur du probit, nous avons utilisé la même spécification que BBB (1996).

Sans entrer dans les détails sur le processus GAR(1), pour les besoins de notre

étude, il suffit de signaler que ce processus nous a permis de représenter notre struc-

ture de variance covariance I'aide de quelques paramètres supplémentaires. Ces

paramètres sont 01, O;! et p. Le paramètre ol est un coefficient d'échelle qui est com-

mun a toutes les alternatives qui ont en commun l'électricité comme source d'énergie

dans l'une des composantes du système, oz est un effet d'échelle relatif aux alterna-

tives qui ont le bois comme une des sources d'énergie. Finalement, le coefficient p est

un paramètre de corrélation capturant les similarités entre les alternatives. Avec un

p positif, les alternatives sont considérées comme similaires alors qu'un p négatif im-

plique des dissimilarités. Parmi les paramètres de nuisance? o est l'écart type associé

avec le terme d'erreur 7,.

4.2.7 Résultats de l'estimation

Le tableau 3 contient les résultats de l'estimation de la partie discrète ainsi que celle

de l'équation de la demande d'électricité. La convention que nous avons adoptée pour

lire le tableau veut que NOM q indique que la Mnable nom a un effet identique sur

les alternatives x et y. Les effets spécifiques à une seule alternative ont seulement

une valeur simple x. Il faut aussi noter que le mot générique veut dire que la variable

est relative à toutes les alternatives, même celle considérée comme la base. Xotons

que l'estimation a été faite à l'aide du maximum de vraisemblance simulé via le

simulateur GHK basé sur 20 tirages. D'autres estimations basées sur plus de tirages

ont été faites mais les résultats étaient similaires. Nous présentons l'interprétation

des résultats obtenus.

Tableau 4.3: Résultats de l'estimation PARTIE 1: Le modèle de choix iT=20)

UTILITE DETERMINISTE Variables explicatives Nom Effet Estimations Ec.type stat-t

Ga,z/éIectricité Bi-énergielmazout Bi-éaergielélectricité Mazout/mazout Mazout/électricité Électricité/électricité Bois/électricité ois-Électricité/électricité Secteur

Degrés-jours de chauffage hddm34 3 et 4 -0.0101 0.0025 -4.058 hddm7 7 -0.2560 0.0448 -5.7713 hddm89 8 et 9 -0.0042 0.0021 -1.977

COMPOSANTES NON-LINÉAIRES d 0.0495 0.0078 6.328

Po 0.3820 0.0639 5.9'74 Pi -0.0790 0.0115 -6.863

STRUCTURE DE COVARIANCE DU TERME D'EKREWR 01 0.0187 0.0038 4.931 0 2 0.0056 0.0010 5.582 P 0.093 0.1440 0.646

Le modèle de choix

Les constantes spécifiques aux alternatives révèlent que tous les systèmes sont préférés

à l'option gaz/gaz avec l'option 7 (électricité/électricité) comme la plus prisée. Les

résultats laissent voir que plus une option renferme de l'électricité comme source

d'énergie, plus elle sera préférée aux autres en contenant moins. Si l'on considère

les options qui partagent le même système de chauffage de l'eau ou des locaux,

celle faisant plus appel à l'électricité est préférée aux autres. C'est le cas de Bi-

énergie/ électricité (0.0605) qui est préférée à Bi-énergie/mazout (0.0603) ; Bois-électricité

/électricité (0.0227) qui est préférée à Bois/électricité. Ceci correspond bien aux con-

clusions de BBB (1996).

Secteur: Les estimations des paramètres associés la densité de la population

sont négatifs, montrant une préférence marquée pour l'option gaz/gaz. Cela peut

trouver son explication dans le fait que la distribution du gaz naturel est princi-

palement développée dans le milieu urbain où la densité de la population est élevée.

Cette variable est représentée par des valeurs numériques augmentant avec la den-

sité de la population (rural:l, peu urbain:2, urbain:3, haute densitk4). Il ressort de

ces constatations qu'une augmentation de la densité de la population entraîne une

augmentation de la préférence pour l'option gaz/gaz.

Degrés-jours de chauffage: Cette variable décrit les effets du temps sur le choix

du système de chauffage. En se rappelant que les systèmes de chauffage électriques

ont des coûts de capital relativement faibles mais des coûts d'opération élevés alors

que les autres systèmes ont des coûts de capital relativement élevés contrairement

aux coûts d'opération, on peut dire que les valeurs négatives obtenues pour toutes les

variables de degrés-jours de chauffage signifient que plus il fait froid, plus on préfere

utiliser l'option gaz/gaz.

6, p, et p, : Une différence importante entre le travail de BBB (1996) et le nôtre

est l'utilisation d'une spécification non-linéaire pour la description des systèmes de

Tableau 4.4: Résultats de l'estimation: P-4RTIE 2: La demande d'électricité conditionnelle -

PARTIE CONTINUE Variables Explicatives Xom Estimations Ec. type stat-t

Gaz /électricité const 2 -0.0101 0.0046 Bi-énergie/mazout Bi-énergie/électricité Yazout/mazout Y azout/électricité Électricité/électricité Bois/électricité ois-Électricité/électricité Prix de l'Électricité Prix de l'Électricité pour les locaux Prix de l'Électricité pour l'eau Prix du Mazout Prix du Gaz Secteur degres-jours de chauffage Date de Conversion Type d'habitation Date de construction Nombre de Pièces Nombre de Personnes Ownrent Surface Âge Disponibilité du Gaz

const3 const4 const 5 const6 const? const8 constg privelbo peleloc peleeau prixmaz prixgaz secteur hddm

datconv nhabi datcon npiec npers nprlo s u r f

age gasava

ECART TYPE SIGMA 0.821 0.0042 199.216

chauffage de l'eau et des locaux. Notre spécification est identique à celle utilisée par

Dubin et McFadden (1984). Il est intéressant de noter que les estimations que ces

auteurs ont obtenues pour 6, ,O, et pl sont comparables à celles que nous avons eues

dans le cadre de cette étude. La valeur estimée négative de pi implique que le taux

d'escompte diminue avec le revenu.

La demande d'électricite

Pour mesurer 4, nous avons utilisé la quantité totale d'électricité en kWh consommés

par un ménage donné. Pour des raisons de commodité, nous reprenons les estimations

des constantes spécifiques aux alternatives que nous avions présentées lors de la partie

discrète. Il convient de rappeler que les constantes ai apparaissent dans la partie

tant continue que discrète. Le prix de l'électricité (Prixelbo) a dinérents effets selon

l'utilisation qui en est faite: les consommateurs résidentiels utilisent l'électricité pour

chauffer les locaux (Peleloc) et pour l'eau (Peleau). Comme on devrait s'y attendre,

l'effet global est négatif, Prixelbo ayant la plus grande valeur absolue. Les prix du

mazout et du gaz naturel ont un effet positif sur la consommation d'électricité.

Les variables pour la date de conversion ainsi que la date de construction ont un

effet négatif insinuant que plus récente est la date de conversion ou de construction

de l'habitation, moindre est la consommation d'électricité. Cela est le résultat des

standards d'efficience dans la consommation d'électricité imposés vers les années 80.

Le type de maison (Housetype) (1: détaché, 2: semi-détaché, 3: rangées de trois ou

plus), indique que les habitations détachées consomment plus d'électricité. L'effet du

temps sur la consommation d'électricité est expliqué par la variable de degrés-jours de

chauffage. L'effet positif observé montre que plus le climat est froid, plus d'électricité

sera demandée. Comme, on pouvait s'y attendre, la consommation d'électricité aug-

mente avec le nombre de personnes dans l'habitation. La demande d7&ctricité aug-

mente aussi avec la surface de la maison et l'âge du chef de famille. Par ailleurs,

les gens qui sont propriétaires consomment m o h d'électricité comparativement aux

locataires (Ownrent). Enfin, la disponibilité du gaz diminue la consommation de

l'électricité.

Élasticités prix et revenu

Le tableau 5 résume les élasticités prix et revenu relatives à notre modele discret/continu.

Les valeurs sont calculées aux moyennes édiantillonales. Toutes les élasticités ont des

signes corrects. Les élasticités prix sont très proches de celles obtenues par BBB

(1996).

Pour obtenir ces élasticités, nous avons utilisé l'équation de demande non condi-

t ionnelle:

où E ( x / j ) est la demande d'électricité conditionnelle au choix de l'alternative j. Avec

ces résultats, nous pouvons écrire I'élasticité de E(x) par rapport A p comme:

où w, est la part de marché du système j .

Tableau 4.5: Élasticités prix et revenu

Options de l'électricité du mazout du gaz revenu

Gaz/gaz Gaz/électricité Bi-énergie/mazou t Bi-énergielélectricité Mazout/mazout Mazout /électricité Électricité/électricité Bois/électricité Bois-électricité/électricité

Moyenne -0.959 0.953 0.102 0.124 Espérance de la demande d'électricité incluant la possibilité de changements de système -0.383 0.467 0.054 0.064

Nous pouvons observer au tableau 5 que les élasticités de court terme et celles

de Long terme sont différentes. Cela peut trouver son explication dans le fait qu'à

long terme les ménages peuvent être amenés à changer leur système de chauffage de

l'eau et des locaux. Quand nous comparons les élasticités obtenues dans ce travail et

celles dans BBB (1996), nous constatons que les réponses aux prix d'électricité et de

revenu sont similaires. Notre modèle semble, cependant, mieux se comporter quand

nous considérons que la réponse de la demande d'électricité, suite aux changements

dans les prix des deux autres sources d'énergie et plus spécialement pour le mazout,

est plus élevée. Les valeurs que nous avons obtenues sont plus proches de ce à quoi

on devrait s'attendre.

4.2.8 Conclusion

Les motivations de notre travail étaient d'évaluer la demande d'électricité condition-

nelle au choix d'un mode de chauffage de l'eau et des locaux parmi neuf alternatives à

l'aide d'une approche du maximum de vraisemblance simulé à information complète.

Les estimations des élasticités ont les signes corrects et sont conformes & nos attentes

et plus particulièrement pour les d e u r s obtenues pour les élasticités de court terme.

En termes de difficultés de programmation, l'approche conjointe est certainement

plus laborieuse comparativement à une méthodologie en deux étapes. Par contre les

résultats que nous venons d'obtenir sont plus probants en ce sens que le FIML tient

compte de toute l'information disponible, indiquant clairement que la complexité en

vaut la peine. Une des causes de cette amélioration relativement aux résultats de

BBB est vraisemblablement la prise en compte de la structure non linéaire.

Pour le chapitre prochain, nous sacrifions maintenant l'efficacité pour obtenir une

approche beaucoup plus simple à mettre en oeuvre. Ce que nous proposons est une

méthode statistique en deux étapes qui peut être vue comme l'extension au cas probit

polytomique de l'approche très populaire de Heckman (1978) pour la correction pour

le biais de sélection.

Chapitre 5

Estimation économétrique:

Méthode d'estimation en deux

étapes (Maximum de

Vraisemblance à Informat ion

Limitée)

5.1 Cadre théorique

Il s'agit d'estimer les paramètres de la partie discrète puis ceux de la partie continue

en conditionnant sur les résultats de la première partie. La motivation de le faire

en deux étapes au lieu d'une se justifie, entre autres, par le fait que la configuration

du problème laisse voir qu'il est plus facile de modéliser séparément les deux parties

parce que la distribution conjointe est dinicile à modéliser: c'est ce qui arrive souvent

quand les variables proviennent de deux populations différentes (une discrète et L'autre

continue). Par ailleurs, la modélisation séparée peut être facile parce que la forme que

prend la log-vraisemblance n'est pas facilement manipulable alors que les deux parties

prises séparément le sont plus. Enfin, comme mentionné précédemment, la méthode

en une seule étape nous permet d'estimer les paramètres de la partie tant discrète que

continue à la fois. II n'en demeure pas moins que certains chercheurs argumentent

qu'en raison de cette simultanéité de traitement, une erreur de spécification sur l'une

ou l'autre des deux parties aura des répercussions sur la non convergence de tous les

estimateurs de paramètres alors qu'une erreur sur une des parties lors de l'application

de la méthode en deux étapes est limitée à l'étape en question.

Pour le cas à l'étude, à la première étape, l'application de l'une des techniques

relatives à l'estimation des modèles de choix discrets à la fonction d'utilité indirecte

aléatoire conditionnelle est faite. Dans une deuxième étape, dans le souci de tenir

compte de la simultanéité des deux décisions, on peut aborder le problème de trois

façons différentes:

Via les formes réduites: il s'agit d'estimer le modèle de la partie continue en y in-

corporant les estimations des probabilités de choix obtenues lors de l'estimation

de la partie discrète.

Via les k a b l e s instrumentales: le principe est l'estimation du modéle de la

partie continue en utilisant les estimations des probabilités obtenues lors de

l'estimation de la partie discréte comme instruments pour un certain nombre

des variables.

0 Via la méthode de correction basée sur le biais de sélection: A l'aide des tech-

niques ccnventionnelles pour données continues, on estime les paramètres de

la demande tout en tenant compte d'une correction de type Heckrnan pour le

biais de sélection résultant du fait que la demande est conditionnelle au choix

effectué (Hedunan (1979)).

Notre étude va porter principalement sur cette troisième méthode parce que cette

dernière comporte des difficultés techniques qui ont limité son utilisation jusqu'à

maintenant. Étant donné leur sirnplicit é, les deux autres méthodologies sont celles

qui ont été couramment utilisées dans les applications.

5.1.1 Biais de sélection

Dans I'évaluation de la deuxième étape de l'estimation des modèles économétriques

de choix discrets/continus, nous devons faire ressortir le fait que la demande est con-

ditionnelle au choix effectué. Pour y aniver, nous faisons une extension au cas MNP

des travaux de Heckman (1978) qui avait estimé des modèles continus conditionnés

sur le choix discret dans un cas à deux modalités.

La fonction de demande conditionnelle obtenue comme solution du probleme de

maximisation de la fonction d1utilité(3.3), peut s'écrire comme:

Pour tenir compte du biais de sélection, nous devons faire la régression suivante

(voir annexe A):

où E(q1i) est l'expression du biais de sélection qu'il devient nécessaire de dériver avant

d'entreprendre l'estimation.

Par la loi des espérances itérées, comme rj et sont généralement reliés, nous

pouvons déduire que:

où Ai = {cli) représente l'ensemble des valeurs possibles de qui respectent les

inégalités impliquées par le choix i telles que reprises dans l'équation (5.30). Comme

E (q 10 est une expression en termes des erreurs du modèle de choix <, E(q li) s'exprime

comme une fonction f ({ 2 ) .

Dans leur étude devenue célèbre, sous les hypothèses: 7 - N(0, cr2), 5 w Gumbel m

i.i.d et VI( de moyenne 7 C Rj(,, Dubin et McFadden (1984) obtiennent Le résultat j=l

suivant:

une formule qui exige i'évaluation des E({,Ii) pour toutes les modalités.

L'évaluation des moments d'ordre supérieur de qli requiert le calcul des moments

cond i t io~e l s que nous écrivons pour fins de généralisation comme E[g({,) li] Vj. Selon

la loi postulée pour la variable aléatoire de la partie continue et le type de modèle de

la partie discrète, nous obtiendrons différentes expressions pour les espérances.

La prochaine section est consacrée au calcul des espérances de la forme E [ g ( b ) li],

lorsque et q proviennent d'une distribution normale conjointe.

5.1.2 Moments conditionnels

La pertinence de la dérivation des moments conditionnels pour estimer les modèles

de choix discrets/continus en deux étapes ayant été montrée, nous nous consacrons

dans cette partie du travail, au calcul de ces moments.

Comme mentionné précédemment, tout moment conditionnel peut s'écrire de

façon générale comme E [g(G) li] .

Nous pouvons montrer à l'aide des propriétés des espérances conditionnelles que':

E [ g ( ~ ) I i ] = [P(Z)I-' . / g(<j)f(S)q. (5.28) Cf Ai

Dans le cas qui nous intéresse particulièrement (où i appartient à un ensemble

non ordonné), nous pouvons en déduire quelques résultats intéressants.

Partons du fait que la probabilité que la modalité i soit choisie est donnée par:

Définissons une variable indicatrice 6i(5) égale à (: Posons { E Ai 6 4 9 et g(5) une fonction réelle

si i est la modalité choisie

autrement. arbitraire pouvant prendre les

valeurs &, $ OU 06, Vz, j, si nous nous limitons aux moments d'ordre 2.

Nous avons:

qui donne les moments conditionnels au choix effectué et où P( i ) est la probabilité

de choisir l'alternative i.

De ces expressions, nous aurons tous les moments conditionnels en donnant différentes

valeurs à g(c). Entre autres, avec:

g ( f l = cj , on a E [ej jl& (c) = l] y le premier moment conditionnel;

g (5) = c:, on a E [<; 1 6i (<) = 1) , le deuxième moment conditionnel;

g(Q = CG, on a E [ticj jlbi(O = 11 ,moment croisé conditionnel. - --

=Voir annexe B pour la preuve.

Moments conditionnels pour les modèles à Valeurs Extrêmes Généralisdes

Jefiey Dubin (1985) a dérivé les moments conditionnels pour les modèles faisant

partie de la classe des modèles GEV. Dans cette section, nous regardons sous quelles

hypothèses il les a dérivés et montrons que dans certaines circonstances, même pour

des modèles assez simples impliquant de l'interdépendance entre certaines modalités,

on ne peut pas arriver à des formes facilement rnanipulables2. Pour ce faire, cette sec-

tion ne sert qu'à montrer combien il est difficile de dériver les moments conditionnels

et conforte l'idée de passer B l'usage de simulateurs dans le cas précis du MNP.

Partons de la fonction de distribution à valeurs extrêmes généralisées:

où < . > représente un vecteur.

La distribution marginale de & lorsque les Sj -t oo sauf ci est donnée par:

où a+ = G(0, .. ., 1,0, ...) avec 1 a la place du ième argument. Il s'agit de la fonction

de distribution cumulative de & distribuée GEV avec mode 11 = Ohai, moyenne

E(C) = O(y + ln ai) et variance Var(&) = 9 diagonale et où 7 est la constante

d'Euler.

Soit la fonction d'utilité indirecte Ui = vi+& avec (6, t2! .... c J ) distribué F (&, c2, ..., f J ) .

Les probabilités de choix sont données par:

Sous l'hypothèse de forte séparabilité ( i.e G(y) = G A ( y i ) + uj avec pj = e3 ) ,

Dubin obtient les résultats suivants:

aNotation de Dubin (1985).

V i et où P, est la probabilité de choisir i.

Cas particuliers:

MNL

Dans ce cas. il ne se pose aucun problème car les modalités étant indépendantes,

les moments conditionnels qui en résultent se présentent sous des formes facilement

manipulables.

Sachant que pour le MNL, nous avons

les moments conditionnels deviennent:

NMNL

Considérons le modèle suivant à deux niveaux et trois alternatives. Pour un cas

plus complexe, cela ne fera que renforcer les problèmes que nous allons soulever.

Cette formulation est un exemple où les modalités 1, 2 et 3 correspondent respec-

tivement à bus bleuo auto et bus rouge. Les alternatives 1 (bus bleu) et 3 (bus rouge)

sont interdépendantes alors que celle 2 (auto) est indépendante des deux autres. II

dérive les moments conditionnels lorsque l'alternative i a été choisie. Les résultats

sont les suivants:

Ces résultats simplifiés viennent du fait que G( ..., yil ..., yj , ...) = GA(.-., ~ i , ..-) +Yj

(i.e l'alternative choisie i est indépendante de j ) . Voyons ce qui se passe si l'alternative choisie est indépendante des autres dans la

séparabiiité.

Réécrivons notre modèle à trois alternatives comme

Avec cette configuration,

Dans l'expression ci-haut, les intégrales restantes ne peuvent pas disparaitre.

Considérons maintenant le cas où l'alternative choisie fait partie de celles qui sont

reliées mais que nous cherchons le moment conditionnel de I'une des variables avec

laquelle elle est reliée. Notre modèle peut s'écrire:

Dans ce cas

Dans cette expression vont persister les intégrales qui s'y trouvent d'autant plus

que les modalités 1 et 2 sont interdépendantes.

À la lumière de ce qui précède, nous pouvons voir que les résultats obtenus par

Dubin (1985) sont sujets à l'hypothèse de forte séparabilité. Pour peu que nous

relâchons cette hypothèse, même dans des cas aussi simples que celui à trois modalités,

deux niveaux, si j n'est pas indépendant de i, les intégrales présentes dans les moments

conditionnels persistent, et à plus forte raison dans des cas plus complexes.

Moments conditionnels pour le MNP

Les moments conditionneki dans le cas du MNP se présentent comme suit:

où la probabilité de choisir la modalité i est donnée par:

Le problème apparaît très clairement, ces intégrales rnultidimensionnelles sont

encombrantes e t rien de telie que l'utilisation des simulateurs pour contourner ce

problème.

5.1.3 Approche ii simulateurs

Dans cette partie du travail, nous présentons des simulateurs susceptibles de remplacer

les espérances mathématiques qui nous intéressent. Partons de la fonction d'utilité

aléatoire que nous réécrivons sous forme vectorieile comme

Nous considérons le modèle en déviation par rapport à la modalité choisie et

supposons que le choix correspond à la dernière et obtenons

avec Li,, X,,p et Cn étant des termes en déviation. Cette hypothhe n'est pas re-

strictive car par simples transformations linéaires, nous pouvons avoir le modèle en

déviation par rapport au choix de n'importe quelle autre modalité. À l'aide de la

décomposition de Cholesky pour le terme d'erreur (en = Su,) et en omettant l'indice

n pour simplification, nous pouvons réécrire le modèle comme:

Ceci peut aussi s'écrire comme

La probabilité que la modalité i soit choisie, soit P (5 E A,), est aussi donnée par

avec

Cette probabilité peut être alternativement écrite comme

où le produit est valide à cause de la structure récursive permettant de conditionner

de façon univariée.

Méthode de simulationl: Acceptation et Rejet Accélérée (ARA)

Cette méthode est basée sur les dérivations de Hajivassiliou et McFadden (1994),

reprises par Gouriéroux et Monfort (1996), Hajivassiliou, McFadden et Ruud (1996)

qui nous permet de faire des tirages dans une distribution conditionnelle lorsque les

formules d'inversion simples ne sont pas disponibles.

Les lignes qui suivent sont basées sur le paragraphe 3.3.3 de Gouriéroux et Mon-

fort (1996). En vertu de cette méthode, pour obtenir des tirages d'une distribution

f (u(AI), il de faire des tirages u satisfaisant x 5 a f (u)/g(u), étant donné une

valeur fixe pour a, une distribution non conditionnelle f (u), une distribution g(u)

avec support A; et un tirage x dans la loi uniforme.

Dans le cas qui nous concerne, les deux types de distributions que nous allons

considérer sont:

pour la non conditionnelle et

qui est la fonction de distribution normale tronquée récursive de laquelle les tirages

peuvent être effectués facilement a l'aide du simulateur GHK et où 1 .4; est une variable

indicatrice qui est égale à 1 si u E il; et O autrement. Autrement dit, Al constitue le

support de la distribution g(u) . Les u qui seront retenus devront satisfaire la relation

D'après les expressions de f (u) et g(u) retenues, la relation ci-avant devient3:

0 Ù X = -(j j-i Uj-1 + m.. + rjl ui* Pour un j donné, par la résolution du problème de maximisation de cette dernière

relation, nous allons avoir une expression pour a. En effet

max@(wj - X), X

nous donne X = -00.

3Le lemme 1 dans Hajivassiliou, McFadden et Ruud[25] stipule que sup s f (z)/g(z) 5 a < +a.

m Avec cette valeur de X, aj = @ ( w j - X) = 1, ce qui donne CY = n aj = 1.

j=l

Avec cu = 1, la relation entre les fonctions de densité de probabilité devient:

L

Procédure de simulation

Pour avoir les tirages dans Elc E -.li, nous allons:

1. Faire un tirage conjoint (ut, z t ) avec ut dans la 1 récursive tronqi

et xt dans la loi uniforme U(O,1) jusqu'à ce nous obtenons un tirage tl tel que

xtl < P(utl E 4') (5.31)

est satisfait.

qui sera distribué N ( 0 , C) étant donné que ( E Ai.

Méthode de simulation 2: Acceptation et Rejet Conventionnelle (CAR)

Nous vouions obtenir des tirages de 5 satisfaisant 5 E &. Pour ce faire, nous

procédons d'abord à des tirages de ut dans la loi récursive tronquée g(u). Après

quoi nous revenons à l'espace de départ en caicdant P = Sut en ne retenant que

si celui-ci satisfait la contrainte C E A,. Ces valeurs constituent, évidemment, les

simulations dans Ia distribution de { conditionnelle à E Ai.

Méthode de simulation 3: É~hantillona~e de Gibbs

Cette méthode est basée sur la décomposition de la distribution mdtivariée tronquée

en une suite de distributions multivariées conditionnelles.

Soit f (uI. 212. .... u,) une fonction de distribution multivariée. Cette distribution

multivariée peut être caractérisée par la connaissance des différentes distributions

univariées conditionnelles comme suit: O O Choisir de façon arbitraire (u,, u?, ...: ufB) comme valeurs de départ;

-Tirer u: - f (ul/u& .... u&); -Tirer ui .- f (u21u:, u:, ..., 211); -Tirer ui - f (u31u:, 4, ..., u:);

T T-1 T-L - T i r e r ~ ~ ~ f ( u ~ l u ~ ,u2 ?.... ,î~,-~);

Pour des valeurs de T suffisamment élevés, les tirages sont tels qu'ils proviennent

de la loi conjointe désirée f (ul, u2, . .., h). Dans notre cas, nous sommes intéressés à faire des tirages d a m la loi normale

multivariée tronquée

Les distributions univariées conditionnelles sont données par f qui est la

fonction de distribution de 5, étant donné la connaissance des tous les autres termes

d'erreur ( { - j ) faisant partie de la loi conjointe. Ces dernières sont normalement

distribuées avec moyenne O et variance ozj où

et Cu = I.'ar(&), Zj,-j = C O ~ ( & , < - ~ ) , C-j,- j = V U ~ ( { - ~ ) .

La fonction de distribution conditionnelle est finalement donnée par

Les tirages successifs conditionnels nous donnent directement les 5 distribués con-

ditionneilement à ,Ai,

Calcul des simulateurs des moments conditionnels

Une fois un nombre T de tirages retenus en exploitant l'une des trois méthodes

présentées antérieurement, nous pouvons à l'aide des tt, t = 1,2, . .., T , en déduire

divers calculs relatifs aux moments conditionnels qui nous intéressent. En particulier,

nous estimerons E [<]il par la formule suivante

en notant que

Yous calculerons, par la même occasion les variances conditionnelles simulées

Comparaison des trois méthodes sur base des moments conditionneis simulés

Pour fins de comparaison et de choix de méthode à privilégier lors du calcul des mo-

ments conditionnels, nous allons considérer un cas à trois modalités qui nous servira

de barème. C'est ainsi que nous présentons d'abord la dérivation des moments condi-

tionnels théoriques relatifs à ce cas a trois modalités. Comme le nombre de modalités

est faible, ces moments théoriques peuvent être évalués par intégration numérique.

Moments conditionnels théoriques.

À paztir de notre modèle de départ qui se ramène à deux modalités lonqu'il est

considéré en déviation par rapport à la dernière, nous pouvons écrire

avec

Xotons que

u15o +&-v u2 4 O -+ c2 5 -v.

La loi conjointe des deux termes d'erreur respectant la relation ci-haut peut s'écrire

comme

Yous sommes intéressés par les moments suivants

La moyenne pour (Ellei 5 -V)

proposition 1: La moyenne conditionnelle pour ci est donnée par:

Preuve

La preuve apparaît à l'annexe F.

La variance pour (El IG 5 -V)

proposition 2: La variance pour (<llcl 5 -V) est donnée par: var(61G 5

Preuve


L'espérance pour (& 1 El 5 - V, & 5 - V )

proposition 3: La moyenne pour (& /ci < -VI t2 < -V) est donnée par

où

Preuve

La preuve apparait à l'annexe F.

La variance pour (& 1 Fi 5 - V, & $ - V )

proposition 4: La m h c e (52 151 5 - V, t2 < - V ) est donnée par

Où E est l'espérance calculée précédemment,

Preuve


Résultats des calculs et comparaisons

Les résultats empiriques présentés dans cette partie du travail ont été obtenus a

partir des trois méthodes de simulation précitées ainsi que de la base théorique prise

comme étalon. Ils ont été faits sur un modèle à trois modalités réduites à deux en

déviation, nous permettant ainsi de comparer la performance des trois méthodes à

savoir celle basée sur l'acceptation et le rejet accélérée (ARA), la méthode d'acceptation

et rejet conventionnelle (CAR) ainsi que l'échantillonnage de Gibbs. Les données sont

simulées à partir du modèle (5.32). La taille de l'échantillon est de 1000 observations.

Différentes structures de corrélation sont considérées:

- Très forte corrélation positive entre les deux termes d'erreur: 0.9;

- Forte corrélation positive entre les deux termes d'erreur: 0.7;

- Faible corrélation positive entre les deux termes d'erreur: 0.2;

- Pas de corrélation entre les deux termes d'erreur: 0.0;

- Faible corrélation négative entre les deux termes d'erreur: -0.2;

- Forte corrélation négative entre les deux termes d'erreur: -0.7.

- Très forte corrélation cégative entre les deux termes d'erreur: -0.9.

Ces structures de corrélation sont combinées à différentes valeurs des vecteurs

V. Le nombre de tirages retenus pour le calcul des moments conditionnels est de

2000. Les résultats regroupés dans les tableaux qui suivent laissent voir clairement

que la méthode CAR est celle qui se rapproche le plus des ceux donnés par ies calculs

théoriques dans toutes les combinaisons de structure de corrélation et des moyennes

possibles. Quant ik méthode &\RA, elle semble bien se comporter pour des struc-

tures de corrélation se rapprochant de l'absence de corrélation et suit de très près la

méthode C.4R. Le Gibbs se retrouve entre les deux premières méthodes en termes de

reproduction des résultats théoriques. LI semble nous donner, par contre, des chiffres

très éloignés des ceux obtenus par les deux autres méthodes et la théorie en ce qui

concerne les variances conditionnelles. Quant au choix à retenir pour les applications,

nous penchons vers la méthode CAR. En &et, celle-ci nous permet d'approcher les

résultats théoriques tant du point de vue moyennes que variances avec un nombre de

tirages minimal. On peut observer que pour des valeurs élevées positives de V , la

méthode A4k4 requiert un nombre exagéré de tirages pour obtenir le nombre requis

de tirages. Dans le cadre des résultats présentés dans les tableaux ci-dessous, il nous

a fallu certains moments 120000 tirages pour avoir les 2000 nous permettant de

calculer les moments conditionnels. Dans les circonstances, même si cette méthode

donne lieu aux mêmes résultats dans certains cas, il semble que la méthode CAR

performe mieux.

Tableau 5.6: Moments conditionnels pour rho = - 0.9

v I Moyennes conditionnelles

ARA 0.00676 0.003 12 -0.01240 -0.01 369 -0.04863 -0.09084 -0.28100 -0.64167

CAR 0.00284 -0.00979 -0.0465 1 -0.12908 -0.27715 -0.49848 -0.78749 -1.13131

Théoriques -0.00444 -0.01764 -0.05525 -0.13879 -0.28760 -0.50916 -0.79788 -1.14108

ARA 0.00668 0.00655 0.01791 0.00908 -0.00616 -0.08057 -0.27531 -0.64107

pour c 2

C,4R GIBBS 0.01048 -0.07029 0.01884 0.00296 0.04083 0.00182 0.07847 -0.00344 O. 11062 -0.02539 0.05894 -0.0397 -0.19982 -0.27322 -0.61180 -0.63926

Variances conditionnelles

Théoriques -0.00444 -0.00177 -0.00566 -0.01495 -0.03544 -0.09040 -0.27788 -0.64237


Moyennes conditionnelles pour {I

AR4 CAR GIBBS Théoriques 0.00433 0.00284 0.00743 -0.00444 -0.00153 -0.00979 -0.00948 -0.01764 -0.01823 -0.04651 -0.02115 -0.05525 -0.04718 -0.12908 -0.04858 -0.13879 -0.1 1629 -0.27715 -0.10942 -0.28760 -0.23607 -0.49848 -0.24007 -0.50916 -0.48 173 -0.78749 -0.47922 -0.79788 -0.81137 -1.13131 -0.82127 -1.14108 -1.22384 -1.51617 -1.22966 -1.52514

PQW t 2

ARA CAR GIBBS Théoriques 0.01777 0.01934 -0.02890 -0.00133 0.01247 0.02148 0.00833 -0.00532 0.00914 0.02500 -0.00463 -0.01697 -0.00853 0.02231 -0.03382 -0.04484 -0.07446 -0.01 580 -0.09487 -0.10533 -0.21984 -0.14877 -0.22479 -0.23429 -0.46060 -0.41390 -0.46477 -0.47271 -0.81532 -0.78081 -0.80908 -0.8 1540 -1.22418 -1,20457 -1.21978 -1.22480 3



Moyennes conditionnelles pour (1

-4RA CAR GIBBS Théoriques 0.00142 0.00284 -0.09727 -0.00444 -0.01001 -0.00979 -0.01248 -0.01764 -0.04206 -0.04651 -0.04432 -0.05525 -0.10307 -0.12908 -0.11699 -0.13879 -0.25226 -0.27715 -0.25102 -0.28760 -0.45256 -0.49848 -0.45894 -0.50916 -0.73219 -0.78749 -0.73931 -0.79788 -1.06330 -1.13131 -1.07994 -1.14108 -1.45986 -1.51611 -1.46545 -1.52514

ARA 0.02690 0.01345 -0.00999 -0.08589 -0.22917 -0.43011 -0.73833 -1.06068 -1.45563

Pour t2 CAR 0.02753 0.01675 -0.01428 -0.09947 -0.21895 -0.42839 -0.71193 -1.05626 -1.44525 L


GIBBS -0.02052 0.00229 -0.02855 -0.08545 -0.23186 -0.43906 -0.7198 1 -1.06162 -1.44871

Théoriques -0.00355 -0.01418 -0.04492 -0.11539 -0.24697 -0.45291 -0.73216 -1.07244 - 1.458 14

Tableau 5.9: Moments conditionnels pour rho = 0.0

Moyennes conditionnelles - Pour <r

AR4 CAR GIBBS Théoriques 0.00083 0.00284 -0.03193 -0.00444 -0.01016 -0.00979 -0.01371 -0.01764 -0.04835 -0.04651 -0.05231 -0.05525 -0,12842 -0.12908 -0.13796 -0.13879 -0.28263 -0.27715 -0.28940 -0.28760 -0.51838 -0.49848 -0.5 1331 -0.50916 -0.80847 -0.78749 -0.80368 -0.79788 -1.13003 -1.13131 -1.14776 -1.14108 -1.52782 -1.51617 -1.53211 -1.52514

- - -

pour c 2

CAR GIBBS Théoriques 0.02844 -0.02259 -0.00444 0.01468 -0.00085 -0.01764 -0.02425 -0.03858 -0.05525 -0.11027 -0.12233 -0.13879 -0.26251 -0.37170 -0.28760 -0.48783 -0.49430 -0.50916 -0.78009 -0.78439 -0.79788 -1.12629 -1.12904 -1.14108 -1.51227 -1.51447 -1.52514



Moyennes conditionnelles pour J 1

ARA CAR GIBBS Théoriques 0.00036 0.00284 0.03371 -0.00444 -0.01168 -0.00979 -0.01026 -0.01764 -0.05488 -0.04651 -0.05501 -0.05525 -0.14339 -0.12908 -0.15165 -0.13879 -0.30891 -0.27715 -0.31668 -0.28760 -0.35875 -0.49848 -0.55294 -0.50916 -0.84998 -0.78749 -0.85181 -0.79788 -1.20257 -1.13131 -1.20014 -1.14108 -1.57801 -1.51617 -1.58541 -1.52514

- - -

pour (2

ARA CAR GIBBS Théoriques 0.02654 0.02849 -0.01803 -0.00529 0.01086 0.01307 -0.00337 -0.02086 -0.02765 -0.03021 -0.04723 -0.06431 -0.12070 -0.12461 -0.14124 -0.15803 -0.30228 -0.28822 -0.30305 -0.31942 -0.54204 -0.52468 -0.53678 -0.5Z234 -0.84422 -0.82510 -0.83429 -0.84867 -1.18419 -1,17565 -1.18231 -1.19534 -1.57518 -1.56330 -1.56798 -1.57969

"

Variances condi t iomelles Pour €1


Moyennes condit ionneiles Pour <r

.4RA CAR GIBBS Théoriques 0.00312 0.00284 -0.03561 -0.00444 -0.01509 -0.00979 0.01776 -0.01764 -0.06322 -0.04651 -0.03585 -0.0.5525 -0.16725 -0.12908 -0.14567 -0.13879 -0.35029 -0.27715 -0.32742 -0.28760 -0.60672 -0.49848 -0.58107 -0.50916 -0.90718 -0.78749 -0.89464 -0.79788 -1.26719 -1.13131 -1.25389 -1.14108 -1.64445 -1.51617 -1.64668 -1.52514

pair <2

AM CAR GIBBS Théoriques

Variances condit ionneIles Pour €9


Moyennes conditionnelles

pour (1

ARA CAR GIBBS Théoriques 0.003 12 0.00284 -0.03437 -0.00444 -0.01378 -0.00979 0.00668 -0.01764 -0.06252 -0.0465 1 -0.04554 -0.05525 -0.15479 -0.lS908 -0.14904 -0.13879 -0.33084 -0.27715 -0.31947 -0.28760 -0.58281 -0.49848 -0.55941 -0.50916 -0.88418 -0.78749 -0.86376 -0.79788 -1.24497 -1.13131 -1.21989 -1.14108 -1.63924 -1.51617 -1.61363 -1.52514

pour <2

CAR GIBBS Théoriques

Variances conditionnelles 1

Calcul du biais de sélection

Le problème de départ est de trouver une expressioii pour calculer E [(qli)] en se

rappelant que

E(qli) = Ef! j [E(q![ ) ] .

Pour évaluer cette expression, nous avons besoin des deux composantes E(ql<)

et E [<li] où [ est le terme d'erreur de la partie discrète et 7 le terme d'erreur de la

partie continue. La dérivation de E [clil vient de faire l'objet de la partie précédente

et il nous faut faire des hypothèses sur E(v1C) en tenant compte des distributions de

chacun des termes d'erreur qui la composent.

Soit

11 peut être démontré que

Dans notre cas,

Avec cette distribution, nous avons

ce qui implique qu'un simulateur naturel pour E(gli) est

qui est l'expression pour le biais de sélection et oh mi] peut être calculé tel que

décrit précédemment.

De façon générale E(vk 12) = Etji[E(7/C 1[)] où d est le kième moment. En effet,

partant du fait que E(q2 12) = [P(i)-'] J E ( q 2 / [ ) f (<)g = EFli[E($ l ~ ) ] > ~ O U Ç CO^- tE-4,

statons bien qu'il est nécessaire de calculer E(q2 l<) pour obtenir le deuxième moment

conditionnel. Ce dernier nous aidera dans le calcul de la matrice de variance covari-

ance basée sur la simulation étant donné la méthode en deux étapes. Nous allons

présenter sa dérivation dans les lignes qui suivent.

Pour 7 et < distribués comme précédemment, nous avons

ce qui nous donne le simulateur suivant

avec

5.1.4 Matrice de variance covariance basée sur la simulation

étant donné la méthode en deux étapes.

Pour aborder la problématique du calcul de la bonne matrice de variance covariance

compte tenu du fait que I'estimation est produite par une méthode en deux étapes,

nous allons nous inspirer largement des travaux de Heckrnan (1976): Amemiya (1978)

et Mwphy e t Topel (1985). La modélisation en deux étapes vient entre autres du fait

que l'estimation conjointe dans un cadre du maximum de vraisemblance B information

complète, dans plusieurs situations, est très complexe et très coûteuse en termes

de calcul. Si la formulation du problème en deux étapes permet de remédier aux

difEcultés signalées, il n'en demeure pas moins qu'elle nécessite certains ajustements

comme la correction de la matrice de variance covariance pour une bonne applicabilité.

Pour comprendre l'intuition derrière cette démarche, considérons un problème en

deux étapes dont:

- La première étape consiste en l'estimation d'un modèle auxilliaire (modèle de

chok discret dans notre cas). Cette étape conduit à des estimations des paramètres

réunis dans un vecteur 8 et une matrice de variance covariance asymptotique ~ ( 8 ) . - La deuxième étape consiste en l'estimation du modele d'intérêt qui est la finalité

du problème (la demande d'électricité dans notre cas) conditionnelle à la réalisation de

la première étape. Ce conditionnement donne lieu a une formulation dans la deuxième

étape qui incorpore des régresseurs non observables. Ceux-ci seront remplacés par

leurs estimations obtenues à la première étape, entrainant par la même occasion des

erreurs standards de la deuxième étape ératiques.

Heckman (1976), .4memiya (1978) préconisent une correction à la matrice de

variance covariance asymptotique ainsi obtenue à la deuxième étape dans un cadre

où la première étape consiste en un probit dichotomique ou un tobit. Dans cette

partie du travail, nous dérivons les expressions pour ia matrice de variance covariance

dans un cadre où la premihre étape fait état de l'estimation d'un probit polytomique

et dont les élements sont basés sur la simulation.

Les deux étapes que nous considérons se présentent comme suit:

- Étape 1: un problème de choix discret dont la résolution donne lieu à un vecteur

des paramètres et une matrice de Mnance covariance v(@, tous deux convergents.

- Étape 2: l'estimation de la fonction de régression

Pour tenir compte du biais de sélection, à l'instar de Heckman e t Amerniya,

réécrivons le modèle comme suit:

où E(gnli) est l'expression pour le biais de sélection.

Posons

E(vnl4 = F(0' Xi)?

avec O: vecteur des paramètres de la partie discrbte.

XI: vecteur des variables exogènes de la partie discrète.

Le modèle que nous allons considérer pour estimation s'écrit donc comme:

qui est un modèie hétéroscédastique avec E(e,li) = O et Vaî.(enli) = E($ii) -

N % l i ) ) * . Pour l'estimation, nous allons remplacer B par ê dans (5.33) et nous obtenons

avec

Posons

6 = ( r ) . Nous pouvons réécrire le modèle sous forme matricielle comme

L'estimateur des moindres carrés ordinaires (MCO) pour b est donné par

Sachant que ë = e - F(& XXi)7 + F(9, X i )7 , nous avons

Faisons une expansion de Taylor de ~ ( 8 , Xi)y autour de 8. Pour cela, nous trans-

formons cette dernière expression en

avec vec(F) défini comme suit : si la matrice F a J colonnes 9, C2, ..., CJ, vec(F) =

(CI, Ci, ..., Ci)'. L'expansion de Taylor nous donne alors

~ ( ê , XI) = (-,' O In) - v e c ( F ) + (y' 8 In) avec(F(e9 X1)) (8 - 8 ) + . . . (5.35) a01

~ ( 8 , XI) = F(0, XI)? + (y 8 I , ) F ' $ - O ) + ûuec(F 8,X1 où Fê = , ) L l p En mettant (5.35) dans (5.34), nous avons

La matrice de variance covariance asymptotique est donnée par

(*+@1n)~dê-8)] = ~ [ [ e - ( T ' B I , ) F ~ B - O ) ] [e - ( 7 1 8 i , ) ~ â ( ê - 6 ) ] i }

= E { [ e - ( f @ ~ n ) ~ ; ( ê - O ) ] [ e l - ( B - O)'F'r I,)])

Xo tons que E (e (ê - 0) ' ) = E ( (8 - O ) el) = O. En effet, avec

que nous pouvons réécrire comme

avec W, = [W - (y'@ I , )F&~- O ) ] . Pour appliquer les MCO, nous devons avoir

E(W, e) = O. Ce qui donne E [(w - (./ 8 I , ) F ~ ( ~ - 0 ) ) e] = O. Nous avons bien

E (W e) = 0: ce qui fait que E [((-{ 8 1,) Fê - (8 - O ) ) e] doit être égal à zéro.

Autrement dit les termes e et (y' @ I , ) F ~ ( ~ - 0) ne doivent pas être corrélés, si nous

voulons avoir un estimateur convergent pour 6.

La matrice de variance covariance asymptotique devient donc

avec

Var(e1i) = diag (~(2li)) - diag { (E(% ~ i ) ) ~ )

qui sont des éléments simulés et var(#) qui est la matrice de variance covariance

asymptotique de la première étape laquelle est aussi affectée par la simulation. Elle

se présente sous la forme suivante:

qui est la matrice d'information . La première composante est la matrice de variance

covariance conventionnelle et la deuxième est le bruit provenant de la simulation qui

tend vers O Lorsque le nombre de rirages T devient important.

Cette matrice de variance comriance asymptotique corrigée pour notre modèle en

deux étapes nous permet d'éviter la sous estimation des écarts types dans le cas où

nous ne nous en préoccupons pas.

Il apparaît très clairement que l'estimation de la matrice de variance covariance

est très différente de celles dérivées dans les travaux précités en ce sens qu'elle est faite

via la simulation étant donné que les fonctions objectives nécessaires à son évaluation

contiennent des formes qui ne sont pas facilement manipulables.

5.1.5 Évaluation empirique de 19estimat ion en deux étapes

s u r données simulées

Dans cette partie du travail nous estimons, sur données simulées, un modèle éconornétrique

de choix discrets/continus avec choix interdépendants.

Spécification de la partie discrète

Pour simplifier la démarche, nous prenons un modèle à trois modalités décrit comme

suit:

où Utw : utilité procurée par la modallité i,

V; : partie déterministe du modèle de choix,

(; : terme d'erreur relatif à chacune des modalités. Prenons le modèle en déviation par rapport à la troisième modalité. Celui-ci s'écrit

alors comme:

où

u* = u; - u;, v,=v,.-v;, 6 = <; - avec

En supposant que la dernière modalité est celle qui a été choisie par l'individu n,

nous devrions avoir:

ou bien

Cette dernière relation définit les inégalités qui doivent être satisfaites par les

termes d'erreur Et dans le simulateur: m

où 5' est un vecteur des composantes Kf lit li] du modèle de l'utilité en (5.37) sat-

isfaisant les inégalités dans (5.38) impliquées par le choix observé pour le ménage n.

Dans le cas où la dernière modalité ne correspond pas à celle choisie, nous devons

effectuer une transformation de variables pour avoir des moments conditionnels com-

patibles avec la spécification du modèle de choix qui est en déviation par rapport à

la dernière modalité. Deux situations peuvent se présenter lors de l'évaluation des

moments conditionnels d'intérêt:

1. Si le choix effectué est la dernière modalité pour l'individu n, aucune transfor-

mation n'est nécessaire.

2. Si le choix de l'individu ne correspond pas à la dernière modalité, une simple

transformation peut être faite pour obtenir les valeurs de CL et & compatibles

avec le choix observé. Par exemple, si le choix observé est la modalité 2, nous

savons que:

Dans ce cas, les valeurs des ci peuvent être retrouvées à partir de:

Spécification de la partie continue

La partie continue de notre modèle est décrite par l'équation de demande suivante

QI : une fonction des variables exogènes; où

E (rl, li) : le terme de correction pour le biais de sélection, avec

c22 : matrice de variance covariance des termes d'erreur de la partie discrète,

: vecteur (1 x 2) des covariances entre les termes d'erreur de la p m i e discrète Cz r

et celle continue. L'équation (5.39) peut s'écrire

avec E((li) un vecteur (2 x 1) des moyennes conditionnelles au choix effectué. E(cli)

étant simulé, nous pouvons réécrire la demande comme:

Sous forme vectorielle, le modèle se présente comme suit:

d = ~ + & + é ,

- - avec S = E ( ~ / i ) & k

Simulation des données

Les données sont simulées à partir d'une structure de covariance de b forme:

où 012 et o13 sont les covariances entre la partie continue et celle discrète alors que

023 est la covariance entre les deux modalités du choix discret lorsque le modèle est

pris en déviation par rapport a la troisième modalité.

Xotre modèle de choix discret est de la forme

O 1 ~ 2 , n

Xous générons à partir d'une structure de coMnance les données nécessaires pour - estimer notre modèle. Suite à l'estimation de la partie discrète, nous obtenons CG et E@), nous permettant ainsi de spécifier la demande comme suit

Résultats de l'estimation

Nous présentons ci-dessous quelques résultats de l'estimation de notre modèle de choix

discrets/continus sur des données simuEes telles que décrites précédemment. Dans les

lignes qui suivent, nous présentons les résultats des essais d'un modèle trichotornique

nous permettant d'estimer la partie discrète , les espérances conditionnelles qui y sont

reliées ainsi que la partie continue du modèle.

La première étape de ces essais consiste en la génération des données à partir

des différentes structures de corrélation entre les termes d'erreur des deux parties

impliquées dans le modèle. Une estimation est ensuite faite pour la partie discrète

nous donnant ainsi les espérances conditionnelles dont nous avons besoin pour tenir

compte de la simultanéité entre les deux décisions. Par la suite, nous estimons la

partie continue. Nous considérons plusieurs essais (100) avec la même structure de

corrélation et présentons les statistiques descriptives relatives à chaque paramètre de

la partie continue ( moyenne, variance de l'échantillon, écart-type, écart quadratique

moyen, le minimum, le maximum, Les percentiles 25, 50 et 75) ainsi que les tests t

de student (la moyenne sur toutes les répétitions), le ratio de vraisemblance (LR) et

de Fisher (F)'. La taille de l'échantillon est de 1000 observations. Les structures de

covariance considérées vont des deux cas extrêmes où les covariances entre les termes

d'erreur de la partie continue et celle discrète sont nulles , à celui où il y a une très

forte covariance entre les deux parties précitées. Entre les deux, nous présentons tous

les cas intermédiaires considérant des liens plus ou moins faibles.

Les résultats présentés dans les tableaux apparaissant dans les pages suivantes

sont basés sur une structure de corrélation donnée chacun. Des vraies valeurs sont

postulées pour chacun des paramètres présents dans les deux parties du modèle. Le

processus d'estimation est répété 100 fois pour une structure donnée et les statistiques

Tes tests pourraient être raffinés ultérieurement pour servir de tests formeis de spécification du modèie.

présentées portent sur chacun des paramètres.

À la lumière des résultats obtenus p o u les cas présentés, nous observons que

lorsque la structure de corrélation est très faible ou inexistante entre les deux parties

du modèle, l'estimation de la partie continue nous donne des valeurs des covariances

qui ne sont pas significativement différentes de zéro confirmant ainsi le fait qu'il

n'y a pas de lien entre les deux parties. Les tests LR et F confiontent le modèle

contraint où les corrélations sont absentes a celui non contraint où elles sont présentes.

L'hypothèse nulle veut que nl = n2 = O alors que celle alternative fait état de la

présence de conélation. Les résultats de ces tests lorsque nous postulons une structure

sans corrélation entre les deux parties montrent un faible rejet de l'hypothèse nulle

dans certains cas et aucun rejet dans la majorité des cas. Dans le cas où nous

postulons une forte corrélation entre les deux parties, l'estimation de notre modèle

de la demande donne lieu à des estimateurs des covariances qui sont significatifs

confirmant ainsi le fait que les deux parties sont reliées. Les tests rejettent l'hypothèse

nulle dans la totalité des cas considérés. Les cas les plus intéressants surviennent

lorsqu'il y une forte corrélation entre le terme d'erreur de la partie continue et un

seul des deux termes de la partie discrète l'autre accusant d'une faible corrélation.

Il en résulte, en effet, des estimateurs qui sont significatifs pour les deux termes de

covariance même si l'un des deux est faiblement relié a la partie discrète. Cela peut

trouver son explication dans le fait que les deux parties du modèle étant reliées font

que même si le terme d'erreur est faiblement relié à un des termes d'erreur de la

partie discrète, le lien via l'autre terme d'erreur renforce indirectement la covariance

observée. Quant aux cas intermédiaires, ils laissent voir une diminution du degré de

signification lorsqu'on part des fortes corrélations vers les plus faibles. Ces résultats

montrent que les espérances conditiomelles que nous évaluons reproduisent bel et bien

les faits observés tels que décrits par le modèle a l'étude: une forte corrélation fait

ressortir des estimateurs sigdcatifk alors qu'une faible conélation nous en montre

des moins en moins significatifs.

Avec les résultats obtenus au cours de ces études de Monte Carlo, nous utilisons

la procédure développée au cours de cette partie du travail pour faire une évaluation

empirique de la demande d'électricité des ménages québécois conditionnelle au choix

d'un mode de chadage parmi neuf possibilités de chauffage de l'eau et des locaux.

EXPÉRIENCE #1: Choix discrets fortement interdépendants et

demande non corrélée avec les choix

Structure de covariance

1.00 0.00 0.00

0.00 1.00 2.00

0.00 2.00 4.79

Structure de corrélation

Vraies -leurs: CI = 1, 8 = 1, K I = O, K.* = 0.

Résultats

Statistiques et tests

moyenne ect stat-t eqrn var.e. min. max. 25 perc. 50 perc. 75 perc.

Q 1.07 0.03 33.40 0.01 0.03 1.02 1.14 1.05 1.08 1.10

8 1.00 0.04 27.37 0.00 0.03 0.92 1.07 0.97 1 .O0 1.03

-0.02 0.07 -0.26 0.01 0.07 -0.21 0.14 -0.06 -0.02 0.04

~2 -0.04 0.13 -0.30 0.02 0.14 -0.41 0.25 -0.13 -0.04 0.06

Nombre de rejets par le test LR: 1.00

Nombre de rejets par le test F: 1.00

103

EXPÉRIENCE #2:Choix discrets fortement interdépendants et demande

fortement corrélée avec les choix



Vraies valeurs: cr = 1, 0 = 1, = 0.235, n . ~ = 0.353.

Résultats


moyenne ect stat-t eqm var.e. min. max. 25 perc. 50 perc. 73 perc.

a 1.02 0.01 138.08 0.00 0.01 1.01 1.04 1.01 1.02 1 .O3

0 1.00 0.01 121.82 0.00 0.01 0.98 1.03 0.99 1.00 1 .O0

KI 0.19 0.02 11.48 0.00 0.02 0.17 0.24 0.18 O. 19 0.20

~2 0.30 0.02 12.47 0.00 0.04 0.21 0.39 0.27 0.30 0.32


Xombre de rejets par le test F: 100.00

EXPÉRIENCE #3:Choiu discrets fortement interdépendants et demande

moyennement corrélée avec les choix


Structure de corrélat ion

Vraies va1eurs:ûr = 1, 0 = 1, q = 0.44, Q, = 1.47.

Résultats



1 Nombre de rejets par le test LR 100.00

1 Nombre de rejets par le test F: 100.00 1

EXPÉRZENCE #4:Choix discrets fortement interdépendants et demande

faiblement corrélée avec les choix


0.962 0.192 0.962

0.192 1.000 2.120

0.962 2.120 5.560


Vraies valeurs: (Y = 1. 0 = 1, q = 0.192. ~2 = 0.962.

Résultats

Statistiques et tests --


ct 1.09 0.03 34.73 0.01 0.03 1.03 1.16 1.06 1.09 1.11

0 1.00 0.03 29.25 0.00 0.03 0.93 1.08 0.97 1 .O0 1.01

KI 0.29 0.06 4.82 0.02 0.08 0.06 0.47 0.24 0.29 0.34

K* 1.289 0.13 6.91 0.02 0.14 0.60 1.26 0.78 0.88 0.97



EXPÉRIENCE #5:Chobc discrets faiblement interdépendants et

demande faiblement corrélée avec les choix


0.200 0.400 0.020

0.400 1.000 0.040

0.020 0.040 0.159


Vraies valeurs: cu = 1, 8 = 1, K I = 0.40, = 0.02.

Résultats

I Statistiques et tests I moyenne ect stat-t eqm var.e. min. max. 25 perc. 50 perc. 75 perc.

a 1.03 0.01 76.87 0.00 0.01 1.00 1.07 1.02 1.04 1 .O4

e 1-00 0.02 65.35 0.00 0.01 0.96 1.03 0.99 1.00 1.01

K I 0.29 0.03 9.27 0.01 0.03 0.23 0.38 0.28 0.29 0.31

KQ 0.02 0.01 1.78 0.00 0.04 -0.08 0.12 0.00 0.02 0.05



5.2 Évaluation empirique: Estimation en deux étapes

d'un modèle discret/continu de la demande

d'électricité dans le secteur résidentiel des québécois.

5.2.1 Introduction

Depuis la contribution de Dubin et McFadden (1984)' la demande d'électricité est

explicitement considérée comme le résultat d'une décision conjointe sur le choix des

appareils ménagers en fonction de la forme d'énergie utilisée pour leur fonctionnement

et la consommation d'électricité qui en découle. En s'inspirant de la littérature qui

r raitait du problème d'autosélection, ils considèrent que toute modélisation qui ignor-

erait le fait que les deux décisions sont interdépendantes conduirait A des estimateurs

non convergents, ce qui decterait la qualité des estimations des élasticités prix et

revenu. Dans leur travail, le choix entre les appareils était modélisé à l'aide d'une

approche logi t poiytomique (MNL) . L'estimation du modèle discret/continu a été ef-

fectuée en deux étapes et une correction de type Heckman fut développée pour le

contexte logit polytornique. BBB (1996) ont fait une extension de l'approche de Du-

bin et McFadden en permettant une structure peu restrictive lors de la modélisation

de la partie discrète à l'aide d'une formulation MNP. Le MNP est réputé être la

formule recommandée lorsque les alternatives sont interdépendantes entre elles.

Dans BBB (1996), parmi les neuf modes de chauffage de l'eau et des locaux con-

sidérés, admettre la présence d'interdépendances entre les modalités semblait justifié

et le processus d'estimation devait en tenir compte sous peine de donner lieu à des

estimateurs non convergents. La présence des interdépendances entre les modalités a

été introduite dans le modèle via la structure de corrélation de termes d'erreur nor-

malement distribués. Pour I'estimation, une méthode en deux étapes était utilisée. La

dimension discrète était modélisée à l'aide du maximum de vraisemblance simulée avec

des probabilités de choix probit remplacées par des simulateurs efficients. La deuxième

étape exploitait une régression instrumentale linéaire de façon à tenir compte de la

sirnult anéité entre les d e u décisions.

La contribution de cette partie du travail est de reconsidérer le modèle formulé

dans BBB (1996) à l'aide d'une approche en deux étapes où la deuxième concerne

l'estimation de la demande d'électricité par les MC0 en introduisant un terme de

correction pour le biais de sélection exprimé en terme d'espérances conditionnelles.

Cette dernière méthode fut précédemment laissée de côté en faveur de méthodes plus

ad-hoc, telles que les méthodes à formes réduites ou à variables instrumentales, à

cause des difficultés techniques résultants de son application Lorsque les choix discrets

sont interdépendants. La difficulté principale lors de l'estimation des modèles avec

choix interdépendants origine de la présence d'intégrales normales multidimension-

nelles qui se retrouvent non seulement dans la log-vraisemblance via les probabilités

de choix? mais aussi dans les expressions du biais de sélection via les moments con-

ditionnels. De plus, la partie discrète de notre modèle fait usage d'une formulation

M'IP conventionnelle contrairement à celui dans BBB qui considérait une formulation

MNP hybride à noyau logistique. Par ailleurs, à la différence de Dubin et YcFad-

den qui avaient, dans les mêmes circonstances, une expression du biais de sélection

fort bien manipulable, nous allons faire usage de récentes techniques de simulation

pour dériver le terme de correction pour la sélectivité lequel comporte des intégrales

multidimensionnelles. Les formes fonctionnelles ainsi que la spécification du modéle

suivent de très près l'étude de Dubin et McFadden. En effet, les fonctions de demande

conditionnelles d'électricité sont linéaires dans les prix et proviennent de l'application

des identités de Roy à une fonction d'utilité indirecte non linéaire bien spécifique.

Nous appliquons cette formulation pour modéliser la demande d'électricité dans le

secteur résidentiel québécois en prenant en compte le système de chauffage de l'eau

et des locaux utilisé.

Dans la province de Québec, il existe une vaste gamme de sources d'énergie pour

le chauffage de l'eau et des locaux. En 1989, 64% des ménages utilisaient l'électricité

pour le chauffage des locaux, dors que 16% utilisaient le mazout, 7% le gaz na-

turel, 6% la bi-énergie (électricitéfmazout ou électricité/bois). et 6% d'autres sources

(principalement le bois). L'électricité, le gaz naturel et le mazout sont aussi utilisés

dans le chadage de l'eau. Durant les vingt dernières années, le Québec a observé le

délaissement du mazout en faveur de l'électricité. La popularité de l'électricité a été

acquise aux dépens exclusivement du mazout alors que les autres sources d'énergie

ont gardé les mêmes parts. Il y a aussi une utilisation importante de la bi-énergie:

électricité/rnazout ou électricitéJbois. Considérant la part imposante de l'électricité

dans le chauffage de l'eau et des locaux, il apparak important d'analyser si les

phénomènes observés peuvent être expliqués en termes des variables économiques

de base comme les prix relatifs, le revenu et les caractéristiques des ménages.

Dans la section suivante, nous présentons un modèle de la demande d'électricité

qui découle du choix des appareils de chauffage en tenant compte de la forme d'énergie

qu'ils utilisent pour leur fonctionnement. Par la suite, le modèle économétrique re-

latif au système discret/continu est dérivé. L'analyse empirique proprement dite, en

particulier les estimations des élasticités prix et revenu de court et long terme sont

obtenues à l'aide de l'approche en deux étapes spécifiée ci-dessus. Les résultats de

l'estimation provenant de l'approche à correction sont comparés a ceux qui découlent

de l'application des approches ad-hoc.

5.2.2 Le système économétrique discret /continu

Le modèle discret/continu que nous considérons dans notre application part du problème

d'un agent n(n = 1: ...: N ) qui est appelé à prendre une décision sur le cho~u d'un

mode de chauffage de l'eau et des locaux dans un ensemble de choix comportant neuf

modalités ainsi que sur la quantité d'électricité à consommer. Techniquement cela

suppose la description de la réalisation de ( 2 , d) où i représente un mode de chauffage

de l'eau et des locaux donné parmi un ensemble de J, possibilités disponibles et où d

est la demande d'électricité. Étant donné que le choix sur i et la quantité d'électricité

consommée dépendent des mêmes facteurs: il devient important de modéliser les deux

de façon simultanée. Une méthode de vraisemblance A information complète permet

de déterminer A, le vecteur des paramètres du modèle qui maximise la densité jointe

P(i, dl A) associée à (i, d). Soit in la modalité choisie par le ménage n et soit dn

sa demande d'électricité. L'approche du maximum de vraisemblance à information

complbte peut être enectuée en spécifiant une forme pour la fonction de densité jointe:

qui reconnaît le caractère continu de d, (la demande d'électricité) et discret de in.

Le terme H, est un vecteur de variables exogènes alors que X est un vecteur de

paramètres à estimer.

L'aide des propriétés des probabilités coiiditionnelles, nous pouvons écrire la

fonction de densité comme le produit d'une probabilité et d'une fonction de densité

condit ionneNe. Nous obtenons:

P ( k , LI&; A) = P(kIH,; A) g(dnIG, H n ; A), (5.42)

où P(i,IH,; A) est la probabilité de choisir in étant donné H, et g(& lin, H,; A) est la

fonction de densité de la demande d'électricité conditionnelle au mode de chauffage

sélectionné.

Dans le but de maintenir une certaine cohérence entre les décisions sur le choix des

appareils de chauffage en fonction de la forme d'énergie qu'ils utilisent et celle continue

sur la décision de leur usage, nous exploitons une fonction de demande d'électricité

qui découle des identités de Roy appliquées à la fonction d'utilité relative à chaque

mode de chauffage. -4 l'instar de BBB, la fonction d'utilité indirecte décrivant l'utilité

procurée par une modalité i au ménage n est définie en fonction des prix des différentes

sources d'énergie, du revenu et des attributs spécifiques à chaque ménage comme suit:

vin : utilité non observée associée au système z telle que perçue par le ménage n,

Pen : prix de l'électricité,

Pm : prix du gaz naturel,

Pmn : p r k du mazout,

Qn : vecteur des caractéristiques du ménage,

Yn : le revenu du ménage n,

rin : coût total annualisé du cycle de vie du système i (rin = PIOPin + /PICPi,),

P I 0 Pin : coût total annuel d'opération dû a l'utilisation du système i par le ménage n,

PICPin : coût totai annuel du capital relatif à l'utilisation du système i par le ménage n,

P : taux d'escompte considéré, tout comme dans Dubin et McFadden,

comme une fonction linéaire du revenu y.

{in : un terme d'erreur propre au ménage n et à la modalité i.

Dans Dubin et McFadden (1984), les ch sont supposés i.i.d. Gumbel et cela donne

lieu au MNL. Quant à BBB, ils ont exprimé le terme d'erreur Q comme une somme de

deux composantes ci, = t vin où oi est l'écart type spécifique à la ième modalité

et i, = x i . W, ,, €in + Gin avec Ci, - i.i.d.N(O, 1). Ce terme d'erreur est considéré

issu d'un processus autoregréssif généralisé. Les composantes w,,, sont des poids,

p est un coefficient de corrélation et Y, - i.2.d gumbel. Ces hypothèses spécifient

un modèle MNP hybride à noyau logistique. L'avantage de cette spécification est de

produire des probabilités de choix qui prennent la forme d'espérances de probabilités

de choix logistiques conditionnelles5. Dans le présent texte, nous nous plaçons dans

un contexte purement normal pour les termes d'eneur Sin, i = 1, .. ., Jn, ce qui définit

un MIIP conventionnel. Par souci de parcimonie, la structure d'erreur est postulée

comme étant issue d'un processus similaire à celui employé dans BBB.

Appliquant les identités de Roy à la fonction d'utilité indirecte, nous obtenons la

demande conditionnelle d'électricité:

où 9 est un terme d'eneur reflétant les facteurs comme l'hétérogénéité non observée,

les erreurs de mesure et l'ignorance du chercheur. Les formes fonctionnelles pour V,,(.)

et Din(.) sont identiques à celles utilisées dans BBB donnant lieu à des demandes

linéaires dans les prix et le revenu. Dans les lignes qui suivent nous présentons une

discussion plus détaillée concernant chacune des deux dimensions du problème.

5.2.3 Le modèle de choix

.a de tenir compte des interdépendances entre les modalités présentes dans notre

étude, le modèle de choix discret que nous présentons utilise une formulation probit

polytomique. Pour un ménage donné n, n = 1, ..., iV, et une modalité i, i = 1, ..., Jn

où J, est le nombre de modalités dans l'ensembIe de choix Cn, nous pouvons écrire

le modèle comme suit:

( O autrement,

où chin est le c h ~ k observé et Uin est l'utilité que procure l'alternative i telle que

perçue par le ménage n et telle que définie a l'équation(5.43). Comme le laisse voir

la notation, nous supposons que chaque ménage a un ensemble de choix qui lui est

S~ou r plus de dét& consulter BBB (1996).

spécifique. Cela nous permet de tenir compte du fait que le gaz naturel n'est pas

disponible dans toutes les régions de la province.

La fonction d'utilité procurée par la modalité i telle que perçue par le ménage n

a pour forme fonctionnelle

Vin = ,Y,$ t (yn - rifil6 i (inin, (5 .44

où ,Y,, est un vecteur des variables exogènes du modèle, P un vecteur de paramètres,

6 un paramètre attaché a la Mnable revenu net du coût d'utilisation du système i.

les autres composantes ayant été définis précédemment.

Notons que <,, = [Sin, ..., Cgn] - N(0, C) où C est la matrice de variance-covariance

décrivant la structure d'interdépendances entre les utilités. Dans le but de réduire le

nombre de paramètres de nuisance constituant la matrice E, nous faisons l'hypothèse

que les 4 proviennent d'un processus autoregréssif généralisé d'ordre 1 (GAR(1)) (voir

Ben-Akiva et Bolduc (1991) et Bolduc (1992). Cette hypothèse a été utilisée dans

BBB (1996) et s'avère très utile car elle réduit de beaucoup les difficultés de calcul

lors de l'estimation du modèle. Par ailleurs, il est connu que certaines restrictions

d'identification devraient être imposées pour que les paramètres de la partie discrète

soient estimables. En règle générale, les pararnktres qui peuvent être estimables sont

ceux présents dans une version du modèle écrite en déviation par rapport à une

alternative donnée. De plus, pour fixer l'échelle, une variance doit fixée à une certaine

valeur. Par convention, nous retenons le modèle en déviation par rapport i la dernière

modalité que nous dénotons c. Le modèle en déviation s'écrit:

où les différentes variables sont en déviation.

Pour estimer les paramètres dans cette dernière équation par la méthode du max-

imum de vraisemblance, nous avons besoin de calculer la probabilité Pn(i) associée à

l'alternative sélectionnée. Prenant la dernière alternative comme référence, un ménage

damé choisira la modalité c si Um < U , Qi, ce qui implique que:

pour tout i, i = 1, ..., 8. Pour évaluer cette probabilité de choixo nous devrions cal-

culer des intégrales normales de dimension 8. Ceci ne peut pas être fait de façon

numérique dans des temps raisonnables. Étant donné ces difficultés, nous suggérons

le remplacement de Pn(i) par le simulateur de Geweke, Hajivassiliou et Keane (GHK)

que nous écrivons comme &z). Ce simulateur peut être calculé comme une moyenne

empirique prise sur T tirages différents des f*c,n:

où &(c) est calculé à l'aide de produits de fonctions de densité cumulatives6.

5.2.4 Le modèle de demande conditionnelle

Étant donné la fonction d'utilité dans l'équation (5.43), nous dérivons la demande

d'électricité à l'aide des identités de Roy. Dénotant la demande d'électricité par ci,, et

considérant ynl ri,, comme exogènes, la fonction de demande a la forme fonctionnelle

suivante:

di = + a e P e n - agPgn + %Pmn + Qin7 + 6(yn r in ) + k. (5.46)

Comme nous I'avans déjà mentionné, la demande et le choix sont corrélés. Cette

hypothèse implique donc que qn est corrélé avec les termes d'erreurs <in. R devient

6Pour plus de détails sut le simulateur se référer, entre autres, à GREENE (1996), pp. 156-157.

donc important et légitime d'introduire ce fait dans le modèle en écrinnt l'équation

de la façon suivante:

où Z*O est un terme spécifique à la partie continue alors que E (% Ii) est la correction

pour le biais de sélection et en a les propriétés habituelles d'un terme d'erreur de

régression. De façon plus compacte, nous écrivons:

5.2.5 Estimation de la partie discrète

La méthode d'estimation retenue pour la partie discrète est basée sur la maximisation

de la log-vraisemblance simulée. Soit X le vecteur des paramètres d'intérêt pour notre

modèle de choix discret. La fonction de vraisemblance pour une observation est

donnée par: ,

Il convient de noter que cette expression ne retiendra que la probabilité associée

choix effectué par le ménage n.

La fonction de vraisemblance va donc s'écrire comme suit:

et la log-vraisemblance

N Jn

L(.) = C 1 c h , ln Pn(IICn).

La version simulée de la log-vraisemblance consiste à remplacer Pn(i(Cn) par un

simulateur de probabilité tel que:

m, où &(il = n Oint. La forme spécifique de &(a') est décrite dans Bolduc (1999). Les

k l

paramètres d'intérêt sont obtenus en maximisant la log-vraisemblance simulée7.

5.2.6 Estimation de la partie continue

Partant de l'équation de la demande conditionnelle d'électricité, nous avons

Nous devons tout d'abord trouver une expression pour le biais de sélection. Sachant

que

E (714 = Etii [E (dc)1 7

et faisant I'hypothèse que

E (012) ne peut être obtenue de façon exacte. Nous utilisons donc un simulateur

"d'acceptation et rejet conventionnel" (CAR) pour l'évaluer. Comme mentionné plus

bas. cette approche a été préférée à d'autres techniques de simulation sur base de nos

expériences Monte Carlo. Pour un ensemble de choix donné de taille J1 nous avons:

C L2 = COV(~, {) = K!: est le vecteur (1 x J ) des covariances entre le terme

d'erreur de la partie continue et chacun des termes d'erreur de la partie discrète,

a CZ2: est la matrice (J x J) de va,riance comriance des erreurs de la partie discrète,

SLes détails sur la programmation et les dérivées andytiques sont fournis dans Bolduc (1999).

rn E (512): est le vecteur ( J x 1) des moyennes des erreurs conditionnelles au choix

effectué à la partie discrhte.

L'espérance E ([ii) se présente sous forme d'intégdes normales multidimension-

nelles, à cause de l'interdépendance entre les modalités. Pour l'évaluer, nous nous

servons d'un simulateur que nous dénotons E mi). En pratique, nous l'évaluons

comme suit:

où nous utilisons le fait que les composantes c;: et E (c/i) sont estimées de façon

convergente lors de la première étape.

Calcul des espérances conditionnelles

Sans entrer daos trop de détails techniques concernant la façon de produire le simu-

lateur de E ({li), il co"ent de noter qu'il est cakulé comme suit:

où tt est un vecteur 5 de composantes [<$ &li] du modèle d'utilité en (5.44)

qui respecte les inégalités en (5.45) découlant du choix observé pour le ménage n.

Dans le calcul de ce simulateur, tout tirage de 5 ne respectant pas les inégalités

en (5.45) est écarté. Ce simulateur est connu pour produire des estimations des

moments sans biais. Xous avons décidé de privilégier la méthode CAR aux dépens

de deux autres approches à savoir la méthode d'"acceptation rejet accéléré" (ARA)

et l'échantillonnage de Gibbs sur la base d'expériences cie Monte Carlo. Les détails

sur ces simulateurs peuvent être obtenus dans Gourieroux et Montfort (1996).

Cas particulier

Si les fi de la partie discrète sont normaux i.i.d., nous avons

Ceci implique que

Dubin et McFadden (1984) ont obtenu une expression similaire basée sur les hy-

pot hèses suivantes:

6 NGEV i.2.d (valeurs extrêmes généralisées) avec E(&) = O

a l'écart type de 77,

a R corrélation entre Si et 7.

Avec ces spécitications, le terme de correction devient:

- E (912) = RP;'E(&~Z) + R2~~1E((21i) + + R,a~~~(<,li).

Comme obtenu dans Dubin (EMS),

alors que

pour tout j # i.

De retour à

deuxième étape

Le terme de correction devient finalement:

notre spécification, le modèle de régression que nous estimons a la

est réécrit comme:

Sous forme matricielle, nous obtenons:

où

d: un vecteur (N x 1) des quantités d'électricité demandées par le ménage n,

0 X/3 e t 2 0 sont des vecteurs (N x 1) tels que définis antérieurement,

0 L6: un vecteur (iV x 1) où L est donné par (y - r), -

g: une matrice ( N x J ) des valeurs estimées telles que 8 =E (cli) z;;' , ( N x J ) ( J x J )

O Z - 1V(O, oz): un vecteur de termes d'erreur,

O avec J = max J,.

Xous allons donc appliquer les MC0 à I'équation ci-haut. Pour fins de com-

paraison, nous reproduirons aussi les résultats des deux autres méthodes à étapes

à savoir celles basées sur les variables instrumentales et les formes réduites utilisées

dans BBB. Pour dériver les deux autres approches, réécrivons la demande d'électricité

conditionnelle de la même manière que dans BBB:

où &,, est une variable indicatrice valant 1 si in = j et O autrement alors que in

est la modalité choisie par le ménage n. L'estimation des paramètres de l'équation

précédente par la méthode à forme réduite consiste à remplacer les 6ijn dans l'équation

précédente par Les estimations des probabilités Fn(i) de choix obtenues à la première

étape. Quant à la méthode à variables instrumentales, nous appliquons les MC0

à l'équation précitée où les 6,, sont remplacés par les valeurs prédites issues de la

et toutes les autres variables exogènes présentes dans Q,.

Matrice de variance covariance corrigée

La formulation du problème en deux étapes permet de remédier aux difficultés associés

à I'utilisation de I'approche du maximum de vraisemblance à information complète.

Mais l'utilisation de la méthode séquentielle nécessite des corrections à la matrice de

variance covariance des paramètres estimés. Les corrections que nous suggérons pour

le cas présent suivent de près l'étude de Murphy et Topel (1985).

Nous pouvons reprendre la demande conditionnelle en (5.48) comme

ou sous forme matricielle

Pour l'estimation de la partie continue, nous remplaçons S($) par s(,$) où $ est le

vecteur des paramètres estimés à la partie discrète. De façon plus compacte, nous

avons:

d = VVn + E,

où W = [X Z L S ] e t T = [P 19 6 n]. L'estirnateur des moindres carrés ordinaires

(MCO) pour T est donné par

ii = (w'w)-' W'd,

alors que la matrice de variance covariance corrigée se présente comme suit:

Var(?) = (w'w)-' W' [ ~ o r ( e l i ) + (n' 8 I,)F liar(4) Fi(I , 8 n)] W (w'w)-' ,

avec

e t

qui est formée d'éléments simulés et var@) qui est la matrice de mriance cornriance

asymptotique de la première étape laquelle est aussi affectée par la simulation. Elle

se présente sous la forme suivante:

avec

qui est la matrice d'information. La première composante est la matrice de variance

covariance conventionnelle et la deuxième est attribuable au bruit provenant de la

simulation qui tend vers O lorsque le nombre de tirages devient important, ce qui est

le cas dans notre travail.

Par ailleurs, pour évaluer Vur(eii), nous avons besoin d'un simulateur pour E(q2 [i) . Dans la pratique, suivant la même procédure que lors du calcul de mi), pour 7 et

5 distribués comme antérieurement, nous avons

avec

suggérant le simulateur suivant

avec

où les termes t? et sont estimés à la deuxième étape.

La matrice de variance covariance asymptotique ainsi comgée nous permet d'éviter

une évaluation érronée des écarts types.

5.2.7 Données et spécification du modèle

Données

Les données utilisées dans la présente étude proviennent d'une enquête postale faite

par HydreQuébec en 1989 sur la consommation d'électricité. Pour l'estimation, nous

avons utilisé la même banque de données que BBB (1996). Le taux de réponse à ce

questionnaire était de 44.9% alors que 46833 ménages ont répondu sur 101977 ques-

tionnaires envoyés. Le souséchantillon sélectionné pour cette étude était composé de

maisons uni-familiales (détachées, semi-détachées ou en rang avec entrées séparées),

qui étaient soit construites ou converties à une autre source d'énergie de chauffage

de locaux durant la période allant de 1986 à 1989. Ceux-ci étaient des restrictions

imposées pour avoir une période où les prix des différentes sources d'énergie étaient

relativement stables après la chute du prix du mazout en 1986 et aussi pour avoir un

échantillon homogène. L'échantillon retenu est composé de 3090 observations.

Le questionnaire comprend outre l'information sur les caractéristiques des ménages,

celle sur les Mnables socio-économiques. L'information sur la consommation a été

obtenue de Hydro-Québec, alors que les données sur les prix utilisés dans le calcul des

coûts d'usage et de capital des systèmes de chauffage de l'eau et des locaux ont ét4

recueillies auprès du gouvernement du Québec (1992). La disponibilité en gaz pour

chacun des ménages ont été déterminées sur base du code postal et de l'information

recueillie auprès de Gaz Métropolitain. Les valeurs et détails sur les calculs des coûts

de capital et d'opération se retrouvent dans Bélanger (1992).

Sp6cification du modèle

Comme mentionné précédemment, pour fins d'identification, une modalité devait être

considérée comme la base et les autres prises en déviation par rapport a elle. Nous con-

sidérons la modalité 7 (électricité/électricité) comme base. Ainsi, tous les effets sont

modélisés relativement à celle-ci. Comme stipulé dans la notation antérieurement,

certaines variables (X,, y,, et rin) apparaissent aussi bien dans la partie discrète

que celle continue, certaines d'autres (2,) dans la partie continue seulement. Cer-

taines wiables étaient exclues de certains groupes spécifiques sur base de statistiques

basées sur le ratio de i~aisembhmes. En ce qui concerne la structure de conélation

des termes d'erreur de notre probit, nous avons utilisé la même spécification que BBB

(1996).

Sans entrer dans les détails sur le processus GAR(l), pour les besoins de notre

étude, il suffit de signaler que ce processus nous a permis de représenter notre stnic-

ture de variance-covariance à l'aide de quelques paramètres supplémentaires. Ces

paramètres sont ol, 0 2 et p. Le paramètre ol est un coefficient d'échelle qui est com-

mun à toutes les alternatives qui ont en commun l'électricité comme source d'énergie

dans l'une des composantes du système, 0 2 est un effet d'échelle relatif auu alterna-

tives qui ont le bois comme une des sources d'énergie. Finalement, le coefficient p

est un paramètre de corrélation capturant les similarités entre les alternatives. Avec

un p positif, les alternatives sont considérées comme similaires alors qu'un p négatif

implique des dissimilarités.

5.2.8 Résultats et interprétations

La lecture des résultats apparaissant dans les tableaux relatifs à chacune des parties

de notre modèle veut que XOM q indique que la variable nom a un effet identique sur

les alternatives x et y. Les effets spécifiques à une seule alternative ont seulement une

valeur simple x. Il faut aussi noter que le mot générique veut dire que la variable est

relative à toutes les alternatives, même celle considérée comme la base. Les résultats

ont été obtenus à l'aide du maximum de vraisemblance simulé via le simulateur GHK

basé sur 100 tirages. Comparativement aux résultats obtenus a l'aide de 50 tirages,

nous observons que seules les estimations qui étaient non significatives changent de

valeur lorsque le nombre de tirages passe de 50 à 100. La valeur de la fonction objec-

tive à convergence est de - 1486.016. Nous présentons l'interprétation des résultats

obtenus.

Le modèle de choix

Les constantes spécifiques à chacune des modalités autres que la septième révèlent que

l'op tion 7 (électricit é/électricité) est préférée à toutes les autres: c'est ce que révèlent

les estimations négatives obtenues pour toutes les autres options étant donné que

le modèle est en déviation par rapport à l'option 7. Par ailleurs, les résultats lais-

sent voir que plus une option a de l'électricité comme source d'énergie, plus elle

sera préférée a u autres en contenant moins. Si l'on considère les options qui parta-

gent le même système de chauffage de l'eau ou des locaux, celle faisant plus appel à

l'électricité est préférée aux autres. C'est le cas de Bi-énergie/électricité (-2.27) qui

est préférée à Bi-énergie/mazout (- 2.93); mazout/électricité ( - 5.18) qui est préférée

à rnazout/mazout(-8.45). Ceci correspond bien aux conclusions de BBB (1996).

Secteur: Les estimations de la densité de la population sont positives? montrant

une préférence marquée de l'option 1 (gazlgaz) et de la bi-énergie par rapport à

l'électricité. Cela peut trouver son explication dans le fait que la distribution du

gaz naturel est principalement développée dans le milieu urbain où la densité de

la population est élevée. Cette mrîable est représentée par des valeurs numériques

augmentant avec la densité de la population (rural:l, peu urbain:2: urbain:3, haute

densité:4). 11 ressort de ces constatations qu'une augmentation de la densité de la

population entraîne une augmentation de la préférence pour l'option gaz/gaz.

Degrés-jours de chauûage: Cette wuiable décrit les effets du temps sur le choix

du système de chauffage. En se rappelant que les systèmes de chauffage électriques

ont des coûts de capital relativement faibles mais des coûts d'opération élevés alors

que les autres systèmes ont des coûts de capital relativement élevés contrairement aux

coûts d'opération, on peut dire que les estimations positives obtenues pour toutes les

mriables de degrésjours de chauffage signifient que plus il fait froid, plus les gens

préferent utiliser les options autres que l'électricité à cause des coûts d'opération

élevés.

Date de conversion et date de construction: Comme stipulé dans la partie

introductive, nous avons observé des changements dans les prix durant la période

à l'étude en faveur des autres formes d'énergie comparativement à l'électricité. De

plus, la disponibilité des certaines sources d'énergie comme le gaz naturel ont pris

de l'ampleur avec le temps. Ceci explique les estimations positives observées pour la

date de conversion et celle de construction. Plus la maison a été convertie à un autre

système récemment ou plus elle a été construite récemment, plus le choix du système

de chauffage est porté sur d'autres sources que l'i%xtricité.

Nombre de personnes: Plus il y a d'individus dans le ménage, pius les gens

préfèrent d'autres options par rapport à l'électricité; c'est ce qu'indiquent les estima-

tions positives obtenues.

Surface: En se rappelant que les autres options nécessitent un coût en capital

relativement plus élevé que l'électricité, si les gens y investissent, c'est qu'ils ont

des grands espaces à c h a d e r et pensent à leurs coûts d'opération. Les estimations

positives obtenues vont dans ce sens: plus la surface est grande, plus on préfère

d'autres systèmes au détriment de l'électricité.

Âge: Plus le soutien de famille est âgé, plus on est porté à choisir le gaz alors que

Les options contenant du bois (options 8 et 9) sont délaissées au profit de l'électricité.

Ceci s'explique par le fait que ces dernières options requièrent des efforts de manipu-

lation qui sont incompatibles avec l'âge.

Revenu: Les estimations négatives montrent que les ménages plus riches préfèrent

utiliser l'électricité comme source de chauffage.

Les coûts: Les variables de coût d'opération et fke ont des estimations négatives

stipulant que les systèmes plus coût eu^ diminuent l'utilité des ménages.

Les estimations obtenues pour les éléments de la structure de covariance des ter-

mes d'erreur de la partie discrète montrent bel et bien que les modalités sont in-

terdépendantes. En particulier, les valeurs de 01 et 0 2 qui représentent les écarts types

spécifiques à chaque alternative, estimations qui sont significatives dans notre modèle.

Combiné à cette manifestation de corrélation est le paramètre de l'autocorrélation

p,qui est aussi significatif, mesurant le degré de dépendance linéaire entre chaque

mode de chauffage et ceux qui lui sont proches. Cette combinaison des termes relatifs

A ia structure de corrélation des termes d'erreur de la partie discrète témoigne bien

de la pertinence du choix du UXP pour modéliser la partie discrète.

La demande d'électricité

Pour mesurer d,,, nous avons utilisé la quantité totale d'électricité en kWh consommée

par un ménage donné. Pour avoir une base comparative, nous fournissons aussi les

résultats de l'estimation de notre modèle de demande obtenus à l'aide de dewc autres

méthodes à savoir celle basée sur les formes réduites et ceile émanant des variables

instrumentales à l'aide de la spécification utilisée dans BBB (1996). A l'examen des

estimations pour les constantes, nous avons constaté que l'utilisation des systèmes

3, 4 et 9, lesquels contiennent essentiellement la bi-énergie, le mazout et le bois

diminue la consommation d'électricité pour le ménage considéré. Par ailleurs, le

prix de l'électricité (Prixel) a différents effets selon l'utilisation qui en est faite: les

consommateurs résidentiels utilisent l'électricité pour chauffer les locaiix (Peleloc) et

pour l'eau (Peleeau). Comme on devrait s'y attendre, l'effet global est négatif, Prive1

ayant la plus grande valeur absolue. Les prix du mazout et du gaz naturel ont un

effet positif sur la consommation d'électricité.

La variable pour la date de construction a un effet négatif insinuant que plus

récente est la date de construction (datcon) de l'habitation, moindre est la consomma-

tion d'électricité. Cela est le résultat des standards d'efficience dans la consommation

d'électricité imposés vers les années 80. Le type de maison (nhabi) (1: détaché, 2:

semi-détaché, 3: rangées de trois ou plus), indique que les habitations détachées con-

somment plus d'électricité. La consommation d'électricité augmente avec le nombre

de personnes (npers) dans l'habitation, la surface (surf) de la maison et l'âge (âge)

du chef de famille. Les gens qui sont propriétaires consomment moins d'électricité

comparativement aux locataires (nprlo). Enfin, plus le gaz est disponible. moins les

gens demandent d'électricité.

Les différentes valeurs obtenues pour les paamètres de la corrélation entre les

termes d'erreur de la partie discrète et ceux de la partie coutinue laissent voir qu'une

seule d'entre huit valeurs possibles est significative. Cet état de choses a en partie

Tableau 5.13: Résultats de l'estimation: Le modèle de choix (T=100)

M G D ~ L E DE CHOIX Variables explicatives Nom Effet Estimations &.type stat-t

Gaz/gaz Gaz/électrici té Bi-énergie/mazout Bi-énergie/électricité Mazout/mazout Mazout /électricité Bois /électricité ois-Électrici télélectricité Secteur

Degrés-jours de chauffage

Date de conversion

Date de construction

cons t 1 const2 const3 const4 const5 const6 const8 constg

sect 1 sec t 23 sec t89 hddml hddm2 hddmS hddm6

hddm89 datconvl datconv3 datconv4 datconv5 datconv6 datconv9 datconl2 datcon3 datconS

datcon89

Tableau 5.14: Résultats de I'estimation(suite): Le modèle de choix iT=100) Variables evplicatives Nom Effet Estimations Ec.type stat-t Nombre de personnes nbpersl 1 -0.478 O . -3.18

Surface

Age

Revenu

PIOP PICP

nbpers2 nbpers3 nbpers5 nbpers6 nbpers8 suxf4 surf56 surf89 age 1 age4 age89 rev2 rev3 rev4 rev56 rev8 rev9 coutm coutfk

2 3 5 6 8 4

5 et 6 8 et 9

I 4

8 et 9 2 3 4

5 et 6 8 9

générique générique

PICP x Y coutfiy générique O 3 3 0.12 4.41 STRUCTURE DE COVARIANCE DU TERME D'ERREUR

trouvé une explication lors de la conduite d'expériences Monte Car10 et le résultat

obtenu était que si les deux parties du modèle étaient reliées, les estimations obtenues

devraient être significatives. Dans le cadre de cette étude empirique, nous pouvons

expliquer le fait qu'un seul des éléments des covariances entre les deux parties soit

simcatif p u le fait que la structure de la partie discrète repose sur une formulation

destinée à capturer les similitudes entre les modes de chadage en blocs et non de

façon généralisée.

5.2.9 Élasticités prix et revenu

Le tableau à la page suivante résume les élasticités prix et revenu relatives à notre

modèle. Les valeurs sont calculées aux moyennes échantillonales. Les valeurs obtenues

sont différentes de celles qu'on retrouve dans BBB (1996).

Pour obtenir ces élasticités, nous avons utilisé l'équation de demande non condi-

t ionnelle:

E ( 4 = E(x/i)P,, (5 . 50) j

où E ( z / j ) est la demande d'électricité conditionnelle au choix de la modalité j dans

la demande totale. Avec ces résultats, nous pouvons écrire l'élasticité de E ( x ) par

rapport à p comme:

où iuj est la p a n des demandes conditionnelles à la modalité j .

5.2.10 Conclusion

La motivation de notre travail est de développer une technique d'estimation en deux

étapes des modèles économétriques de choix discret/continu dans le cas où les cho~u

discrets sont interdépendants. ?Tous utilisons les récentes techniques de simulation

pour évaluer les moments conditionnels qui entrent dans la formulation du biais de

sélection résultant de la simultanéité des décisiors discrètes et continues. En guise

d'application, nous appliquons la technique à l'évaluation de la demande d'électricité

conditionnelle au choix d'un mode de chauffage de l'eau et des locaux dans les ménages

québécois. Les estimations des élasticités ont les signes corrects et sont. pour la

pluparto conformes à nos attentes.

Tableau 5.15: Résultats de l'estimation: La demande conditi,onnelle d'électricité DEMANDE D'ELECTRICITE

MC0 MCOC FR VT Parms Estimations stat-t Estimations stat-t Estimations stat-t Estimations stat-t

7 1 2 3 4 5 6 8 9 prixel secteur datconv nhabi dat con npiec nbpers nprlo surf âge revnetc remet Picpc P~CP gasava Pelelo c Peleeau Primaz Prigaz S A 7 S37 S37 SA7 S-57 5-67 S N S37

hEOC: MC0 avec correction FR : Formes réduites VI: Variables instrumentales Parms: Paramètres

NOTE TO USERS

The original manuscript received by UMI contains pages with indistinct print. Pages were

microfilmed as received.

This reproduction is the best copy available.

UMI

Tableau 5.16: Élasticités prku et revenu

de l'électricité du mazout Options M C 0 GCOC FR VI MC0 MCOC FR VI

Gm/gaz - 11.4096 Gaz/électricité -10.6304 Bi-énergie/mazout - 1.3808 Bi-énergie/électricité -0.8656 Mazout /mazout -12.6084 Mazout /électricité -6.3386 Électricité/électricité -0.9323 Bois /électricité -7.4649 Bois-électricité/électricité - 1 .Xi 74

Moyenne -5.8764 -1.4774 -0.603 -0.674 0.1512 0.2032 0.042 0.01 Élasticité de long terme -1.2859 -2.0762 -0.053 -0.066 0.0990 0.1325 0.030 0.0:

du gaz revenu

Gaz/électricité Bi-énergie/mazout Bi-énergie/électricité Mazout/mazout Mazout/électricité Électricité/électricité Bois/élect ricité Bois-éiectricité/élect ricité

Moyenne 0.1015 0.0957 0.077 0.077 0.1328 0.1314 0.109 0.13' Élasticité de long terme 0.071 l 0.0671 0.057 0.057 0.0901 0.0892 0.076 0.09

MCOC: M C 0 avec correction. FR : Formes réduites VI: Variables instrumentales

Chapitre 6

Conclusions

Dans cette thèse, nous nous sommes intéressés à l'élaboration des techniques rel-

atives à l'estimation de façon efficiente des modèles économétriques de chok dis-

crets/continus lorsque les choix discrets sont interdépendants. Yous avons abordé

l'estimation dans le cadre des deux méthodes principalement utilisées à savoir celle

du maximum de vraisemblance à information complète qui consiste a estimer Ies

paramètres du modèle en une seule étape et celle du maximum de vraisemblance

à information limitée qui consiste à estimer le modèle en deux étapes. La princi-

pale difnculté associée à l'estimation de ce genre de modèles est liée à la présence

d'intégrales multidimensionnelles apparaissant non seulement dans la fonction de log-

vraisemblance via les probabilités de choix mais aussi dans les expressions du biais de

sélection sous forme de moments conditionnels. La contribution de ce travail est de

dériver un cadre permettant en un premier temps I'estimatisn des tels modèles en une

seule étape à l'aide des techniques de simulation des probabilités. Dans un deituième

temps, nous dérivons, dans le cadre de l'estimation en deux étapes. les expressions des

moments conditionnels lorsque les choix discrets sont interdépendants et cela grâce à

l'utilisation des récentes techniques de simulation des moments conditionnels. Nous

terminons chacune des parties de notre travail par une évaluation empirique de la

demande d'électricité par les ménages québécois étant donné le choix effectué parmi

un ensemble de modes de chauffage de l'eau et des locaux. Les résultats empiriques

obtenus sont conformes à nos attentes, en particulier en ce qui concerne les élasticités

prix et revenu.

Il convient de noter que lors de l'évaluation empirique de la demande d'électricité

conditionnelle au mode de chauffage de l'eau et des locaux pour les ménages québécois'

nous avons utilisé différentes bases à savoir Gaz/Gaz pour le FIML et Électricité

/Électricité pour le LIML. Il aurait été intéressant de considérer la même base pour

les deux cas afin de faciliter la comparaison même si les conclusions émanant de ceux-

ci sont indépendantes de la base choisie. Yous avons choisi de le faire en deus bases

différentes tout simplement parce que les études antérieures ayant traité le FIML e t le

LIML ont été faites sur des bases différentes et il était intéressant pour nous de choisir

les mêmes bases que ces études différentes afin de pouvoir comparer nos résultats à

chacune d'entre elles.

Annexe A

Correction à la Heckman

Lorsqu'on applique les MCO, on a généralement un modèle de la forme:

Y = Xi3 + u, avec u - (0: 0').

Cette régression consiste en Fait en:

Y = E ( Y ) i u = X P + v , (.LX!)

car E(Y) = E(XB i u) = E ( X @ ) + E(u) = X,û + O = .W. Mais dans certains cas! comme celui qui nous concerne, on a plutôt une demande

conditionnelle et la régression qui doit être faite est la suivante:

Y, = E(Y1i) + u.

Or E(Yji) = E(XPli) + E(u(i) = XP + E(uli) si E(uli) # O. D'où:

Y, = E(Y(i) + u = X,3 + E(u(i) + u . (A. 53)

En considérant (.4.52), les estirnateus des paramétres d'intérêts sont donnés par:

137

~ O U V O ~ S E(,3) = (XtX)-%%(Y) = (XtX)-1X1E(dY,3 i .u) = D + E(u) = 3. Dans ce cas l'estimateur n'est pas biaisé.

Si par contre l'estimation concerne la demande conditionnelle, on aura par (-A.%'):

D'où on voit bien que l'estimateur est biaisé. La vraie régression qu'on devrait

faire est donc:

où E (uli) est le biais d'autosélec tion.

Annexe B

Espérance conditionnelle

Soient deux

conditionnelles,

Par ailleurs,

d'où

Mnables aléatoires .Y e t Y . .i l'aide des propriétés des espérances

on peut écrire:

sachant que f (yjx) = #:on a

On a aussi J' /(z, y)dx = f(yjx E A) P(z E A): ce qui nous amène à xE.4

Trouvons maintenant l'espérance de y conditionnelle à x E A.

En remplaçant (B.54) dans (B.55), on a

OU encore

Annexe C

Le Logit Polytomique

Une variable aléatoire ( est distribuée Gumbel si eiie a une fonction de distribution

de probabilité de la forme

et une fonction de distnbu tion cumulative

où fl est un paramètre d'échelle e t rl un paramètre d'emplacement. Les propriétés

de cette distribution sont les suivantes:

1. Elle a pour mode q.

2. Sa moyenne est de q + $ où y est la constante d'Euler (= 0.577).

3. Sa variance est de S. 4. Si { Gumbel(q, 8) et u, a > O deux constantes, on a a( t u Gurnbel(<rq +

8 U! ,).

5. Si el,& sont i.i.d. Gumbel avec (vl, 6) et (q2,fl), on a E' = c2 - 5, 11

(logistique) avec 1

Appliquons ces propriétés au cas du YXL.

Posons 7 = O pour simpMcation.

On sait que la probabilité que la modalité i soit choisie est donnée par

Posons L; = mauj=2,....~(~~ + 6). Sachant que G - Gumbel(0, O ) e t que u, est une

constante, on a de la propriété 4, (suj + t,) N (ujl 8 ) . J

De la propriété 6, on a U = maxj,?,...,,(uj + &) N Gumbel(j ln 1 e8"j y O ) . ]=2

De la propriété 4, on a li = ,u + < avec u = f ln f: eh> et f - Gumbel(Oo 8). i=2

D 'où

Enfin de la propriété 5: on a

qui est la forme que prennent les probabilités de choix lorsque les termes d'erreur

sont Gumbel iid donnant lieu au modèle MNL.

Annexe D

Le simulateur GHK

Le simulateur GHK exploite la structure récursive imposée par La transformation de

Cholesky de l'équation de I'utilité prise en déviation par rapport à l'alternative choisie.

En supposant que Le choix correspond à la dernière alternative, comme démontré dans

Bolduc et Kaci (l993), on peut réécrire la fonction d'utilité comme:

Ceci implique:

ou:

où:

.4 l'aide de cette notation, les probabilités de choix deviennent:

Le simulateur GHK utilise cette décomposition pour chaque tirage de d j ~ . Soit

t un tirage donné et unt la réalisation du vecteur un. Le simulateur GHK est une

moyenne empirique prise sur T valeurs calculées a partir de ces tirages. On peut

écrire:

où T représente le nombre total des tirages et:

De façon plus élégante, nous avons:

où a(.) est la fonction de distribution cumulative d'une variable normale standard

avec :

Yotons que Whn,t est calculé à l'aide de @ - ' ( W Q ( U ~ , , ~ ) ) avec IL un nombre aléatoire

uniforme compris entre (O, 1).

Annexe E

Les dérivées premières

Par rapport à ,B

où:

avec Ah, = é d u é à alnyt et:

O Par rapport à 6

où:

et:

Par rapport à po

où:

et:

a Par rapport à p,

où:

et:

a Par rapport B 0

a Par rapport h o

Les dérivées par rapport aux éléments de la matrice de variance-covariance.

Les dérivées par rapport à ces déments sont détaillés dans Bolduc et Kaci (1993).

Annexe F

Calculs théoriques des moments

conditionnels

d- 5 L'espérance pour (G/C1 < -V) = -01 + . [+(-,il Preuve

Partons du calcul de la moyenne tronquée pour un terme d'erreur u .- J ( 0 . 1 ) . a

E(U lu < a) = / ug(u)du -34

avec

Avec ça l'expression pour la moyenne conditionnelle peut s'écrire comme

car $ u(p(u)du = -v(u) . Nous avons

Yous recherchons plutôt 5 -V) avec CL .- X ( O ? oll). Il apparait que CL n'est

qu'une transformation affine de u. YOUS avons de ce fait la relation suibante entre les

d e ~ u termes d'erreur

Ce qui implique que CL = al u.

La variance pour 5 -V) = oll QI

Preuve

Pour avoir la variance conditionnelle ci-dessus: nous allons passer par la dérivation

de celle d'un terme d'erreur 1~ - N ( 0 : 1) pour enfin utiliser la transformation a f i e

à cet effet. Par ailleurs, pour obtenir cette dernière, nous dérivons' en premier lieu

13(u21u < a ) 9 une des deux composantes de la variance conditionnelleo la première

étant la moyenne conditionnelle calculée précédemment.

I u2 " ~ ( u ~ l u < a ) = - uexp(-T)l ( 2 4 l /* 0 ( a ) -al --

1 ~ ( u ~ j u < a ) = [ - a ( ~ n ) l / ~ ~ ( a ) i ( 2 ~ ) ~ / ~ @ ( a ) ]

(2n) <P (a )

Cette dernière expression nous permet d'avoir la variance conditionnelle

.i l'aide de la transformation affine. nous obtenons

D'où

-- -1) v a ~ ( c d c l s 4,

[1- (-;; -- ;;) (-;; -- ;) - (-;))lm Ql

Preuve

Par définition,

-v r - v 1

Pour simplifier la notation, posons

L'expression de la moyenne conditionnelle recherchée devient

-a L -00

Utilisant la propriété des espérances conditionnelles

nous obtenons

Nous pouvons aussi réécrire B comme

Cette expression peut être décomposée à l'aide de l'une des propriétés de la loi

normale bidimensionnelle tronquée stipdant que pour

nous avons (6) - lv(*: :i;)'

Il ressort de ce résultat que

Ainsi? nous arrivons à

De retour à la moyenne conditionnelle, nous pouvons l'écrire de façon alternative

comme

Posons, une fois de plus, pour faciliter l'écriture

Sachant que

nous pouvons t3n déduire que

Yotons que

La moyenne conditionnelle que nous recherchons est ainsi donnée par

Utilisant, une fois de plus, la loi normale bidimensionnelle tronquée.

L'expression pour la moyenne devient alon:

La moyenne conditionnelle est finalement donnée par:

La variance pour (hicl < -VI & 5 -V)

Preuve

La variance conditionnelle est fonction de deux composantes dont la moyenne

conditionnelle calculée précédemment. De ce fait, posons, tout d'abord

La variance est par définition donnée par

Cette variance peut être réécrite comme

Remarquons que cette dernière peut aussi se présenter sous la forme

considérant que

Les composantes de la variance conditionnelle sont:

a) Première composante

b) Deuième composante

c) Troisième composante : E({i1& 5 -KG).

(y) , (y) l c = [ + ( ) ( - @ (Y) ) ] + ~ i * p * ( 4 (7) ) :

nous avons

La variance conditionnelle pour 6 est findement donnée par

Bibliographie

[l] ALBRIGHT, R.L., S.R. LERhfAX and C.F. MVIANSKI. (1977), " Repon on

the Development of an Estimation Program for the Multinomial Probit Model",

Prepared for the Federal Higliwuy Administration.

[2] AMEMIYA, T. (1978), " The Estimation of Simuitaneous Equations Generalized

Probit Models" , Economehica, J8(2).

[3] BÉLAYGER, D.? (l992), "Estimations des Probabilités de Chok Reliées au

Problème d'évaluation de la demande d'électricité Résidentielle au Québec" ,

Thèse de maitrise. Université Laval.

[4] BEN-AKIV-4' M. and S. LE>R&LIIAN (1985): "Discrete Choice Analysis: Sheory

and Application to Trawl Demand" , Cambridge. MA: MIT Press.

[5] B E N - A m \ , m. and D. BOLDUC ( lgg l ) , "3fultinomia Probit wit h Autore-

gressive Error Structure" : GREEN, Université Laval.

[6] BÉLANGER: D., J.T. BERNARD and D. BOLDUC (1996): "Québec Residen-

tial Electricity Demand: A Microeconometric Approach" Canada'an Journal of

Economics, vo1.29 No. 1.

[?j BOLDUC, D., (1999), "A Practicd Technique to Estimate Multinomial Probit

ModeIs in Transportation ", Transportation Research-B, 33, pp 63-79.

[8] BOLDUC, D. et M. KACI (1993), "Estimation des Modèles Probit Polytomiques:

Un survol des techniques", Actualité économique, vol.69(3), 161- 19 1.

[9] BOLDUC, D., (l992), "Generalized Autoregressive Errors in the Multinomial

Probit Yodel", Transportution Research-B, vol. 26B, 'To. 2.

[IO] BORSCH-SUP.W, A. and V. Ha4JIV.4SSILIOU (1993), "Srnooth Unbiased Md-

tiMnate Probability Simulators for Maximum Likelihood Estimation of Limited

Dependent Variable Models", Journal of Econometn'cs, Vol.58. 347-368.

[il] BUTLER, J.S. and R. MOFFIT (1982), "4 Computationally Efficient Quadra-

ture Procedure for the One-factor Multinomial Probit Modeln , Econometrica.

VOL 50(3), 761-764.

[12] CLARK. C. (1961), " The Greatest of a Finite Set of Randorn Variables". Op-

eration Research, 9, 145- 162.

[13] DUBIN, J.A. (1985): "Consummer Durable Choice and the Demand For Elec-

tricity " Yorth-Holland.

[14] DUBN, J.A. and D. McFADDEN (1984), "An Econornetric Analysis of Resi-

dentiai Electricity Appliance Holdings and Consumption" . Econometrica. vol. 52

Y0 2.

[El GEWEKE, J.: M. KEANE and D. RUXKLE (l994), %iternative Cornputacional

Approaches to StatisticaI Inference in the Multinomial Probit Model", Revieu

of Economics and Statiatics, L X W , 609-632.

[16] GOURIÉROUX, C. (1984), "Économétrie des Variables Qualitatives''

Économica.

[17] GOURIÉROUX, C. and F. JOUNEAU (MM), "?vlultimriate Distributions for

Limited Dependant Variable models", Centre de Recherche en Économie et

Statistiques (CREST).

il81 GOURIÉROUX. C. and A. MONFORT (1996), "Simulation Based Methods in

Econometrics" , O.dord University Press: Oxford.

[19] GOURIÉROUX, C. and A. MONFORT (1992): "Simulation Based Inference

in Models with Heterogeneity" , ..Linales d'Economie et de Statistiques; 20-2 1,

69-107.

[20] G O ~ R I É R O U X ~ C., A. !dOZIFORT and E. RENAULT (1993), "Indirect Infer-

ence", Journal of Applzed Econometncs; 8, S85-S118.

[21] GREENE, W.H. (1996) "Econometric Analysis", MacMillan, Yew York.

[22] HANEMa4YN, M. W., (1984) ! "Discrete/Continuous Models of Consumer De-

mand" , Econometn'ca. Vol.52 No3.

[23] HAJIV.\SSILIOU, V A . and D. MCFADDEN (1994), 'The Method of Simulated

Scores for the Estimation of LDV Models with an Application to External Debt

Crises!', Cowles Foundation discussion paper, 'io.967, kale University. Conn.

[24] H..ZJIV.ASSILIOU, V A . and P. RUUD (l994), *'Classical Estimation Me thods

for Limited Dependant Variable Models using Simulation", Handbook of Econo-

rnetrics, vol. W .

[25] HAJIVASSILIOU, VA., D. McMDDEN and P. RUUD (1996), '9irnulation of

Multiwiate Normal Rectangle Pro babilities and their Derivatives" Journal of

Econometn'cs: 72, 85-135.

[26] HAUSMAX, J.A. and D.A. WISE (1978), "-4 Conditional Probit for Qualita-

tive Choice: Discrete Decisions Recognizing Interdependence and Heterogeneous

Preferences" , Econornetrica, 46, 403-426.

[27] HAUSMANo J.A. and P. RUUD (1987), "SpeciS.ing and Testing Econometric

hludels for Rank-ordered Data*', Journal of Econometrics, vol. 34, 83-104.

[28] HECKMAN, J. (1976), "The Common Structure of Statistical 'ilodels of Tnin-

cation, Sarnple Selection and Limited Dependent Variables and a Simple Esti-

mation for Such Models", Anna23 of Economics and Social Mea~urements~ vol.5.

475-492.

[291 HECKMAN. J. ( W g ) , "Sample Selection Bias as a Specification Er~or" , Econo-

m e t r i a ; 47.

[30] KING, MA. (1980), "An Econometric Model of Tenue Choice and Demand for

Housing as Joint Decision", Journal of Public Economicso vol. 14.

[3 11 LAYCASTER. K. J. ( lg ïg ) , "Variety, Equity and Efficiency" , New York:

Columbia University Press.

[32] LEE, L. F., G.S. MADDALA and R.P. TROST (1980). "Asymptotic Covariance

Matrices of Two-stage Probit and Two-stage Tobit 'vlethods for Simultaneous

Equations Models with Selectivity" , Econornetrica! vol. 48, Yo.2.

[33] LEE, E. F. and R. TROST (1978), "Estimation of Some Limited Dependant

Variable Models with -4ppIications to Housing Demandt . Journal of Econornet-

n'cs, vol. 8 , 357-382.

[34] McCULLOH, R., and P.E. ROSSI (1994), "An E,xact Likelihood hnalysis of the

Multinornial Probit Model", Journul of Econornetrics, vol. 64(1), 207-240.

[35] McF.4DDENY D. (l978), "Modelling the Choice of Residentid Location" , in Spa-

tial Interaction Theory and Planning Models, ed. by A. Karliquist , L. Lundquist,

F. Snickars, and J.L. Weibull. Amsterdam: North Houand.

[36] McFADDEX, D. (1989), "A Method of Simulated Moments for Estimation of

the Multinornial Probit Models without Yumerical Integration" , Econometrica,

vol. 57(5).

[37] McFPIDDEN, D., P. RUUD (1994), "Estimation by Simulation", Review of Eco-

nomics and Statistics; 76 (4), 591-608.

[38] MURPHY, K. and R TOPEL, (1985), "Estimation and Inference in Two Step

Econometrics Models" , Journal of Business and Economic Statistics. 3, 370-379.

[39] NOVSHEK, W. and H. SONXENSCHEIN (1979), "Marginal Consumers of Yeo-

classical Dernand Theory" , Journal of Political Economy, 87. 13684376.

[40] OWEN, D. (1956), " Tables for Computing Bivariate Yormal Probabilities",

Annal3 of Mathematical Statzstâc, 27, 1C75-1090.

[41] P.\KES, -4. and D. POLLARD (l989), "Simulation and the Asynptotics of O p

timisation Estimations", Econometrica, vol. 57(5).

[42] RUUD, P. A. (1991), "Extensions of Estimation Methods using the EM Algo-

rithm", Journal of Econometrica, vol. 49, 305-341.

[43] STERIV, S. (1992): "-4 Method for Smoothing Simulated Moments of Discrete

Probabilities in Multinornial Probit Models", Econometrica, vol. 60(4), 943-952.

14441 TRAIN, K., (1986), "Qualitative Choice .halysis: Sheory, Econometrics and an

Application to Automobile Demand", MIT Press, Cambridge. 'ilass.

note to users › obj › s4 › f2 › dsk1 › tape7 › pqdd_001… · .k mon père sylvestre...

Documents