note to users › obj › s4 › f2 › dsk1 › tape7 › pqdd_001… · .k mon père sylvestre...
TRANSCRIPT
NOTE TO USERS
The original manuscript received by UMI contains pages with indistinct print. Pages were
microfilmed as received.
This reproduction is the best copy available.
UMI
DIMITRI MWAKAPOYA SANGA
ESTIM44TION DES MODÈLES ÉCONOMÉTRIQUES DE CHOIX DISCRETS/CONTINUS AVEC CHOIX POLYTOMIQUES INTERDÉPENDANTS: UNE
APPROCHE PAR SIMULATION.
Thèse
présentée
à la Faculté des études supérieures
de 1'U niversité Laval
pour l'obtention
du grade de Philosophiae Doctor (Ph. D.)
Départeriient d'économique
FACULTÉ DES SCIENCES SOCIALES
JUILLET 1999
@ Dimitn Mwakapoya SANGA, 1999
National Library of Canada
Bibliothèque nationale du Canada
Acquisitions and Acquisitions et Bibliographie Services services bibliographiques
395 Wellington Street 395, rue Wellington Ottawa ON K1A ON4 Ottawa ON K1 A ON4 Canada Canada
The author has granted a non- exclusive licence allowing the National Library of Canada to reproduce, loan, distribute or sel1 copies of this thesis in microforni, paper or electronic formats.
The author retains ownership of the copyright in this thesis. Neither the thesis nor substantial extracts fiom it may be printed or otherwise reproduced without the author's permission.
Your hfe Votre reterence
Our hle Noire relerence
L'auteur a accordé une licence noii exclusive permettant à la Bibliothèque nationale du Canada de reproduire, prêter, distribuer ou vendre des copies de cette thèse sous la forme de microficheffilm, de reproduction sur papier ou sur format électronique.
L'auteur conserve la propriété du droit d'auteur qui protège cette thèse. Ni la thèse ni des extraits substantiels de celle-ci ne doivent être imprimés ou autrement reproduits sans son autorisation.
Résumé
iious proposons une méthode efficiente pour estimer les modèles économétriques de
choix discrets/continus avec choix polytorniques interdépendants. La difficulté prin-
cipale lors de l'estimation de tels modèles est la présence d'intégrales multidimen-
sionnelles apparaissant dans les expressions des probabilités de choix et ceux des
espérances conditionnelles. L'utilisation des techniques de simulation nous a permis
de contourner cette difficulté lors de l'évaluation de ces dernières expressions. Yous
abordons le problème de deux façons différentes à savoir dans un cadre du maximum
de vraisembhce a information complète et celui du maximum de waisemblance à in-
formation incomplète. Des évaluations empiriques basées sur la demande d'électricité
nous servent de cadre d'application des méthodes ainsi développées.
nis BOLDUC
Résumé
L'objectif de ce travail est de fournir une manière efficiente d'estimer les modèles
économétriques de choix discrets/continus lorsque les choix discrets sont interdépendants.
Ce cas où les interdépendances sont admises entre les modalités discrètes donne
lieu au modèle probit. Ce dernier est un modèle qui comporte un certain nombre
d'avantages théoriques: une grande flexibilité dans la spécification et l'usage; la pos-
sibilité d'inclure le phénomène d'hétérogénéité entre les individus et de permettre
des formes d'interdépendances très générales entre les modalités; une bonne pro-
priété d'agrégation; une grande utilité pour traiter les observations discrètes avec
données de panel longitudinales et une capacité de traiter les données agrégées ... Son utilisation pratique, a toutefois souvent été limitée à cause de deux obstacles ma-
jeurs, à savoir, la présence inévitabie d'intégrales multidimensionneiles de loi normale
définissant les probabilités de choix et le nombre de paramètres de nuisance a estimer
dans la structure de corrélation des erreurs. Les recherches effectuées pour résoudre
ces problèmes ont donné lieu, entre autres, à la mise sur pied de simulateurs per-
mettant de remplacer les probabilités de choix dans les fonctions objectives par des
simulations stochastiques effectuées sur le modèle latent. Cette thèse vient mettre
en lumière l'ampleur de l'évolution des méthodes de simulation en proposant une
manière pratique d'estimer les modèles de choix discrets/continus peu restrictifs en
termes d'interdépendances. Cela est réalisé, premièrement, dans un cadre du maxi-
mum de vraisemblance à information complète, puis dans un cadre du maximum de
vraisemblance à information limitée où nous utilisons particulièrement une méthode
basée sur le principe de correction pour le biais de sélection. Les dérivations théoriques
sont assorties d'évaluations empiriques appliquées à la demande de l'électricité pour
les ménages québécois.
Avant-propos
La réalisation de cette thèse a été possible grâce à la collaboration de plusieurs per-
sonnes. En effet, il a fallu non seulement maintenir un rythme de travail soutenu
mais aussi compter sur l'appui de ces dernières. C'est ainsi que j'exprime ma pro-
fonde gratitude à l'égard de mon directeur de recherche, Denis Bolduc, pour m'avoir
toujours encouragé et soutenu durant ces années de dur labeur, à mon épouse, Marie
Ahamada et Darcy Sanga, mon filso pour les sacrifices consentis, le support moral et
l'attention dont j'ai été l'objet quand le besoin se faisait sentir. Ma reconnaissance va
aussi à tous ceux qui de près ou de loin ont contribué à leur façon à cet aboutissement.
Je pense tout d'abord à la famille Sanga pour avoir supporté cet éloignement pendant
tant d'années. Aux collègues, aux amis et compagnons d'exil qui nous a été imposé
par les circonstances que d'aucuns n'ignorent en ces années 90 en RD Congo. Merci
à Kane Yahya Ousmane pour avoir accepté de lire la version finale du manuscrit de
cette thèse. Que l'accomplissement de ce travail puisse répondre à ne fusse qu'une
infime partie de ce que les Basanga, les Katangais et les Congolais attendent de moi,
est le voeu le plus ardent que je puisse émettre à cette occasion.
Je remercie, enfin, le ministère de l'Énergie, Mines et Ressources Naturelles du
Canada ainsi que le Groupe de Recherche en économie de l'énergie, de l'environnement
et des ressources natureiles (GREEN) pour le soutien financier dont j'ai bénéficié
durant la réalisation de ce travail.
.k mon père Sylvestre Mwakapoya Sanga et ma mère Liberata Mpangwe Shamuabi
qui ont su mettre à ma disposition les atouts nécessaires pour aborder la vie de la
manière la plus prometteuse au meilleur de leurs moyens.
.k Darcy, mon fils : "bwana bulume i kwi tela".
.k Adèie, Sylvie, Mimy, Alain, Rudy, Alex, Eddy, professeur Baruti, Mathieu
Kalenga, merci pour le soutien.
A tous les miens qui ont disparu pendant ma longue absence, je dédie ce tra-
vail: Brigitte Mpangwe Shamuabi, Prisca Sato Sanga, Filly Luabwe Sanga, Eustache
Mulembwa, Jean-Marie Mbayo, Leandre, Justin Ilunga, Renilde.. .
Table des Matières
Résumé
Résumé iii
Avant-propos v
1 Introduction 1
2 Revue de littérature 7
2.1 Modélisation en une étape . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Modélisation en deux étapes . . . . . . . . . . . . . . . . . . . . . . . 10
2.3 Évolution des techniques d'estimation . . . . . . . . . . . . . . . . . . 17
3 Le cadre économétrique général 19
3.1 La partie discrète (P(2 IX)) . . . . . . . . . . . . . . . . . . . . . . . . 20
3.1.1 Modèles pour données ordonnées . . . . . . . . . . . . . . . . 21
3.1.2 Modèles pour données de rang . . . . . . . . . . . . . . . . . . 22
3.1.3 Modèles pour données non ordonnées . . . . . . . . . . . . . . 23
3.2 La partie continue. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4 Estimation économétrique: Méthode d'estimation en une étape (Max-
imum de Vraisemblance B Information Compléte) 32
vii
5.2.3 Le modèle cie choix . . . . . . . . . . . . . . . . . . . . . . . . 112
5.2.4 Le modèle de demande conditionnelle . . . . . . . . . . . . . 114
5.2.5 Estimation de la partie discrète . . . . . . . . . . . . . . . . . 115
5.2.6 Estimation de la partie continue . . . . . . . . . . . . . . . . . 116
5.2.7 Données et spécification du modèle . . . . . . . . . . . . . . . 123
5.2.8 Résultats e t interprétations . . . . . . . . . . . . . . . . . . . 124
5.2.9 Élasticités prix et revenu . . . . . . . . . . . . . . . . . . . . . 132
5.2.10 Conclusion . . . . . . . . - . . . . . . . . . . . . . . . . . . . 132
6 Conclusions 135
Annexes 137
A Correction à la Heckman 137
B Espérance conditionnelle 139
C Le Logit Polytomique 141
D Le simulateur GHK 144
E Les dérivées premières 148
F Calculs théoriques des moments conditionnels 151
Bibliographie 160
Liste des Tableaux
4.1 Nombre de type de systèmes de chauffage de l'eau et des locaux par
. . . . . . . . . . . . . . . . . . . . . . . source d'énergie (pour cent)
4.2 Variables pour le modèle de choix de chauffage de l'eau et des locaux
4.3 Résultats de l'estimation PARTIE 1: Le modèle de choix (T=20) . . 4.4 Résultats de l'estimation: PARTIE 2: La demande d'électricité condi-
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . tionnelle
. . . . . . . . . . . . . . . . . . . . . . . . 4.5 Élasticités prix et revenu
5.6 Moments conditionnels pour rho = - 0.9 . . . . . . . . . . . . . . . . 5.7 Moments conditionnels pour rho = - 0.7 . . . . . . . . . . . . . . . . 5.8 Moments conditionnels pour rho = . 0.2 . . . . . . . . . . . . . . . . 5.9 Moments conditionnels pour rho = 0.0 . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . S 10 Moments conditionnels pour rho = 0.2
. . . . . . . . . . . . . . . . . 5.1 1 Moments conditionnels pour rho = 0.7
. . . . . . . . . . . . . . . . . 5.12 Moments conditionnels pour rho = 0.9
5.13 Résultats de l'estimation: Le modèle de choix (T=100) . . . . . . . . 5.14 Résultats de llestimation(suite): Le modèle de choix (T=100) . . . . 5.15 Résultats de l'estimation: La demande conditionnelle d'électricité . .
. . . . . . . . . . . . . . . . . . . . . . . . 5.16 Élasticités prix et revenu
Chapitre 1
Introduction
Dans le cadre de l'évaluation empirique de la demande des consommateurs à l'aide des
données micro économiques, nous nous trouvons souvent confrontés à des situations où
les choix qualitatifs (discrets) et ceux continus sont combinés. Bon nombre d'exemples
dans les problèmes économiques peuvent illustrer ce phénomène:
a Un consommateur qui doit décider d'acheter ou louer une maison (choix discret)
en même temps que la grandeur de la dite maison (choix continu);
Un consommateur qui doit décider de l'achat d'un appareil ménager fonc-
tionnant à l'électricité ou au gaz en même temps que la quantité de gaz ou
d'électricité a consommer;
Un consommateur qui doit choisir la marque d'un bien durable donné en même
temps que la quantité demandée pour celui-ci;
a Un médecin qui doit choisir la localisation de son premier endroit de pratique
ainsi que la durée de son séjour dans la contrée;
Un investisseur qui doit choisir la composition de son portefeuille ainsi que le
montant à investir;
Un individu qui doit choisir le type de couverture (couverture maximale, par-
tielle, pas de couverture) ainsi que le montant d'assurance.
Il apparah clairement que le chok discret optimal (acheter ou louer, quelle marque
du produit acheter, acheter un appareil au gaz ou à l'électricité, choix de localisation,
composition du portefeuille, type de couverture) dépend dans une certaine mesure
de la réalisation du choix continu (la grandeur de maison. la quantité de produit à
acheter, la quantité d'électricité ou de gaz à consommer, la durée de séjour, le montant
à investir, le montant d'assurance). 11 en est de même du choix continu qui n'est pas
indépendant de celui discret. De ce qui précède, les chercheurs se sont mis d'accord
sur le fait que ce genre de problème devrait être modélisé de façon simultanée. Forts
de cette évidence, ils ont formellement démontré que toute modélisation qui ignor-
erait cette interdépendance conduirait à des estirnateurs biaisés et non convergents
(King (1980), Dubin et McFadden (1984), Hanernann (1984)), ce qui entraherait des
conséquences néfastes sur le plan des prévisions des politiques.
La nature du problème considéré laisse voir que celui-ci est divisé en deux parties,
une discrète et l'autre continue. Les techniques d'estimation de chacune des deux
parties pnses séparément sont assez connues.
Pour la partie discrète, nous rencontrons différents types de modèles:
0 Selon le type de données, nous avons les modèles avec données de rang, avec
données ordonnées et les modèles avec données non ordonnées;
0 Selon le degré d'interdépendance entre les modalités, nous distinguons le modèle
Logit Polytomique (MNL) lorsqu'il y a indépendance entre les modalités de la
partie discrète, le Logit ~ m b o k é ((NMNL) pour permettre des formes relative-
ment restrictives d'interdépendances entre les modalités, la classe des modèles à
Valeurs Extrêmes Généralisées (GEV) (McFadden (1978)) qui est une classe de
modèles plus générale dont les deux premiers sont des cas particuliers, et enfin,
le Probit Polytomique (MNP) lorsque les modalités en présence admettent une
structure très générale d'interdépendances.
La partie continue, quant à elle, donne souvent Lieu à deux grands types de modèles
selon le type de variable dépendante:
a Les modèles à données limitées. Comme cas particulier, il e-xiste les modèles
de durée qui concernent une variable dépendante à caractère continu prenant
des valeurs réelles positives (durée de la période de chômage, durée d'un crédit
hypothécaire).
0 Le modèle de régression classique lorsque la variable dépendante est une variable
continue non limitée.
La clé de l'estimation des modèles de choix diçcrets/continus réside dans la prise
en compte du fait que l'estimation de la partie continue doit être effectuée en tenant
compte du choix observé dans la partie discrète. En pratique, cette estimation peut
s'effectuer de deux manières différentes:
La méthode en une étape ou a information complète; dans ce cadre, les paramètres
des parties discrètes et continues sont estimés simultanément sur base de la den-
sité conjointe des variables des deux parties.
a La méthode en deux étapes. Généralement, celle-ci consiste en l'estimation des
paramètres de la partie discrète par l'une ou l'autre des approches précitées,
puis en l'estimation de ceux de la partie continue en une deuxième étape en
tenant compte de la correction pour le biais de sélection (Heckman (1979))'
dénotant ainsi le conditionnement de la deuxième partie sur la première.
La plupart des études effectuées à ce sujet ont utilisé des modèles de choix dis-
crets plus restrictifs en termes d'interdépendances entre les modalités même si la
structure du modèle de choix laissait voir la possibilité que les modalités soient in-
terdépendantes (Dubin et McFadden (1984)). Notre étude va porter sur les cas où les
interdépendances sont admises, donnant ainsi lieu au MNP. Ce dernier est un modèle
qui comporte un certain nombre d'avantages théoriques dont:
Une grande flexibilité dans la spécification et l'usage;
La possibilité d'inclure le phénomène d'hétérogénéité entre les individus et de
permettre des interdépendances quelconques entre modalités;
a Une bonne propriété d'agrégation;
une grande utilité pour traiter les observations discrètes avec données de panel
longitudinales;
0 Une capacité à traiter les données agrégées, les données mixtes (combinaison de
données a coupes transversales et de panel).
Par contre, deux obstacles majeurs ont limité son utilisation pratique:
a La présence inévitable d'intégrales multidimensionnelles de loi normale définissant
les probabilités de choix;
Le nombre de paramètres de nuisance à estimer dans la structure de corrélation
des erreurs qui augmente de façon quadratique avec le nombre de modalités.
Les recherches effectuées aiin de résoudre ces problèmes ont donné lieu, entre
autres, à la mise sur pied de simulateurs permettant de remplacer les probabilités de
choix dans les fonctions objectives, ainsi que dans les fonctions critères intervenant
dans les scores par des simulations stochastiques faites sur le modèle non observable.
Ceci donne lieu à des méthodes telles que le maximum de vraisemblance simulée
(SML) et la méthode des moments simulés (MSM).
Dans le cadre de ce travail, nous d o n s privilégier la méthode du maximum de
vraisemblance simulée. Ce choix est basé sur les tendances récentes des chercheurs
à favoriser cette approche parce que plus simple à mettre en oeuvre: plus stable
numériquement et plus économique étant donné qu'elle ne demande que l'évaluation
de la probabilité de la modalité choisie, alors que la méthode des moments simulés
nécessite l'évaluation des probabilités de choix de toutes les modalités impliquées dans
le modèle de choix. Cette dernière méthode devient laborieuse pour des ensembles de
choix de taille importante.
Notre travail vient mettre en lumière l'ampleur de l'évolution des méthodes de
simulation en s'attaquant à l'estimation d7.m modèle de choix discrets/continus peu
restrictif en termes d'interdépendances. Cela est réalisé, premièrement, dans un cadre
du maximum de vraisemblance à information complète, question qui n'a pas été
souvent abordée compte tenu des difficultés précitées, puis dans un cadre du maximum
de vraisemblance à information limitée où l'on utilise particulièrement la méthode
basée sur la correction pour le biais de sélection, méthode qui n'a pas été abordée
dans un cadre MNP à cause de la complexité qui s'y rattache.
Tout en restant dans un cadre purement statique (coupe transversale), nous
présentons dans un premier chapitre, un aperçu des applications qui ont été faites dans
le cadre de l'estimation du maximum de vraisemblance des modèles éconornétriques de
chok discrets/continus. Dans un deuxième chapitre, nous présentons un cadre général
englobant la majorité des applications rencontrées dans la littérature. Par la suite,
nous abordons les deux méthodes principales d'estimation concernant le cas spécifique
du MNP. Dans le troisième chapitre, nous abordons l'estimation en une seule étape
des paramètres des parties discrètes et continues dans un contexte de Maximum de
Vraisemblance Simulé à Information Complète (MVSIC). Nous terminons ce chapitre
par l'évaluation empirique d'un modèle de la demande d'électricité pour les ménages
québécois conditionnelle au choix effectué panni neuf modes de chauffage de l'eau
et des locaux. Le quatrième chapitre quant à lui présente la modélisation en deux
étapes dans un cadre du Maximum de Vraisemblance à Information Limitée (MVSIL)
consistant en l'évaluation des paramètres du modèle de la partie discrète par un MNP
à l'aide de simulateurs de probabilité, pour enfin les utiliser dans l'estimation de la
demande dans la partie continue. Pour ce faire, la technique nécessite l'évaluation
de moments conditionnels simulés afin de produire un terme de correction du type
Heckman (1979) dénotant du conditionnement de la demande sur le choix effectué
dans la partie discrète. -4 l'aide d'un modèle simple à trois modalités, nous corn-
parons différents simulateurs des moments conditionnels aux vraies valeurs obtenues
par intégration numérique et choisissons le simulateur le plus approprié pour les ap-
plications. Une évaluation empirique en deux étapes est effectuée sur les données
exploitées au chapitre précédent. Finalement, un cinquième chapitre vient clore le
travail par une conclusion. Les propriétés asymptotiques des estimateurs et simula-
teurs utilisés dans ce travail peuvent être trouvés dans Gouriéroux et Monfort (1996),
Hajivassiliou et McFadden (1994). Il convient de noter que la présentation de ce
travail laisse voir qu'il y a certaines répétitions en ce qui a trait principalement aux
sections sur la présentation des données et le système économétrique discret /continu.
Ceci se justifie en ce que cette thèse a été effectuée sur base des papiers différents
constituant des ensembles à part entière et dans le souci de ne pas perdre le fil
des idées pour chaque papier, nous reproduisons certains aspects nécessaires pour la
compréhension de chacun d'entre eux.
Chapitre 2
Revue de littérature
La littérature relative à la modélisation des modèles économétriques de choix dis-
crets/continus peut être abordée de différentes façons. Nous allons, au cours de
ce chapitre, passer en revue un certain nombre de travaux en les regroupant selon
les critères évoqués dans la partie introductive à savoir la modélisation en une ou
deuu étapes, la modélisation selon les formes d'interdépendances postulées, et enfin
l'évolution dans les techniques de modélisation.
2.1 Modélisation en une étape
En ce qui concerne les études qui ont considéré le problème en une seule étape, Yervin
King (1980) s'est attardé sur la modélisation du choix du type d'habitation ainsi que
la demande des seMces pour la maison conditionnelle au choix effectué. Le choix
discret porte sur le fait d'être:
- Propriétaire;
- Locataire;
- Locataire subsidié.
Le choix continu porte sur la demande des services pour la maison. Dans ce
travail, King fait déjà état de l'importance de la prise en compte du fait que les deux
problèmes à savoir ceux de choix discret (propriétaire, locataire, locataire subsidié) et
du choix continu (la demande des services pour la maison) sont reliés contrairement
à ce qui se faisait dans les études antérieures dans le domaine. En effet, ces dernières
traitaient la partie discrète indépendamment de celle continue.
Pour chaque ménage, il définit un vecteur de réalisation tel que
où X, : est la quantité des services pour la maison lorsque le choix est la modalité
choisie est i,
1 si .i est choisie ch,: variable indicatrice telle que ch, =
O autrement. Il dénote la probabilité qu'un ménage n choisisse l'alternative i (i= propriétaire,
locataire, locataire subsidié) comme Pin et la fonction de densité de la demande des
services pour la maison f in(&), où Xi, est un vecteur à k composantes représentant
la quantité des services pour la maison lorsque le choix i est effectué.
En général la densité de la réalisation du vecteur v, à composantes v,, i = 1, -, J
pour le ménage n est:
La logvraisemblance d'un tel modèle est donnée par:
Pour estimer le modèle, il utilise les observations sur les variables Xin et c h , et
un cadre théorique pour déterminer P i n et fh. En ce qui concerne la partie discrète,
il considère une fonction d'utilitb aléatoire linéaire dans les paramètres:
où uin est un terme d'erreur normalement distribué avec moyenne O et variance a,?. - -
Il fait une hypothèse sur les composantes du vecteur ,d en posant = ;7k i gk où - I, est la moyenne et 3k .u id(0, ai), k = 1,2, ..., K.
La fonction d'utilité devient:
- OÙ &in = XinP + 'Idin.
Par ailleurs, il considère que les ménages font le choix entre les modalités 1 (pro-
priétaire) et 2 (locataire) et ils ne choisissent 3 (locataire subsidié) que loaqu'ils sont
rationnés dans l'une ou l'autre des deux autres modalités. ?\insi la probabilité que le
ménage n choisisse la modalité 1 est donnée par:
où 77, = ~2~ - Eln est de loi normde hétéroscédastique.
Pour la partie continue, à l'aide des identités de Roy, il arrive à la forme suivante:
où en - N(O, O:) avec an = 0:(1)~ + O;( 2 lw(g!y
PHn PCn ), avec ptn le prix normalisé (prix /revenu) du bien L, les préférences ayant été définies sur deux biens a savoir H
services relatifi à la maison et C consommation des biens autres que ceux relatifs à
la maison.
Les composantes de la log-vraisemblance prennent donc la forme suivante:
où Qi représente l'ensemble des individus du groupe 2 , i = 1 , 2 , 3 . Les paramètres
du modèle ont été estimés à partir d'un échantillon de 4238 ménages et tous étaient
significatifs.
Signalons que si King a réussi à estimer le modèle aussi facilement, c'est parce
que son ensemble de choix ne contenait que trois modalités. Il s'est donc permis
d'utiliser une méthode du maximum de vraisemblance à information complète. Par
ailleurs, Lz est formée de /,(Xi,) (densités non conditionnelles) au lieu de fin(&,$)
(densités conditionnelles), c'est dire que King n'avait pas réellement tenu compte de
la simultanéité dans les deux décisions. Toutefois, cette étude, a le mérite de mettre
en lumière les tenants et les aboutissants de la méthode en une étape.
2.2 Modélisation en deux étapes
Murphy et Tope1 (1985) estiment un modèle du salaire demandé par les tramilleurs
contre rémunération d'un travail avec risque de congédiement. Les deux étapes con-
sistent en:
Une première où ils estiment les probabilités de se retrouver au chômage ou pas.
Ceci est fait à partir d'une variable dichotomique telle que:
1 si l'individu n est au travail et
O si l'individu n est au chômage.
La probabilité que l'individu n soit au chômage est donnée par :
où u(B, Xi,) est une fonction de 0 et ?il, représentant les caractéristiques de l'individu.
La probabilité de travailler est donnée par 1 - P,. La log-vraisemblance de ce modèle
s'écrit:
0 La partie continue repose sur l'équation:
où
w,: salaire moyen hebdomadaire de l'individu n;
X2n : vecteur des caractéristiques affectant la productivité;
R, : proportion de la perte de revenu de travail qui sera remplacée par l'assurance
emploi.
Sous certaines conditions de régularité et certaines formes fonctionnelles (voir
Tope1 (l984)), ils obtiennent des estimateurs convergents de 8 et V(B), la matrice des
variances et des covariances, à l'aide du maximum de vraisemblance. Le problème
a été estimé facilement étant donné que la partie discrète ne comportait que deux
possibilités.
Dubin et McFadden (1984) ont travaillé sur l'un des modèles les plus intéressants
du point de vue tant théorique que pratique. Au niveau de I'estimation, une approche
en deux étapes fut utilisée.
Dans ce travail, deux types de décision sont prises:
O Une décision discrète sur le choix de types d'appareils pour le chauffage résidentiel
eu égard au type d'énergie utilisée pour leur fonctionnement. Leur modèle con-
cerne le chauffage de l'eau, de l'air et l'utilisation des climatiseurs d'air.
0 Une décision continue sur la consommation d'électricité.
l'instar de King, ils prennent en compte le fait que les deux problèmes devraient
être traités simultanément tout en ayant le mérite de considérer plusieurs modalités.
Les méthodes économétriques utilisées pour dériver les systèmes de demande sont
inspirées de Heckman (1978)' en ce qui a trait aux variables endogènes dichotomiques
et les systèmes d'équations simultanées, Lee et Trost (1978) concernant la demande
des maisons et Hausman (1979) pour ce qui touche le fait de retrouver des fonctions
d'utilité indirecte particulières à partir de systèmes économétriques de demandes par-
tielles.
Ils considèrent la fonction d'utilité suivante:
où
LIjn: utilité non observée associée au système i telle que perçue par le ménage n,
5,: caractéristiques non observées de l'alternative i,
77, : caractéristiques non observées propres au ménage n,
Pm: prix de l'électricité,
Pm: prix d'une autre forme d'énergie,
Q,: vecteur des caractéristiques socio-économiques spécifiques au ménage n,
rin = PIOP, +pPICP,: coût annuel d'opération du système i pour le ménage n,
p = po + pi yn : taux d'escompte considéré comme étant une fonction héai re du
revenu y,
PIOP,,: coût total annuel fixe d'opération dû à l'utilisation du système i,
PICP,,: coût total annuel du capital relatif à l'utilisation du système i.
Par les identités de Roy, la fonction de demande relative à la partie continue se
présente alors comme suit:
Dans une première étape, ils dérivent les probabilités qu'un ménage choisisse un
type d'appareil ménager donné. Ils postulent alors que les termes d'erreur de la
partie discrète sont indépendamment et identiquement distribués de loi Gumbel, ce
qui n'admet aucune forme d'interdépendance.
La probabilité de choisir l'alternative i est donnée par:
La deuxième étape consiste en l'estimation de la demande d'électricité condition-
nelle au choix effectué. Ils se servent de la fonction de demande suivante
6 , : variable indicatrice valant 1 si i = j et O autrement alors que i est la
modalité choisie par le ménage n,
qen : consommation totale annuelle de base d'électricité par le ménage n,
den-qen : demande d'électricité résiduelle compte tenu de l'appareil choisi à l'étape
Pour estimer le modèle ci-dessus, ils dénombrent quatre possibilités:
1. Faire les moindres canés ordinaires (MCO) sur ( 2 4 , il en résultera des estima-
teus des paramètres du modéle qui sont biaisés et non convergents.
2. Méthode des variables instrumentales:
- Estimer le modèle de choix.
- Utiliser les estimations des probabilités de choix comme variables instrumen-
tales pour remplacer bji,, dans La deuxième partie du problème.
3. Formes réduites:
Appliquer !VICO a l'équation (2.1) où les P,(i) qui sont substitués au 6 j i , s n ~ ~ n t
remplacés par les estimations P,(i) du modèle de choix de l'étape initiale.
4. Méthode avec correction basée sur les moments conditionnek.
Ils ont alors applique les M C 0 à:
où E(qli) est une composante de la correction due au biais de sélection.
Dans ce cas, ils ont trouvé que E(qli) = (Pj In Pj)/(i - Pj) + hP,. Cette étude a été faite à l'aide d'un échantillon de 3249 ménages. A pan la
première méthode, les autres produisent des estimations convergentes des paramètres
présents dans l'équation de demande (2.1).
De leur côté, Bolduc, Bernard et Bélanger (BBB) (1996) ont considéré une généralisation
du modèle précédent pour estimer la demande d'électricité au Québec conditionnelle
au choix de neuf modes de chauffage de l'eau et des locaux. Ils abordent le probkme
en deux étapes:
-Une première relative au choix du mode de chauffage;
-Une deuxième relative à la demande d'électricité conditionnelie au choix effectué.
La partie discrète utilise un MNP pour tenir compte de la présence de choix in-
terdépendants. Si le MNP s'avère le choix le plus approprié, il n'en demeure pas moins
que les problèmes de la dimension d'intégrales et celui du nombre des paramètres de
nuisance restent présents.
Pour le problème de dimension d'intégrales, des études qui prennent source en
McFadden (1989) suggèrent de remplacer ces probabilités de choix par des simula-
teurs lisses calculés à partir du modèle latent. Eu égard au problème du nombre
des paramètres de nuisance, BBB utilisent une formulation probit particulièrement
intéressante proposée par Ben-Akiva et Bolduc (1991). Celle-ci est basée sur la
présence d'un terme d'erreur supplémentaire (qu'on ajoute au modèle probit conven-
tionnel) qui est indépendamment et identiquement distribué (i.i.d.) Gumbel faisant
ainsi du MYL un cas spécial après imposition de certaines restrictions.
La structure adoptée dans BBB part d'une fonction d'utilité très proche de celle
adoptée par Dubin et McFadden (1984) mais linéaire dans les paramètres:
avec les hypothèses suivantes sur le terme d'erreur:
1. Le terme d'erreur est divisé en deux composantes
où ci est l'écart type spécifique à l'alternative i,
Jn 2. Ein = p x* wijrn Ejn + C,, avec Gin N i id N(O, 1) OÙ Mi j fn représentent des poids
j $3
et p un coefficient de corrélation et
3. vi, N Gumbel i.2.d. standardisée.
Ces hypothèses définissent un modèle YNP hybride avec des termes d'erreur
autorégressifs généralisés de premier ordre (GAR(1)) (Ben--4kiva et Bolduc ( lgg l ) ,
Bolduc (1992)).
Avec ces spécifications, la probabilité de choisir la modalité i est donnée par
( 1 , , , ? ) = eXtnfi-"m' / c exlnB+M' ln(, Mn = T,Pn1 avec Tn une matrice l€Cn
( J , x J,,) diagonale contenant les écarts types sur la diagonale principale, P, =
(IJn - pWn) et Ir, une matrice identité et W. la matrice des W i j , , . Ces hypothèses
définissent un MHP avec noyau logistique.
La partie continue a été estimée en suivant de très près l'approche de Dubin et
YcFadden (1984) à la seule différence que les formes fonctionnelles sont linéaires dans
ce cas. Ils se sont servis de la fonction de demande suivante:
d, = oi$5ii,, i al PEL, + a2POIL, + (r3 PG.427, + i
Cette équation montre bien que la quantité totale d'électricité est une fonction des
prix des dinérentes formes d'énergie et des variables représentant les caractéristiques
du ménage (Q,,) ainsi que le revenu y,. A l'instar de Dubin et McFadden (1984),
il5 ont utilisé les formes réduites et les variables instrumentales mais pas la méthode
basée sur la correction pour le biais de sélection car la dérivation des espérances
conditionnelles devient très complexe à cause de la structure de corrélation des termes
d'erreur de la partie discrète qui sont normalement distribués.
Michael Hanemanri (1984) présente une façon de formuler les modèles économétriques
de choix discrets/continus conformes avec la modélisation conjointe telle que spéciiiée
antérieurement. Pour illustrer son modèle, il l'applique au choix d'un consomma-
teur parmi un ensemble de marques d'un bien donné ainsi que la quantité (nombre
d'unités) du bien qu'il achète. Étant donné que les biens sont substituts, les gens
ne choisissent qu'une marque dans l'ensemble de choix. Le choix discret consiste en
quelle marque choisir tandis que celui continu est relatif à combien d'unités du bien
se procurer. Pour le choix des marques du bien qui varient dans les prix et les car-
actéristiques, il s'est inspiré des études théoriques de Lancaster (1979) et Yovshek et
Sonnenschein (1979). Toutefois, on constate que du point de vue technique, il s'est
limité à l'utilisation de termes d'erreur distribués selon une loi GEV.
2.3 Évolution des techniques d'estimation
Du coté purement technique, les efforts pour résoudre le problème lié à la dimension
des intégrales commencent avec la proposition de limiter la dimension des intégrales
à cinq et d'utiliser l'intégration numérique (Hausmm et Wise (1979)' Owen (1966)).
Puis s'en est suivi les approximations des intégrales. C'est ainsi que Daganzo (1979)
développe des estimateurs de maximum de vraisemblance basés sur les approximations
originales de Clark (1961). Ces dernières comportent cependant un inconvénient
majeur, celui de ne pas augmenter en précision en augmentant la taille de l'échantillon.
L'approche des simulateurs est venu révolutionner la façon d'aborder ces intégrales
multidimensionnelles. Albright, Lerman et Mançki (1977) furent les premiers à suggérer
cette méthodologie. Depuis ce temps, les simulateurs ont évolué et pour avoir une
idée de cette évolution, le travail de Hajivassiliou, McFadden et Ruud (1996) fait une
synthèse des différents simulateurs qui ont été mis au point pour évaluer les intégrales
multidimensionnelles apparaissant dans les expressions de certaines fonctions objec-
tives dont l'applicabilité était mise en cause suite aux formes non manipulables du
point de vue estimation qu'elles contenaient.
Ils ont inventorié une dizaine de simulateurs dignes d'intérêt. Ces simulateurs ont
été présentés du point de vue de leurs caractéristiques, leur applicabilité, leurs per-
formances ... On note entre autres le "Crude Frequency simulator" (CFS), le "Normal
Importance Sampling" (NIS) , le "Kernel-Smoothed Frequency" (KSF) , le "Stern's De-
composition Simulator" (SDS), le "Geweke-Hajivassiliou-Keane Simulator" (GHK), le
"Parabolic Cylinder Function Simulator" (PCF) , le "Deak's Chi-Squared Simulator"
(DCS) , le ".-2cceptance/Rejection Simulator" (.ARS), le "Gibbs Sampler Simulator"
(GSS)' le "Sequentiaily Unbiaised Simulator" (SUS) et le ".4pproximately Unbiased
Simulator" (AUS). Ces simulateurs ont généralement en commun le fait qu'ils sont des
approximations des fonctions objectives obtenues en remplaçant ces dernières par des
moyennes empiriques basées sur des valeurs simulées du terme d'erreur étant donné la
connaissance de sa fonction de distribution des probabilités. Leur travail s'est terminé
par une comparaison, pour la moins minutieuse, des différents simulateurs à l'aide
d'expériences Monte Cado sur base de la convergence, du biais, de la continuité dans
les paramètres ... Il ressort de ces comparaisons que le simulateur GHK est de loin le
plus performant et donc le plus recommandable.
A travers cette revue de littérature, on peut voir que beaucoup d'efforts ont
été consacrés à l'estimation des modèles de choix discrets/continus. Il convient,
toutefois, de signaler que très peu d'études ont été faites dans le cadre du MNP
conventionnel suite aux deux inconvénients majeurs signalés antérieurement. Par
ailleurs, l'évolution des connaissances ainsi que de la puissance des ordinateurs nous
permettent de revenir sur le problème du MNP dans ce cadre précis des choix dis-
crets/continus. Nous allons donc utiliser des simulateurs pour évaluer les probabilités
de choix de la partie discrète ainsi que des fonctions objectives dans lesquelles eues
se retrouvent et les moments conditiomek lors de l'estimation en deux étapes. Par
ailleurs des corrections aux matrices de Mnance covariance seront apportées lors de
l'estimation en deux étapes en nous inspirant des travaux de Murphy et Topel (1985).
Chapitre 3
Le cadre économétrique général
Dans ce chapitre, nous présentons, d'une façon assez générale. la structure des modèles
éconornétriques de choix discrets/continus via ses différentes composantes. La problématique
de départ est la recherche de la modélisation conjointe des deux décisions de choix à
savoir celle portant sur le choix discret et celle sur le choix continu.
Soit la fonction de densité de probabilité jointe suivante:
qui est continue en d, la fonction de demande pour n'importe laquelle des commodités
présentes dans le modèle, discrète en i, la modalité choisie par le consommateur et où
X est un vecteur des paramètres du modèle. A l'aide des propriétés des probabilités
conditionnelles, on peut réécrire la fonction ci-haut comme
où
P(ilh) est la probabilité de choisir i étant donné A,
g(dli,X) est la fonction de densité de probabilité de la demande pour une com-
modité conditionnelle au choix effectué.
L'expression (3.2) montre bien que les choix discrets et ceux continus sont tribu-
taires de la même décision de maximisation de l'utilité aléatoire. Par ailleurs, P(i, dlX)
englobe tous les cas discutés dans la partie introductive.
Une présentation systématique des cas couverts exploite la décomposition en (3.2).
Les Lignes qui suivent présentent les deux composantes de cette dernière expression.
3.1 La partie discrète (P(i1X))
Le but de cette partie est de trouver la probabilité qu'une modalité quelconque soit
sélectionnée dans l'ensemble de choix? étant donné les caractéristiques de l'individu ou
du ménage, les variables socio-économiques ainsi que tout autre facteur quantifiable
qui peut influencer le choix.
Les modèles rencontrés dans ce genre d'estimation peuvent être regroupés soit
selon le type de données à l'étude, soit selon ie degré d'interdépendance considéré.
Selon le premier type, nous observons:
Les modèles avec données de rang;
O Les modèles avec données ordonnées;
O Les modèles avec données non ordonnées.
Selon le deuxième type, nous rencontrons :
L e modèle MNL lorsque l'on postule que les modalités considérées sont indépendantes
entre elles;
O Le modèle NMNL lorsque l'on admet certaines formes d'interdépendances entre
les modalités;
0 La classe des modèles GEV qui n'est autre qu'une classe de modèles plus
générale dont les deux premiers sont des cas particuliers;
0 Le MNP lorsque l'on admet des formes très générales d'interdépendances entre
les modalités.
Notre présentation va se faire via le premier type de subdivision et le deuxième
type ne sera considéré en profondeur que lors de la présentation des données non
ordonnées.
3.1.1 Modèles pour données ordonnées
On parle de données ordonnées lorsque les données sont présentées en ordre de
grandeur. C'est le cas d'une étude qui s'intéresse à la situation où l'individu n a
fait les études secondaires, collégiales ou encore universitaires.
Soient les catégories 1, I = 1, ... , L de la variable y,, représentant le niveau d'études
de l'individu n et y: la valeur d'une variable latente continue représentant les capacités
de l'individu a effectuer des études avancées. On obsew y, = 2 (la catégorie) et non
la valeur individuelle de y:.
Le modèle latent (non observable) associé à ce problème est donné par
avec rl 5 y: 5 rl+l.
Par hypothèse, la probabilité d'observer une certaine catégorie est donnée par
qui est un probit ordonné avec @ ( a ) la fonction de distribution cumulative et si Un
Gumbel 2.i.d. , on a
qui est un logit ordonné avec A(.) la fonction de distribution cumulative.
3.1.2 Modèles pour données de rang
Pour définir les données de rang, partons d'une situation avec J modalités. i = 1: ..., J .
L'utilité procurée par l'alternative i telle que perçue par l'individu n est donnée par
où on omet l'indice n pour simplifier la notation.
Soit r,, m = 1, ..., LM, l'indice de l'alternative rangée mihe, la probabilité d'observer
Le rangement r = (rl , rzi ... ! rdM) est donnée par:
Cas particuliers
Logit rangé
Dans le cas précis qui découle de la forme particulière du Logit, la probabilité
d'observer le rangement r est donnée par
Dans ce cadre, P(T, Xlfl) est une fonction très complexe d'intégrales multidimen-
sionneiles.
3.1.3 Modèles pour données non ordonnées
Dans ce genre de modèle, les données sur la variable dépendante peuvent être définies
dans n'importe quel ordre. Pour bien cerner le problème des choix discrets dans
ce contexte, partons d'un consommateur ayant une fonction d'utilité définie sur un
vecteur de biens d = (dl , ..., d J , z). Sa fonction d'utilité peut être représentée de façon
compacte comme:
U = U(d , z),
avec z un bien composite représentant les biens autres que celui qui sera choisi et qui
est pris comme numéraire.
Par ailleurs, si pour le consommateur la fonction d'utilité est déterministe, cela
ne l'est pas pour le chercheur pour qui certaines composantes sont non obsenmbles
et qu'il traite par le fait même comme variables aléatoires. C'est ce qui donne lieu
au concept d'utilité aléatoire. Introduisons donc une composante aléatoire dam la
fonction d'utilité contenue dans un vecteur des termes d'erreur ( reflétant la variation
dans les goûts des individus dans la population et plus précisément les variables non
observées quand on parle de modèle économétrique.
Notre fonction d'utilité devient donc:
où V(d , z ) représente la partie déterministe et 5 la partie aléatoire.
Pour le consommateur1 < est un ensemble fixe et constant (ou une fonction) alors
que le chercheur le considère comme une variable aléatoire avec une fonction de densité
jointe f (El. .... E N ) et une cumulative F(ti, & , .... SN). Le choix des di optimaux représente une décision a la fois discrète et continue. La
décision discrète concerne lesquels des biens se procurer tandis que celle continue est
relative aux quantités des différents biens choisis.
Si le consommateur décide de choisir le bien i, la fonction d'utilité conditionnelle
à sa décision est donnée par:
11 s'agit de la fonction d'utilité directe conditionnelle au choix du bien i. De façon
plus compacte, nous aurons:
Le consommateur va donc maximiser (3.3) sujet à la contrainte budgétaire condi-
tionnelle pi& + z = y où y est le revenu, pi le prix du bien i et pz = 1.
La solution à ce problème donne les fonctions de demande conditionnelles:
- di =%(pi, Y,<),
et la fonction d'utilité indirecte conditionnelle est donnée par:
tandis que les identités de Roy donnent:
Pour caractériser les modèles de choix discrets, considérons la fonction d'utilité
indirecte (3.5) que nous réécrivons de façon i simplifier la notation comme
où Uin est l'utilité aléatoire procurée par la modalité i telle que perçue par le con-
sommateur n, V,, est une fonction des paramètres du modèle et &, un terme d'erreur
ayant une fonction de distribution de probabilités conjointe J ( { ) et une cumulative
F ( 0
Dans un contexte d'agent maximisant, un consommateur donné n choisira la
modalité i si celle-ci lui procure plus d'utilité comparativement aux autres. La prob-
abilité que la modalité i soit choisie est donnée par:
&(i) = prob(Qn 2 Uj,,Vj # i)
p&) = ~ o b ( K , +G 2 4, + S j , , V j # i)
pn(i) = prob(G, - Q I K, - &,, V j # 2 )
Pn(i) = jf(<)d<, 4
ou J' f (<)d< peut prendre différentes formes et donner lieu à différents modèles selon €
la distribution qui est postulée pour le terme d'erreur.
Quelques modèles dignes d'intérêt
Le logit Polytomique (MNL)
Nous obtenons ce modèle de choix discret lorsque les termes d'erreur dans l'équation
(3.6) sont indépendamment et identiquement distribués (i.i.d.) de loi Gurnbel. Alors
les probabilités de choix prennent la forme':
La difficulté avec ce modèle est qu'il est sujet au problème d'indépendance par
rapport aux alternatives non pertinentes ( H A ) . En effet, si l'on a d e w modalités 1
et i, le rapport des probabilités de choisir chacune des modalités ne dépend que des
deux alternatives en cause:
Dans un modèle logit, l'ajout ou le retrait d'alternatives ne change pas le rap-
port ci-dessus, ce qui est peu raisonnable si l'on considère que les modalités sont
interdépendantes.
La solution au problème de IL4 se trouve dans ie logit emboîté (N'VIL) et plus
généralement dans les modèles à valeurs extrêmes généralisées dont le MNL et le
NMNL sont des cas particuliers ainsi que dans le probit polytornique (MNP).
Le modèle à valeurs extremes généralisées (GEV)
McFadden (1978) décrit une forme plus générale de modèle comprenant le logit
polytomique et le logit emboîté. Elle se présente de la façon suivante2:
Soit la fonction G(y, , ...yJ) avec y,, y,, ..., y, 2 0. ( Notons que y dans ce cas est
une variable et non le revenu). Elle doit satisfaire les conditions suivantes:
1. Xon négativité : G(y,, ...,y,) 2 O pour y,, ...,yJ 2 O.
2. Homogénéité de degré 0 > 0 :
G ( c r ~ , 9 ..*3 a ~ J ) = Q ~ G ( Y , 9 .**, Y,)*
'Voir L'annexe C pour la preuve. 'McF'adden, D. (1978): "Modehg the Choice of Residential Location".
3. Condition limite: lim G(y,, ..., y,) = +DO pour i = 1, .... J . Yi -++O0
4. La dérivée lahe de G par rapport à n'importe quelle combinaison de yi, i =
1, ..., J est non négative si 1 est impair e t non positive si 1 est pair.
11 montre que si la fonction G(evl, ... eu') remplit les conditions précitées, la prob-
abilité que la modalité i soit choisie est donnée par
Gi(eul, ... eV') est la dérivée de la fonction G par rapport au @me argument.
Cas particulier: e
Le MNL: Paw ce faire, on pose G(yl , ...y,) = [i y!] avec yj = eV) et on a
Dans ce cas, on voit bien que les différents yj sont indépendants.
Le NMNL: Pour illustrer ce modèle, supposons les modalités 1, 2 et 3 cor-
respondant respectivement au choix du mode de transport par bus bleu, auto et
bus rouge. Le modèle relatif à ce problème est obtenu en posant G(yl, y2, g3) = -
+ y3kl 'l-ei + y2 avec y, = e 5 . Dans ce cas, on voit bien que les modalités 1 et L J
3 sont reliés par une certaine corrélation o et celle 2 est indépendante des deux autres.
On voit bien une flexibilité du NMNL qui permet ce genre d'interdépendances qu'on
n'observe pas dans le cas du MNL. Ainsi, on peut avoir toute sorte de probabilité:
Celle-ci est la probabilité de choisir le bus bleu qui est celle de choisir le bus (1'3)
dans tout l'ensemble (1,2,3) multipliée par celle de choisir le bus bleu dans l'ensemble
des bus (1,3). La probabilité de choisir le bus rouge est donnée par
tandis que celle de choisir l'auto par:
Le probit polytomique (MNP)
Pour définir le modèle probit polytomique, nous allons considérer le cas d'un
consommateur n(n = 1. ..., iV) qui choisit la modalité i qui lui procure la plus grande
utilité dans un ensemble de choix C = 1, ..., J comprenant J possibilités. Dans un
contexte d'agent optimisant, l'individu n choisira la modalité ayant la plus grande
probabilité de réalisation. Autrement dit, l'individu n choisira la modalité z si (U& 2
U&,V j E C, j # i), ce qui est équivalent à (U; - U$ 5 O, V j E Cl j # i). Pour
cette raison, les modèles de choix sont souvent estimés en déviation par rapport à une
modalité donnée. Plus bas, nous utiliserons la dernière modalité comme référence.
En supposant une forme linéaire pour l'utilité, nous avons:
où:
Uk: une variable aléatoire représentant l'utilité de la modalité i telle que perçue
par l'individu n,
XI;: un vecteur (1 x K) de variables explicatives caractérisant la modalité i et
l'individu n,
8: un vecteur (K x 1) de paramètres fixes considéré comme étant le même pour
chaque individu,
6: un terme d'erreur aléatoire de loi normale, de moyenne nulle qui admet
la corrélation avec les erreurs des autres modalités auxquelles est confronté
l'individu.
Pour fins d'estimation, le modèle MNP est souvent écrit en déviation par rapport
a une modaiité (voir Bolduc (1999)). Le modèle de choix en déviation par rapport à
l'utilité correspondant à la dernière modalité peut s'écrire:
- UJn = (XI: - XJn)0 + <:' - <in, i E Cl i # J.
Cette dernière expression peut être alternativement réécrite comme:
où m = J - 1, ,Y,@ représente la partie déterministe du modèle et un terme
d'erreur, les deux exprimés en déviation par rapport à la dernière modalité. Par
commodité, réécrivons aussi X,,P comme K,. En notation vectorielle, nous avons:
où en .V N(0, C). À l'aide de la décomposition de Cholesky pour le terme d'erreur, le
modèle peut être réécrit comme
où S est une matrice (m x m) triangulaire inférieure de Cholesky, telle que C = SS'.
La probabilité de choisir la modalité J va s'écrire comme suit:
Notons que la probabilité de choisir la modalité J peut être vue comme la proba-
bilité de l'intersection de m événements interdépendants:
Cette probabilité prend la forme d'une intégrale de dimension rn = J - 1.
où n(.) désigne ici une densité conjointe normale multidimensionnelle avec moyenne
nulle et matrice des variances covariances C.
Si le MNP constitue la manière la plus appropriée pour approcher les proba-
bilités de choix lorsque la structure du modèle laisse croire que les modalités sont
interdépendantes, son utilisation souléve des difficultés à cause des intégrales multi-
dimensionnelles.
3.2 La partie continue
La partie continue est représentée par la forme générale g(dl i , O ) qui peut être con-
stituée de deux grands groupes:
a) Modèles de régression lorsque nous avons des variables continues limitées. Pour
l'estimation, on envisage don les MCO, MCG ou toute autre méthode a propriétés
désirables.
b) Modèles à données limitées: comme exemple, les modèles de durées sont em-
ployés lorsque les variables représentent une durée entre deux évènements. Les lois
suivantes sont souvent postulées pour la variable de durée:
- Exponentielle avec f ( s ) = ye-7C, F 2 0;
- Weibull avec j(<) = akb-'e-acb a et b étant deux paramètres;
- LognormaJe avec f(<) = f 9 (e) avec (F) .- N(o , 1).
Chapitre 4
Estimation économétrique:
Méthode d'estimation en une étape
(Maximum de Vraisemblance à
Informat ion Complète)
4.1 Cadre théorique
Dans cette partie du travail, nous présentons une façon assez générale d'estimer
simultanément les parambtres de la partie discrkte et celle continue des modèles
économétriques de choix discrets/contious. Il s'agit d'écrire la distribution conjointe
des variables aléatoires impliquées dans les deux parties considérées et de maximiser
la log-vraisemblance complète.
Considérons la fonction de densité de probabilité suivante:
P(im LI&; A) (4.12)
qui est continue en d, la fonction de demande pour n'importe laquelle des commodités
(bien, service) et discrète en in la modalité choisie par le consommateur n et où H, est
le vecteur contenant les variables exogènes du modèle et X le vecteur des paramètres
du modèle.
a l'aide des propriétés des probabilités conditionnelles, nous pouvons décomposer
1'e.xpression (4.12) en
ou alternativement en
avec
O P(I, /Ifn; A) est la probabilité de choisir i étant donné H,,,
O g(&ii,, H,; A) est la fonction de densité de probabilité caractéris ant la d emande
dn, conditionnelle au choix effectué par le consommateur pour une commodité
donnée faisant partie de l'ensemble de choix,
a P (in 1 cin: Hn; A ) est la probabilité de choisir i étant donné la demande d'élect~cité,
g(&j H,; A) est la demande non conditionnelle.
La méthode d'estimation qui se prête bien A ce genre de modéles est celle du
maximum de vraisemblance. La fonction de vraisemblance du modèle est de la forme
dors que la log-vraisemblance s'écrit
Cette approche est équivalente à celle décrite par Hanernann (1984) dans le cadre
de l'évaluation de la demande des marques d'un produit avec la fonction de distribu-
tion de d, qui est la consommation observée de la marque i qui a été sélectionnée par
l'individu n lors de son problème de maximisation et P(i, j Hn; A) la probabilité que
la marque i soit sélectionnée dans un ensemble donné. Pour l'estimation, par con-
tre. comme le dit Hanemann dans son article, une estimation de tous !os paramètres
du modèle par le maximum de vraisemblance B information complete s'avère très
complexe, surtout dû au fait que tant P(i,) que g(dnJin) comportent des intégrales
multidimensionnelles (voir section sur le MXP). C'est ce qui l'a amené a préconiser
une méthode en deux étapes.
En effet, une difficulté particulière reliée à l'approche du FIML telle que décrite
ci-haut est de dériver la fonction de distribution conditionnelle (demande condition-
nelle) au choix effectué dans la partie discrète. Une façon alternative d'aborder le
problème, compatible avec la simultanéité dans les décisions discrètes et celles con-
tinues, est de considérer une décomposition de la loi conjointe P(in, &) plus pratique
que la précédente. II s'agit, en fait, d'exploiter la forme P(in l&) .g(dn). Revenant à
la situation initiale, le modèle s'écrit comme:
où la première relation décrit l'utilité, les U'n étant des utilités en dS6rence par
rapport a celle qui est choisie (i) (U& = Li;;, - U&) dors que la deuxième est relative
à la demande d'électricité du ménage et
La contribution à la vraisemblance, pour toute modalité, lorsque la modalité i a
été choisie, est donnée par:
p ( K <O,&). (4.15)
La loi des latentes relative à cette formulation est donnée par:
En conditionnant, l'expression (4.15) peut s'écrire comme
ou alternativement
Il convient de noter que la relation (4.16) est équivalente à celle qui a été décrite
en premier lieu dans cette partie du travail et correspond à celle préconisée par Hane-
mann (1984) et dont une des composantes n'est pas facile ê. dériver comme signalé
antérieurement. La deuxième relation (4.17) peut amener à des expressions qui sont
relativement faciles à obtenir connaissant la loi conjointe de l'utilité et de la demande.
En effet, sachant que
on obtient directement
Les deux composantes de l'équation (4.17) peuvent être réécrites comme suit:
Dans le cas simple (dichotomique), P(U; 5 014) peut prendre la forme suivante:
Avec ces expressions, nous pouvons finalement écrire
alors que la formulation générale nous amène à:
Cette formulation nous permet l'utilisation du simulateur GHK pour l'évaluer au
même titre que nous le faisons pour les probabilités de choix marginales.
À partir de cette formulation, nous pouvons méme définir un modèle conditionnel
en utilisant la transformation suivante:
où < = TV avec FI'' = Cu, - O ~ ~ O ~ ~ O ~ , et u - N ( 0 , I ) . Avec cette transformation,
nous pouvons écrire:
Les deux façons de spécifier la loi conjointe constituent la clé permettant d'aborder
l'estimation des modèles économétriques de choix discrets/continus dans un contexte
du maximum de vraisemblance à information complète. Toutefois, ces équations,
dans le cas particulier où les termes d'erreur dans la fonction d'utilité aléatoire sont
normalement distribués, donnent lieu à des fonctions de vraisemblance qui ne sont
pas facilement manipulables. C'est pourquoi les chercheurs ont souvent évité cette
procédure en une étape lorsque les équations devenaient complexes. De nos jours, les
ordinateurs étant plus puissants et les techniques de simulation ayant évolué, nous
pouvons nous permettre d'aborder ces problèmes. Nous d o n s donc parler d'une
méthode de vraisemblance simulée à information complète.
Il convient de noter que l'on pourrait tout autant utiliser la méthode des moments
simulés sauf que cela aurait nécessité la simulation de toutes les probabilités de choix
impliquées dans l'ensemble de choix alors que le maximum de vraisemblance ne re
quiert que la simulation de la probabilité pour l'alternative choisie. Pour des grands
ensembles de choix. il devient clair que le maximum de vraisemblance est préférable
à la méthode des moments.
Enfin, si la méthode en une seule étape nous permet d'estimer simultanément les
paramètres qui entrent d m les composantes discrete et continue, il n'en demeure
pas moins que certains chercheurs argumentent qu'en raison de cette simultanéité de
traitement, une erreur de spécification sur l'une ou l'autre des deux parties aura des
répercussions sur les propriétés des estimateurs de tous les paramètres. Par contre,
dans un contexte d'estimation en deux étapes, une erreur sur une des parties lors de
l'application de la méthode est limitée à l'étape en question. Cet aspect de robustesse
prêche souvent en faveur des méthodes à étapes. Le gain de la modélisation simultanée
des deux composantes est clairement celui de l'efficacité.
4.2 Évaluation empirique: Estimation
d'un modèle discret /continu de
une étape
demande
d'électricité dans le secteur résidentiel québécois.
4.2.1 Introduction
Depuis le travail de Dubin et McFadden (l984), la demande d'électricité est explicite-
ment considérée comme le résultat d'une décision conjointe sur le choix des appareils
ménagers en fonction de la forme d'énergie utilisée pour leur fonctionnement et la con-
sommation d'électricité par les dits appareils. Ils sont convaincus, à juste titre, que
toute modélisation qui ignorerait le fait que les deux décisions sont interdépendantes
conduirait a des estimateurs et des élasticités prix et revenu biaisés et non convergents.
Dans leur travail, le choix entre les appareils était modélisé à l'aide d'un modble MNL.
L'estimation du modèle discret/continu a été faite à l'aide d'une approche en deux
étapes où une correction du type Heckman a été faite pour assurer des estimateurs
convergents. BBB ont fait une extension de l'approche de Dubin et McFadden en
permettant une structure peu restrictive lors de la modélisation de la partie discréte
B l'aide d'une formulation MNP. Le MNP est réputé être la formule recommandée
lorsque les alternatives sont interdépendantes entre elles.
Dans BBB (1996)' parmi les neuf modes de chauffage de l'eau et des locaux con-
sidérés, la présonce des interdépendances était évidente et le processus d'estimation
devait en tenir compte sous peine de donner lieu à des estirnateurs non convergents.
La présence des interdépendances entre les modalités a été introduite dans le modele
via la structure de corrélation des termes d'erreur normalement distribués. Pour
l'estimation, une méthode en deux étapes a été utilisée. La dimension discrète a été
modélisée à l'aide du maximum de vraisemblance simulé où les probabilités de choix
probit ont été remplacées par des simulateurs efficients. La deuxième étape a été
estimée à l'aide d'une régression instrumentale linéaire de façon à tenir compte de la
simultanéité dans les deux décisions.
La contribution du présent chapitre est d'estimer le modèle considéré dans BBB
à l'aide d'une approche du maximum de vraisemblance à information complète. Les
formes fonctionnelles ainsi que la spécification du modèle suivent de très près l'étude
de Dubin et McFadden (1984). En effet, les fonctions de demande conditionnelles
d'électricité sont linéaires dans les prix et proviennent de l'application des identités
de Roy à une fonction d'utilité indirecte non linéaire spécifique. À notre connaissance,
cette étude constitue la première estimation d'un modèle discret/continu dans le cadre
du maximum de vraisemblance à information complète où la dimension discrète est
décrite à l'aide d'une spécification MNP non linéaire. Nous appliquons cette formu-
lation pour modéliser la demande d'électricité dans le secteur résidentiel québécois
étant donné le système de chauffage de l'eau et des locaux dans l'habitation.
Dans la province de Québec, il existe une vaste gamme de sources d'énergie pour
le chauffage de l'eau et des locaux. En 1989, 64% des ménages utilisaient l'électricité
pour le chauffage des locaux, alors que 16% utiiisaient le mazout, 7% le gaz naturel,
6% la bi-énergie (électricité/rnazout ou électricité/bois), et 6% d'autres sources et
principalement le bois. L'électricité, le gaz naturel et le mazout sont aussi utilisés
dans le chauffage de l'eau. Durant les vingt dernières années, le Québec a observé le
délaissement du mazout en faveur de l'électricité. La popularité de l'électricité a été
acquise aux dépens exclusivement du mazout alors que les autres sources d'énergie
ont gardé les mêmes parts. Il y a aussi une utilisation significative de la &énergie:
électricité/mazout ou électricité/bois. Étant donné la part importante de l'électricité
dans le chauffage de l'eau et des locaux, il appardt important de voir si les phénomènes
observés peuvent être expliqués ai termes des variables économiques de base comme
les prix relatifs, le revenu et les caractéristiques des ménages.
Dans la section suivante, à l'instar de Dubin et McFadden (1984), nous présentons
un modèle de la demande d'électricité compatible avec le choix discret des appareils
en fonction de l'énergie qu'ils utilisent pour leur fonctionnement. Par la suite, le
modèle économétrique relatif au système discret/continu étudié est dérivé. Dans le
cadre de l'analyse empirique proprement dite, les estimations des élasticités prix et
revenu de long terme et de court terme sont obtenues à l'aide de l'approche conjointe
stipulée ci-haut. Les résultats sont comparés à ceux obtenus dans BBB à l'aide d'une
méthode en deux étapes et ils sont semblables. Par ailleurs, les résultats sont très
proches de nos attentes.
4.2.2 Le système économétrique discret /continu
La modélisation d'un système discret/continu part du problème d'un agent n(n =
1, .... iV) qui est appelé à prendre une décision sur le chok d'un mode de chauffage de
l'eau et des locaux dans un ensemble de choix comportant neuf modalités en même
temps que la quantité d'électricité à consommer. Techniquement, cela suppose la
description de la réalisation de (i, d ) où i représente un mode de chauffage de l'eau et
des locaux donné panni l'ensemble de J, possibilités disponibles à n individus et où
d est la demande d'électricité.
Comme on peut le comprendre, chaque ménage a un ensemble de choix qui lui
est propre et dont le nombre d'éléments est J,. Nous permettons cette possibilité de
telle sorte que nous prenions en compte le fait que le gaz naturel n'est pas disponible
dans tous les ménages que nous étudions.
Étant donné que le choix i et la quantité d'électricité consommée dépendent des
mêmes facteurs, il devient important de modéliser les deux de façon simultanée. Une
méthode de vraisemblance à information complhte permettra de déterminer A', le
vecteur des paramètres du modèle qui va maximiser la densité jointe P(i, dlX) associée
a (2, d). Soit in la modalité choisie par le ménage n et soit d, sa demande d'électricité.
L'approche du maximum de vraisemblance à information complète peut être faite en
spécifiant une forme pour la fonction de densité jointe:
qui est continue en d, ( la demande d'électricité), discrète en in et où
Hn est un vecteur de variables exogènes, et
X un vecteur des paramètres à estimer.
.k l'aide des propriétés des probabilités conditionnelles, nous pouvons aussi écrire
la fonction de densité jointe comme un produit d'une probabilité et une fonction de
densité conditionnelle. Nous obtenons:
où
P(i , 1 H,; A) est la probabilité de choisir i étant donné Hn,
g(&lin, H,,; A) est la fonction de densité de la demande d'électricité conditionnelle
au mode de chauffage sélectionné.
Dans le but de maintenir une certaine cohérence entre les décisions sur le choix des
appareils de chauffage en fonction de la forme d'énergie qu'ils utilisent et celle continue
sur la décision de leur usage, nous dérivons la fonction de demande d'électricité a
l'aide des identités de Roy appliquées a la fonction d'utilité relative à chaque mode
de chaufFage. À 1Ynsta.r de Dubin et McF'adden (1984), dans le but d'obtenir des
demandes linéaires dans les prix et le revenu, nous spécifions la fonction d'utilité
indirecte comme suit:
Ut\: utilité non observée associée au système i telle que perçue par l'agent n,
Pm: prix de l'électricité,
P,: prix du gaz naturel,
Pm,: prix du mazout,
y, - r;n: le revenu net du coût annuel d'achat et d'opération du système i par le
ménage n,
Q,: le vecteur des caractéristiques du ménage,
y: un vecteur des paramètres.
Côté notation, nous avons ajouté une étoile à ri,, ce qui nous permettra de définir
plus loin des coûts des systèmes en relation avec un système de référence. Comme
dans Dubin et McFadden (l984), le coût annuel est défini comme:
où
p = p, + p, y,: est le taux d'escompte supposé linéaire dans le revenu,
PIO&: le coût annuel d'opération imputable à l'utilisation du système i dans le
ménage n, lequel est exogène étant donné qu'il est calculé comme un produit du prix
de l'énergie et de la demande de celle-ci calculée en fonction des caractéristiques d'un
ménage typique.
PICPin: le coût annuel du capital pour le système considéré.
Pour les détails sur les deux quantités précédentes voir Bélanger (1992). Les autres
termes nécessitent une discussion plus poussée. C'est le cas de q,, qui est un terme
d'erreur spécifique au ménage n alors que <:n est un terme d'erreur qui varie avec les
alternatives et les ménages. Dans Dubin e t McFadden (1984), les c,, sont supposés
distribués de Loi Gumbell i.i.d, e t cela donne lieu au MNL. Comme mentionné, pour
plus de flexibilité nous avons postulé une distribution normale multivariée pour les
termes d'erreur t:n, i = 1, ..., Jn. D'autres détails sur les hypothèses des termes
d'erreur sont présentées dam les lignes qui suivent. Finalement, notons que les CE;
jouent le rôle des constantes spécifiques aux modalités.
De façon plus simplifiée, nous posons:
qui nous permet de réécrire la fonction d'utilité indirecte comme:
U& = iS;n,3 + 6(yn - rin) + G] e-"." i &:. (4.22)
Appliquant les identités de Roy, nous obtenons la demande conditionnelle d'électricité:
Dans les lignes qui suivent nous présentons une discussion plus détaillée de chacune
des deux dimensions du problème.
4.2.3 Le modèle de choix
.4fin de tenir compte des interdépendances entre les modalités présentes dans notre
modèle, la partie discrète que nous présentons utilise une formulation probit poly-
tomique. Pour un ménage donné n, n = 1, ..., N , et une modalité i, i = 1, ..., Jn où
J,, est le nombre de modalités dans l'ensemble de choix C,, nous pouvons écrire le
modèle comme suit:
1 si U& 2 U& pour j = 1, ..., J,, et chi, =
( O autrement,
où ch, est Le choix observé et UA est l'utilité procurée par la modalité i telle que
perçue par le ménage n et telle que définie dans l'équation(4.22).
Réécrivant le modble sous forme vectorielle et supposant que chacun des ménages
considérés a accès à tous les neuf modes de chauffage, nous obtenons:
où [1; = [&: ..., {in] - N ( 0 , C ) et où C est la matrice de wriancecovariance décrivant
la structure d'interdépendances entre les utilités. Dans le but de réduire le nom-
bre de paramètres de nuisance lors de l'estimation des éléments de C: nous faisons
l'hypothèse que les (i proviennent d'un processus autoregréssif généraiisé d'ordre 1
(GAR(1)) (voir Ben-Akiva et Bolduc (1991) et Bolduc (1992)). Cette hypothése a
été utilisée dans BBB (1996) et elle s'avère tri% utile car elle réduit de beaucoup les
difficultés de calcul lors de l'estimation du modèle. Par ailleurs, il est connu que
certaines restrictions d'identification devraient être imposées pour que les paramètres
de la partie discrète soient estimables. En règle générale, les paramètres qui peuvent
être estimés sont ceux présents dans une version du modèle écrite en déviation par
rapport à une modalité donnée. De plus, pour fixer l'échelle, une variance doit être
maintenue ii une certaine valeur. Par convention, nous prenons le modèle en déviation
par rapport à la dernière modalité J. Le modèle en déviation s'écrit:
OÙ les variables Uinl Xint Tivn et & , sont en déviation.
Pour estimer les paramètres dans cette dernière équation par la méthode du max-
imum de vraisemblance, nous avons besoin de calculer la probabilité Pn(i) associée à
l'alternative i sélectionnée. Prenant la dernière modalité comme référence, un ménage
donné choisira l'alternative J si Ui, < UJn Vi, ce qui implique que:
pour tout i, i = 1. ..., 8. Pour évaluer cette probabilité de choix, nous devons calculer
des intégrales normales de dimension 8. Ceci ne peut pas être fait de façon numérique.
Étant donné ces difficultés, nous suggérons le remplacement de P.(J) par le simu-
lateur de Geweke, Hajivassiliou et Keane (GHK) que nous écrivons comme Fn(~). Comme stipulé dans L'annexe D? ce simulateur peut être calculé comme une moyenne
empirique prise sur T tirages différents des ci,n:
où &,( J) est calculé à l'aide de produits des fonctions de densité cumulatives calculées
de façon bien précise. (Voir Bolduc (1999) pour détails)
4.2.4 Le modèle de demande conditionnelle
Étant donné la fonction d'utilité dans l'équation (4.22), nous dérivons la demande
d'électricité conditionnelle au système choisi à l'aide des identités de Roy. Laissant
tomber l'indice n par simplification de la notation et dénotant la demande d'électricité
par d, nous obtenons:
Sachant que
au ae - = [a, - &(a8 + - + a.Pe + u,Pg + amPm + Qty + 6(y - r i ) + ?)] ëJPe ape 6
considérant g dans ri camrne exogènes, la fonction de demande devient:
Tenant compte du fait que certaines caractéristiques sont spécifiques à la demande
(les facteurs qui n'apparaissent pas dans la fonction d'utilité), nous introduisons un
terme supplémentaire ZiO. Ré-introduisant l'indice n, nous obtenons finalement:
qui peut être réécrit de façon plus compacte comme:
où, une fois de plus, in représente la modalité sélectionnée par le ménage n.
4.2.5 Estimation du modèle discret /continu
Comme mentionné précédemment, la probabilité de choix va être remplacée par
un simulateur. Ceci implique l'usage de F,., (in) .g(d,, lin, H,, A) en remplacement de
P(in 1 H,; A) g(& lin, H,; A) dans un contexte du maximum de vraisemblance simulé.
Sachant que:
où in est la modalité choisie et qn - N (0, g), nous avons:
où p(.) est la densité de probabilité d'une variable normale standard. La sélection de
la variable indicée in à inclure dans g(d,J-) fait ressortir l'aspect conditionnel de la
demande. La distribution jointe simulée à l'aide du GHK est donnée par:
et la fonction de vraisemblance simulée est:
Ceci nous amène a la fonction de log-vraisemblance simulée suivante:
La fonction de vraisemblance dérivée dans cette partie du tramil ne fait pas état
de la corrélation entre la partie discrète et celle continue de façon explicite. C'est ce
qui nous amène à croire qu'elle suppose l'indépendance entre le terme d'erreur q et
le vecteur 5. Dans le cadre de cette thèse, nous allons nous en tenir à la formulation
telle que présentée dans cette section, ce qui n'altère pas la méthodologie utilisée mais
pour des considérations futures, nous dons utiliser la formulation (4.17). Les calculs
relatifs aux dérivées premières apparaissent à l'annexe E.
4.2.6 Données et spécification du modèle
Les données utilisées dans la présente étude proviennent d'une enquête postale faite
par Hydro-Québec en 1989 sur la consommation d'électricité. Pour l'estimation,
nous avons utilisé la même banque de données que BBB (1996). Le taux de réponse
à ce questionnaire était de 44.9% alors que 45833 ménages ont répondu sur un total
de 101977 questionnaires envoyés. Le sous-échantillon sélectionné pour cette étude
était composé de maisons unifamiliales (détachées, semi-détachées ou en rang avec
entrées séparées), qui étaient soit construites ou converties à une autre source d'énergie
de chauffage de locaux durant la période allant de 1986 à 1989. Celles-ci étaient
des restrictions imposées pour avoir une période où les prix des différentes sources
d'énergie étaient relativement stables après la chute du prix du mazout en 1986 et
aussi pour avoir un échantillon homogène. L'échantillon retenu est composé de 3090
observations.
Le questionnaire comprenait outre l'information sur les caractéristiques des ménages,
celle sur les variables socio-économiques. L'information sur la consommation a été
obtenue de Hydro-Québec, alors que les données sur les prix utilisés dans le calcul des
coûts d'usage et de capital des systémes de chauffage de l'eau et des locaux ont été
recueillies du gouvernement de Québec (1992). La disponibilité en gaz pour chacun
des ménages a été déterminée sur base du code postal e t de l'information recueillie
auprés de Gaz Métropolitain. Les valeurs et détails sur les calculs des coûts de capital
et d'opération se retrouvent dans Bélanger (1992).
Pour aider le lecteur à comprendre la collecte des données, nous reproduisons les
tableaux 1 et 2 de BBB (1996) qui donnent une bonne description des statistiques
relatives à l'échantillon que nous considérons.
Du tableau 1, on peut constater que 80% des ménages dans l'échantillon utilisent
l'électricité cornme unique source d'énergie pour chauffer et l'eau et les locaux. Sur
les 18 combinaisons possibles, 9 systemes ont été retenus. Le tableau 2 quant à lui
montre la répartition actuelle entre les 9 systèmes de chauffage ainsi que la description
des variables explicatives, leurs noms et leurs moyennes échantillonales.
Tableau 1.1: Nombre de type de systèmes de chauffage de l'eau et des locaux par source d'énergie (pour cent)
Chauffage des locaux Chauffage de l'eau Gaz naturel Mazout Electricité Totai
Gaz naturel 32 - 13 45
Mazout
Électricité
Bois
Total
SOURCE: Bernard, Bolduc and Bélanger (1996)
Tableau 4.2: Variables pour le modèle de choix de chauffage de l'eau et des locaux
Variables Nom Moyenne échantillonale
Options (Locaux-Eau) Gaz/gaz 1 0.010 Gazlélectricité 2 0.004 Bi-énergie/mazout 3 0.024 Bi-énergie/électricité 4 0.072 Yazout/mazout 5 0.005 Mazout/électricité 6 0.007 Électricité/électricité 7 0.801 Bois/électricité 8 0.050 Bois-électricité/électricité 9 0.028
Secteur SECT Rural 0.254 Peu urbain 0.103 Urbain 0.031 Haute densité 0.622
Degrés-j ours de chauffage HDD 4844.0 Année de conversion (1986-9) DATCONV 1987.1 Année de construction (1920-89) DATCON 1977.4 Xombre de personnes par ménage NBPERS 3.09 Surface (pieds carrés) SURF 1656.5 Âge du chef de famille AGE 42.1 Revenu du ménage ($) Y 42536.4 Coût d'opération annuel ($) PIOP 1394.9 Coût fixe annuel ($) PICP 392.2 Coût 6xe annuels revenu (lo3 x s2) fICPY 1744.9
SOURCE: Bernard, Bolduc and Bélanger (1996)
Spécification du modèle
Tel qu'il a été fait mention précédemment, pour fins d'identification, une alternative
devrait être considérée comme base et les autres prises en déviation par rapport à
elle. Yous considérons l'dternative 1 (gaz/gaz) comme base. Ainsi, tous les effets sont
modélisés relativement à celle-ci. Comme stipulé dans la notation antérieurement, cer-
taines vanables (Xi,, y, et ri*) apparaissent aussi bien dans la partie discrète que celle
continue, certaines d'autres (&,) dans la partie continue seulement. D'autres vari-
ables étaient exclues de certains groupes spécifiques sur base des statistiques basées
sur le ratio de vraisemblance. En ce qui concerne la structure de corrélation des
termes d'erreur du probit, nous avons utilisé la même spécification que BBB (1996).
Sans entrer dans les détails sur le processus GAR(1), pour les besoins de notre
étude, il suffit de signaler que ce processus nous a permis de représenter notre struc-
ture de variance covariance I'aide de quelques paramètres supplémentaires. Ces
paramètres sont 01, O;! et p. Le paramètre ol est un coefficient d'échelle qui est com-
mun a toutes les alternatives qui ont en commun l'électricité comme source d'énergie
dans l'une des composantes du système, oz est un effet d'échelle relatif aux alterna-
tives qui ont le bois comme une des sources d'énergie. Finalement, le coefficient p est
un paramètre de corrélation capturant les similarités entre les alternatives. Avec un
p positif, les alternatives sont considérées comme similaires alors qu'un p négatif im-
plique des dissimilarités. Parmi les paramètres de nuisance? o est l'écart type associé
avec le terme d'erreur 7,.
4.2.7 Résultats de l'estimation
Le tableau 3 contient les résultats de l'estimation de la partie discrète ainsi que celle
de l'équation de la demande d'électricité. La convention que nous avons adoptée pour
lire le tableau veut que NOM q indique que la Mnable nom a un effet identique sur
les alternatives x et y. Les effets spécifiques à une seule alternative ont seulement
une valeur simple x. Il faut aussi noter que le mot générique veut dire que la variable
est relative à toutes les alternatives, même celle considérée comme la base. Xotons
que l'estimation a été faite à l'aide du maximum de vraisemblance simulé via le
simulateur GHK basé sur 20 tirages. D'autres estimations basées sur plus de tirages
ont été faites mais les résultats étaient similaires. Nous présentons l'interprétation
des résultats obtenus.
Tableau 4.3: Résultats de l'estimation PARTIE 1: Le modèle de choix iT=20)
UTILITE DETERMINISTE Variables explicatives Nom Effet Estimations Ec.type stat-t
Ga,z/éIectricité Bi-énergielmazout Bi-éaergielélectricité Mazout/mazout Mazout/électricité Électricité/électricité Bois/électricité ois-Électricité/électricité Secteur
Degrés-jours de chauffage hddm34 3 et 4 -0.0101 0.0025 -4.058 hddm7 7 -0.2560 0.0448 -5.7713 hddm89 8 et 9 -0.0042 0.0021 -1.977
COMPOSANTES NON-LINÉAIRES d 0.0495 0.0078 6.328
Po 0.3820 0.0639 5.9'74 Pi -0.0790 0.0115 -6.863
STRUCTURE DE COVARIANCE DU TERME D'EKREWR 01 0.0187 0.0038 4.931 0 2 0.0056 0.0010 5.582 P 0.093 0.1440 0.646
Le modèle de choix
Les constantes spécifiques aux alternatives révèlent que tous les systèmes sont préférés
à l'option gaz/gaz avec l'option 7 (électricité/électricité) comme la plus prisée. Les
résultats laissent voir que plus une option renferme de l'électricité comme source
d'énergie, plus elle sera préférée aux autres en contenant moins. Si l'on considère
les options qui partagent le même système de chauffage de l'eau ou des locaux,
celle faisant plus appel à l'électricité est préférée aux autres. C'est le cas de Bi-
énergie/ électricité (0.0605) qui est préférée à Bi-énergie/mazout (0.0603) ; Bois-électricité
/électricité (0.0227) qui est préférée à Bois/électricité. Ceci correspond bien aux con-
clusions de BBB (1996).
Secteur: Les estimations des paramètres associés la densité de la population
sont négatifs, montrant une préférence marquée pour l'option gaz/gaz. Cela peut
trouver son explication dans le fait que la distribution du gaz naturel est princi-
palement développée dans le milieu urbain où la densité de la population est élevée.
Cette variable est représentée par des valeurs numériques augmentant avec la den-
sité de la population (rural:l, peu urbain:2, urbain:3, haute densitk4). Il ressort de
ces constatations qu'une augmentation de la densité de la population entraîne une
augmentation de la préférence pour l'option gaz/gaz.
Degrés-jours de chauffage: Cette variable décrit les effets du temps sur le choix
du système de chauffage. En se rappelant que les systèmes de chauffage électriques
ont des coûts de capital relativement faibles mais des coûts d'opération élevés alors
que les autres systèmes ont des coûts de capital relativement élevés contrairement
aux coûts d'opération, on peut dire que les valeurs négatives obtenues pour toutes les
variables de degrés-jours de chauffage signifient que plus il fait froid, plus on préfere
utiliser l'option gaz/gaz.
6, p, et p, : Une différence importante entre le travail de BBB (1996) et le nôtre
est l'utilisation d'une spécification non-linéaire pour la description des systèmes de
Tableau 4.4: Résultats de l'estimation: P-4RTIE 2: La demande d'électricité condi- tionnelle -
PARTIE CONTINUE Variables Explicatives Xom Estimations Ec. type stat-t
Gaz /électricité const 2 -0.0101 0.0046 Bi-énergie/mazout Bi-énergie/électricité Yazout/mazout Y azout/électricité Électricité/électricité Bois/électricité ois-Électricité/électricité Prix de l'Électricité Prix de l'Électricité pour les locaux Prix de l'Électricité pour l'eau Prix du Mazout Prix du Gaz Secteur degres-jours de chauffage Date de Conversion Type d'habitation Date de construction Nombre de Pièces Nombre de Personnes Ownrent Surface Âge Disponibilité du Gaz
const3 const4 const 5 const6 const? const8 constg privelbo peleloc peleeau prixmaz prixgaz secteur hddm
datconv nhabi datcon npiec npers nprlo s u r f
age gasava
ECART TYPE SIGMA 0.821 0.0042 199.216
chauffage de l'eau et des locaux. Notre spécification est identique à celle utilisée par
Dubin et McFadden (1984). Il est intéressant de noter que les estimations que ces
auteurs ont obtenues pour 6, ,O, et pl sont comparables à celles que nous avons eues
dans le cadre de cette étude. La valeur estimée négative de pi implique que le taux
d'escompte diminue avec le revenu.
La demande d'électricite
Pour mesurer 4, nous avons utilisé la quantité totale d'électricité en kWh consommés
par un ménage donné. Pour des raisons de commodité, nous reprenons les estimations
des constantes spécifiques aux alternatives que nous avions présentées lors de la partie
discrète. Il convient de rappeler que les constantes ai apparaissent dans la partie
tant continue que discrète. Le prix de l'électricité (Prixelbo) a dinérents effets selon
l'utilisation qui en est faite: les consommateurs résidentiels utilisent l'électricité pour
chauffer les locaux (Peleloc) et pour l'eau (Peleau). Comme on devrait s'y attendre,
l'effet global est négatif, Prixelbo ayant la plus grande valeur absolue. Les prix du
mazout et du gaz naturel ont un effet positif sur la consommation d'électricité.
Les variables pour la date de conversion ainsi que la date de construction ont un
effet négatif insinuant que plus récente est la date de conversion ou de construction
de l'habitation, moindre est la consommation d'électricité. Cela est le résultat des
standards d'efficience dans la consommation d'électricité imposés vers les années 80.
Le type de maison (Housetype) (1: détaché, 2: semi-détaché, 3: rangées de trois ou
plus), indique que les habitations détachées consomment plus d'électricité. L'effet du
temps sur la consommation d'électricité est expliqué par la variable de degrés-jours de
chauffage. L'effet positif observé montre que plus le climat est froid, plus d'électricité
sera demandée. Comme, on pouvait s'y attendre, la consommation d'électricité aug-
mente avec le nombre de personnes dans l'habitation. La demande d7&ctricité aug-
mente aussi avec la surface de la maison et l'âge du chef de famille. Par ailleurs,
les gens qui sont propriétaires consomment m o h d'électricité comparativement aux
locataires (Ownrent). Enfin, la disponibilité du gaz diminue la consommation de
l'électricité.
Élasticités prix et revenu
Le tableau 5 résume les élasticités prix et revenu relatives à notre modele discret/continu.
Les valeurs sont calculées aux moyennes édiantillonales. Toutes les élasticités ont des
signes corrects. Les élasticités prix sont très proches de celles obtenues par BBB
(1996).
Pour obtenir ces élasticités, nous avons utilisé l'équation de demande non condi-
t ionnelle:
où E ( x / j ) est la demande d'électricité conditionnelle au choix de l'alternative j. Avec
ces résultats, nous pouvons écrire I'élasticité de E(x) par rapport A p comme:
où w, est la part de marché du système j .
Tableau 4.5: Élasticités prix et revenu
Options de l'électricité du mazout du gaz revenu
Gaz/gaz Gaz/électricité Bi-énergie/mazou t Bi-énergielélectricité Mazout/mazout Mazout /électricité Électricité/électricité Bois/électricité Bois-électricité/électricité
Moyenne -0.959 0.953 0.102 0.124 Espérance de la demande d'électricité incluant la possibilité de changements de système -0.383 0.467 0.054 0.064
Nous pouvons observer au tableau 5 que les élasticités de court terme et celles
de Long terme sont différentes. Cela peut trouver son explication dans le fait qu'à
long terme les ménages peuvent être amenés à changer leur système de chauffage de
l'eau et des locaux. Quand nous comparons les élasticités obtenues dans ce travail et
celles dans BBB (1996), nous constatons que les réponses aux prix d'électricité et de
revenu sont similaires. Notre modèle semble, cependant, mieux se comporter quand
nous considérons que la réponse de la demande d'électricité, suite aux changements
dans les prix des deux autres sources d'énergie et plus spécialement pour le mazout,
est plus élevée. Les valeurs que nous avons obtenues sont plus proches de ce à quoi
on devrait s'attendre.
4.2.8 Conclusion
Les motivations de notre travail étaient d'évaluer la demande d'électricité condition-
nelle au choix d'un mode de chauffage de l'eau et des locaux parmi neuf alternatives à
l'aide d'une approche du maximum de vraisemblance simulé à information complète.
Les estimations des élasticités ont les signes corrects et sont conformes & nos attentes
et plus particulièrement pour les d e u r s obtenues pour les élasticités de court terme.
En termes de difficultés de programmation, l'approche conjointe est certainement
plus laborieuse comparativement à une méthodologie en deux étapes. Par contre les
résultats que nous venons d'obtenir sont plus probants en ce sens que le FIML tient
compte de toute l'information disponible, indiquant clairement que la complexité en
vaut la peine. Une des causes de cette amélioration relativement aux résultats de
BBB est vraisemblablement la prise en compte de la structure non linéaire.
Pour le chapitre prochain, nous sacrifions maintenant l'efficacité pour obtenir une
approche beaucoup plus simple à mettre en oeuvre. Ce que nous proposons est une
méthode statistique en deux étapes qui peut être vue comme l'extension au cas probit
polytomique de l'approche très populaire de Heckman (1978) pour la correction pour
le biais de sélection.
Chapitre 5
Estimation économétrique:
Méthode d'estimation en deux
étapes (Maximum de
Vraisemblance à Informat ion
Limitée)
5.1 Cadre théorique
Il s'agit d'estimer les paramètres de la partie discrète puis ceux de la partie continue
en conditionnant sur les résultats de la première partie. La motivation de le faire
en deux étapes au lieu d'une se justifie, entre autres, par le fait que la configuration
du problème laisse voir qu'il est plus facile de modéliser séparément les deux parties
parce que la distribution conjointe est dinicile à modéliser: c'est ce qui arrive souvent
quand les variables proviennent de deux populations différentes (une discrète et L'autre
continue). Par ailleurs, la modélisation séparée peut être facile parce que la forme que
prend la log-vraisemblance n'est pas facilement manipulable alors que les deux parties
prises séparément le sont plus. Enfin, comme mentionné précédemment, la méthode
en une seule étape nous permet d'estimer les paramètres de la partie tant discrète que
continue à la fois. II n'en demeure pas moins que certains chercheurs argumentent
qu'en raison de cette simultanéité de traitement, une erreur de spécification sur l'une
ou l'autre des deux parties aura des répercussions sur la non convergence de tous les
estimateurs de paramètres alors qu'une erreur sur une des parties lors de l'application
de la méthode en deux étapes est limitée à l'étape en question.
Pour le cas à l'étude, à la première étape, l'application de l'une des techniques
relatives à l'estimation des modèles de choix discrets à la fonction d'utilité indirecte
aléatoire conditionnelle est faite. Dans une deuxième étape, dans le souci de tenir
compte de la simultanéité des deux décisions, on peut aborder le problème de trois
façons différentes:
Via les formes réduites: il s'agit d'estimer le modèle de la partie continue en y in-
corporant les estimations des probabilités de choix obtenues lors de l'estimation
de la partie discrète.
Via les k a b l e s instrumentales: le principe est l'estimation du modéle de la
partie continue en utilisant les estimations des probabilités obtenues lors de
l'estimation de la partie discréte comme instruments pour un certain nombre
des variables.
0 Via la méthode de correction basée sur le biais de sélection: A l'aide des tech-
niques ccnventionnelles pour données continues, on estime les paramètres de
la demande tout en tenant compte d'une correction de type Heckrnan pour le
biais de sélection résultant du fait que la demande est conditionnelle au choix
effectué (Hedunan (1979)).
Notre étude va porter principalement sur cette troisième méthode parce que cette
dernière comporte des difficultés techniques qui ont limité son utilisation jusqu'à
maintenant. Étant donné leur sirnplicit é, les deux autres méthodologies sont celles
qui ont été couramment utilisées dans les applications.
5.1.1 Biais de sélection
Dans I'évaluation de la deuxième étape de l'estimation des modèles économétriques
de choix discrets/continus, nous devons faire ressortir le fait que la demande est con-
ditionnelle au choix effectué. Pour y aniver, nous faisons une extension au cas MNP
des travaux de Heckman (1978) qui avait estimé des modèles continus conditionnés
sur le choix discret dans un cas à deux modalités.
La fonction de demande conditionnelle obtenue comme solution du probleme de
maximisation de la fonction d1utilité(3.3), peut s'écrire comme:
Pour tenir compte du biais de sélection, nous devons faire la régression suivante
(voir annexe A):
où E(q1i) est l'expression du biais de sélection qu'il devient nécessaire de dériver avant
d'entreprendre l'estimation.
Par la loi des espérances itérées, comme rj et sont généralement reliés, nous
pouvons déduire que:
où Ai = {cli) représente l'ensemble des valeurs possibles de qui respectent les
inégalités impliquées par le choix i telles que reprises dans l'équation (5.30). Comme
E (q 10 est une expression en termes des erreurs du modèle de choix <, E(q li) s'exprime
comme une fonction f ({ 2 ) .
Dans leur étude devenue célèbre, sous les hypothèses: 7 - N(0, cr2), 5 w Gumbel m
i.i.d et VI( de moyenne 7 C Rj(,, Dubin et McFadden (1984) obtiennent Le résultat j=l
suivant:
une formule qui exige i'évaluation des E({,Ii) pour toutes les modalités.
L'évaluation des moments d'ordre supérieur de qli requiert le calcul des moments
cond i t io~e l s que nous écrivons pour fins de généralisation comme E[g({,) li] Vj. Selon
la loi postulée pour la variable aléatoire de la partie continue et le type de modèle de
la partie discrète, nous obtiendrons différentes expressions pour les espérances.
La prochaine section est consacrée au calcul des espérances de la forme E [ g ( b ) li],
lorsque et q proviennent d'une distribution normale conjointe.
5.1.2 Moments conditionnels
La pertinence de la dérivation des moments conditionnels pour estimer les modèles
de choix discrets/continus en deux étapes ayant été montrée, nous nous consacrons
dans cette partie du travail, au calcul de ces moments.
Comme mentionné précédemment, tout moment conditionnel peut s'écrire de
façon générale comme E [g(G) li] .
Nous pouvons montrer à l'aide des propriétés des espérances conditionnelles que':
E [ g ( ~ ) I i ] = [P(Z)I-' . / g(<j)f(S)q. (5.28) Cf Ai
Dans le cas qui nous intéresse particulièrement (où i appartient à un ensemble
non ordonné), nous pouvons en déduire quelques résultats intéressants.
Partons du fait que la probabilité que la modalité i soit choisie est donnée par:
Définissons une variable indicatrice 6i(5) égale à (: Posons { E Ai 6 4 9 et g(5) une fonction réelle
si i est la modalité choisie
autrement. arbitraire pouvant prendre les
valeurs &, $ OU 06, Vz, j, si nous nous limitons aux moments d'ordre 2.
Nous avons:
qui donne les moments conditionnels au choix effectué et où P( i ) est la probabilité
de choisir l'alternative i.
De ces expressions, nous aurons tous les moments conditionnels en donnant différentes
valeurs à g(c). Entre autres, avec:
g ( f l = cj , on a E [ej jl& (c) = l] y le premier moment conditionnel;
g (5) = c:, on a E [<; 1 6i (<) = 1) , le deuxième moment conditionnel;
g(Q = CG, on a E [ticj jlbi(O = 11 ,moment croisé conditionnel. - --
=Voir annexe B pour la preuve.
Moments conditionnels pour les modèles à Valeurs Extrêmes Généralisdes
Jefiey Dubin (1985) a dérivé les moments conditionnels pour les modèles faisant
partie de la classe des modèles GEV. Dans cette section, nous regardons sous quelles
hypothèses il les a dérivés et montrons que dans certaines circonstances, même pour
des modèles assez simples impliquant de l'interdépendance entre certaines modalités,
on ne peut pas arriver à des formes facilement rnanipulables2. Pour ce faire, cette sec-
tion ne sert qu'à montrer combien il est difficile de dériver les moments conditionnels
et conforte l'idée de passer B l'usage de simulateurs dans le cas précis du MNP.
Partons de la fonction de distribution à valeurs extrêmes généralisées:
où < . > représente un vecteur.
La distribution marginale de & lorsque les Sj -t oo sauf ci est donnée par:
où a+ = G(0, .. ., 1,0, ...) avec 1 a la place du ième argument. Il s'agit de la fonction
de distribution cumulative de & distribuée GEV avec mode 11 = Ohai, moyenne
E(C) = O(y + ln ai) et variance Var(&) = 9 diagonale et où 7 est la constante
d'Euler.
Soit la fonction d'utilité indirecte Ui = vi+& avec (6, t2! .... c J ) distribué F (&, c2, ..., f J ) .
Les probabilités de choix sont données par:
Sous l'hypothèse de forte séparabilité ( i.e G(y) = G A ( y i ) + uj avec pj = e3 ) ,
Dubin obtient les résultats suivants:
aNotation de Dubin (1985).
V i et où P, est la probabilité de choisir i.
Cas particuliers:
MNL
Dans ce cas. il ne se pose aucun problème car les modalités étant indépendantes,
les moments conditionnels qui en résultent se présentent sous des formes facilement
manipulables.
Sachant que pour le MNL, nous avons
les moments conditionnels deviennent:
NMNL
Considérons le modèle suivant à deux niveaux et trois alternatives. Pour un cas
plus complexe, cela ne fera que renforcer les problèmes que nous allons soulever.
Cette formulation est un exemple où les modalités 1, 2 et 3 correspondent respec-
tivement à bus bleuo auto et bus rouge. Les alternatives 1 (bus bleu) et 3 (bus rouge)
sont interdépendantes alors que celle 2 (auto) est indépendante des deux autres. II
dérive les moments conditionnels lorsque l'alternative i a été choisie. Les résultats
sont les suivants:
Ces résultats simplifiés viennent du fait que G( ..., yil ..., yj , ...) = GA(.-., ~ i , ..-) +Yj
(i.e l'alternative choisie i est indépendante de j ) . Voyons ce qui se passe si l'alternative choisie est indépendante des autres dans la
séparabiiité.
Réécrivons notre modèle à trois alternatives comme
Avec cette configuration,
Dans l'expression ci-haut, les intégrales restantes ne peuvent pas disparaitre.
Considérons maintenant le cas où l'alternative choisie fait partie de celles qui sont
reliées mais que nous cherchons le moment conditionnel de I'une des variables avec
laquelle elle est reliée. Notre modèle peut s'écrire:
Dans ce cas
Dans cette expression vont persister les intégrales qui s'y trouvent d'autant plus
que les modalités 1 et 2 sont interdépendantes.
À la lumière de ce qui précède, nous pouvons voir que les résultats obtenus par
Dubin (1985) sont sujets à l'hypothèse de forte séparabilité. Pour peu que nous
relâchons cette hypothèse, même dans des cas aussi simples que celui à trois modalités,
deux niveaux, si j n'est pas indépendant de i, les intégrales présentes dans les moments
conditionnels persistent, et à plus forte raison dans des cas plus complexes.
Moments conditionnels pour le MNP
Les moments conditionneki dans le cas du MNP se présentent comme suit:
où la probabilité de choisir la modalité i est donnée par:
Le problème apparaît très clairement, ces intégrales rnultidimensionnelles sont
encombrantes e t rien de telie que l'utilisation des simulateurs pour contourner ce
problème.
5.1.3 Approche ii simulateurs
Dans cette partie du travail, nous présentons des simulateurs susceptibles de remplacer
les espérances mathématiques qui nous intéressent. Partons de la fonction d'utilité
aléatoire que nous réécrivons sous forme vectorieile comme
Nous considérons le modèle en déviation par rapport à la modalité choisie et
supposons que le choix correspond à la dernière et obtenons
avec Li,, X,,p et Cn étant des termes en déviation. Cette hypothhe n'est pas re-
strictive car par simples transformations linéaires, nous pouvons avoir le modèle en
déviation par rapport au choix de n'importe quelle autre modalité. À l'aide de la
décomposition de Cholesky pour le terme d'erreur (en = Su,) et en omettant l'indice
n pour simplification, nous pouvons réécrire le modèle comme:
Ceci peut aussi s'écrire comme
La probabilité que la modalité i soit choisie, soit P (5 E A,), est aussi donnée par
avec
Cette probabilité peut être alternativement écrite comme
où le produit est valide à cause de la structure récursive permettant de conditionner
de façon univariée.
Méthode de simulationl: Acceptation et Rejet Accélérée (ARA)
Cette méthode est basée sur les dérivations de Hajivassiliou et McFadden (1994),
reprises par Gouriéroux et Monfort (1996), Hajivassiliou, McFadden et Ruud (1996)
qui nous permet de faire des tirages dans une distribution conditionnelle lorsque les
formules d'inversion simples ne sont pas disponibles.
Les lignes qui suivent sont basées sur le paragraphe 3.3.3 de Gouriéroux et Mon-
fort (1996). En vertu de cette méthode, pour obtenir des tirages d'une distribution
f (u(AI), il de faire des tirages u satisfaisant x 5 a f (u)/g(u), étant donné une
valeur fixe pour a, une distribution non conditionnelle f (u), une distribution g(u)
avec support A; et un tirage x dans la loi uniforme.
Dans le cas qui nous concerne, les deux types de distributions que nous allons
considérer sont:
pour la non conditionnelle et
qui est la fonction de distribution normale tronquée récursive de laquelle les tirages
peuvent être effectués facilement a l'aide du simulateur GHK et où 1 .4; est une variable
indicatrice qui est égale à 1 si u E il; et O autrement. Autrement dit, Al constitue le
support de la distribution g(u) . Les u qui seront retenus devront satisfaire la relation
D'après les expressions de f (u) et g(u) retenues, la relation ci-avant devient3:
0 Ù X = -(j j-i Uj-1 + m.. + rjl ui* Pour un j donné, par la résolution du problème de maximisation de cette dernière
relation, nous allons avoir une expression pour a. En effet
max@(wj - X), X
nous donne X = -00.
3Le lemme 1 dans Hajivassiliou, McFadden et Ruud[25] stipule que sup s f (z)/g(z) 5 a < +a.
m Avec cette valeur de X, aj = @ ( w j - X) = 1, ce qui donne CY = n aj = 1.
j=l
Avec cu = 1, la relation entre les fonctions de densité de probabilité devient:
L
Procédure de simulation
Pour avoir les tirages dans Elc E -.li, nous allons:
1. Faire un tirage conjoint (ut, z t ) avec ut dans la 1 récursive tronqi
et xt dans la loi uniforme U(O,1) jusqu'à ce nous obtenons un tirage tl tel que
xtl < P(utl E 4') (5.31)
est satisfait.
qui sera distribué N ( 0 , C) étant donné que ( E Ai.
Méthode de simulation 2: Acceptation et Rejet Conventionnelle (CAR)
Nous vouions obtenir des tirages de 5 satisfaisant 5 E &. Pour ce faire, nous
procédons d'abord à des tirages de ut dans la loi récursive tronquée g(u). Après
quoi nous revenons à l'espace de départ en caicdant P = Sut en ne retenant que
si celui-ci satisfait la contrainte C E A,. Ces valeurs constituent, évidemment, les
simulations dans Ia distribution de { conditionnelle à E Ai.
Méthode de simulation 3: É~hantillona~e de Gibbs
Cette méthode est basée sur la décomposition de la distribution mdtivariée tronquée
en une suite de distributions multivariées conditionnelles.
Soit f (uI. 212. .... u,) une fonction de distribution multivariée. Cette distribution
multivariée peut être caractérisée par la connaissance des différentes distributions
univariées conditionnelles comme suit: O O Choisir de façon arbitraire (u,, u?, ...: ufB) comme valeurs de départ;
-Tirer u: - f (ul/u& .... u&); -Tirer ui .- f (u21u:, u:, ..., 211); -Tirer ui - f (u31u:, 4, ..., u:);
T T-1 T-L - T i r e r ~ ~ ~ f ( u ~ l u ~ ,u2 ?.... ,î~,-~);
Pour des valeurs de T suffisamment élevés, les tirages sont tels qu'ils proviennent
de la loi conjointe désirée f (ul, u2, . .., h). Dans notre cas, nous sommes intéressés à faire des tirages d a m la loi normale
multivariée tronquée
Les distributions univariées conditionnelles sont données par f qui est la
fonction de distribution de 5, étant donné la connaissance des tous les autres termes
d'erreur ( { - j ) faisant partie de la loi conjointe. Ces dernières sont normalement
distribuées avec moyenne O et variance ozj où
et Cu = I.'ar(&), Zj,-j = C O ~ ( & , < - ~ ) , C-j,- j = V U ~ ( { - ~ ) .
La fonction de distribution conditionnelle est finalement donnée par
Les tirages successifs conditionnels nous donnent directement les 5 distribués con-
ditionneilement à ,Ai,
Calcul des simulateurs des moments conditionnels
Une fois un nombre T de tirages retenus en exploitant l'une des trois méthodes
présentées antérieurement, nous pouvons à l'aide des tt, t = 1,2, . .., T , en déduire
divers calculs relatifs aux moments conditionnels qui nous intéressent. En particulier,
nous estimerons E [<]il par la formule suivante
en notant que
Yous calculerons, par la même occasion les variances conditionnelles simulées
Comparaison des trois méthodes sur base des moments conditionneis simulés
Pour fins de comparaison et de choix de méthode à privilégier lors du calcul des mo-
ments conditionnels, nous allons considérer un cas à trois modalités qui nous servira
de barème. C'est ainsi que nous présentons d'abord la dérivation des moments condi-
tionnels théoriques relatifs à ce cas a trois modalités. Comme le nombre de modalités
est faible, ces moments théoriques peuvent être évalués par intégration numérique.
Moments conditionnels théoriques.
À paztir de notre modèle de départ qui se ramène à deux modalités lonqu'il est
considéré en déviation par rapport à la dernière, nous pouvons écrire
avec
Xotons que
u15o +&-v u2 4 O -+ c2 5 -v.
La loi conjointe des deux termes d'erreur respectant la relation ci-haut peut s'écrire
comme
Yous sommes intéressés par les moments suivants
La moyenne pour (Ellei 5 -V)
proposition 1: La moyenne conditionnelle pour ci est donnée par:
Preuve
La preuve apparaît à l'annexe F.
La variance pour (El IG 5 -V)
proposition 2: La variance pour (<llcl 5 -V) est donnée par: var(61G 5
Preuve
La preuve apparaît à l'annexe F.
L'espérance pour (& 1 El 5 - V, & 5 - V )
proposition 3: La moyenne pour (& /ci < -VI t2 < -V) est donnée par
où
Preuve
La preuve apparait à l'annexe F.
La variance pour (& 1 Fi 5 - V, & $ - V )
proposition 4: La m h c e (52 151 5 - V, t2 < - V ) est donnée par
Où E est l'espérance calculée précédemment,
Preuve
La preuve apparaît à l'annexe F.
Résultats des calculs et comparaisons
Les résultats empiriques présentés dans cette partie du travail ont été obtenus a
partir des trois méthodes de simulation précitées ainsi que de la base théorique prise
comme étalon. Ils ont été faits sur un modèle à trois modalités réduites à deux en
déviation, nous permettant ainsi de comparer la performance des trois méthodes à
savoir celle basée sur l'acceptation et le rejet accélérée (ARA), la méthode d'acceptation
et rejet conventionnelle (CAR) ainsi que l'échantillonnage de Gibbs. Les données sont
simulées à partir du modèle (5.32). La taille de l'échantillon est de 1000 observations.
Différentes structures de corrélation sont considérées:
- Très forte corrélation positive entre les deux termes d'erreur: 0.9;
- Forte corrélation positive entre les deux termes d'erreur: 0.7;
- Faible corrélation positive entre les deux termes d'erreur: 0.2;
- Pas de corrélation entre les deux termes d'erreur: 0.0;
- Faible corrélation négative entre les deux termes d'erreur: -0.2;
- Forte corrélation négative entre les deux termes d'erreur: -0.7.
- Très forte corrélation cégative entre les deux termes d'erreur: -0.9.
Ces structures de corrélation sont combinées à différentes valeurs des vecteurs
V. Le nombre de tirages retenus pour le calcul des moments conditionnels est de
2000. Les résultats regroupés dans les tableaux qui suivent laissent voir clairement
que la méthode CAR est celle qui se rapproche le plus des ceux donnés par ies calculs
théoriques dans toutes les combinaisons de structure de corrélation et des moyennes
possibles. Quant ik méthode &\RA, elle semble bien se comporter pour des struc-
tures de corrélation se rapprochant de l'absence de corrélation et suit de très près la
méthode C.4R. Le Gibbs se retrouve entre les deux premières méthodes en termes de
reproduction des résultats théoriques. LI semble nous donner, par contre, des chiffres
très éloignés des ceux obtenus par les deux autres méthodes et la théorie en ce qui
concerne les variances conditionnelles. Quant au choix à retenir pour les applications,
nous penchons vers la méthode CAR. En &et, celle-ci nous permet d'approcher les
résultats théoriques tant du point de vue moyennes que variances avec un nombre de
tirages minimal. On peut observer que pour des valeurs élevées positives de V , la
méthode A4k4 requiert un nombre exagéré de tirages pour obtenir le nombre requis
de tirages. Dans le cadre des résultats présentés dans les tableaux ci-dessous, il nous
a fallu certains moments 120000 tirages pour avoir les 2000 nous permettant de
calculer les moments conditionnels. Dans les circonstances, même si cette méthode
donne lieu aux mêmes résultats dans certains cas, il semble que la méthode CAR
performe mieux.
Tableau 5.6: Moments conditionnels pour rho = - 0.9
v I Moyennes conditionnelles
ARA 0.00676 0.003 12 -0.01240 -0.01 369 -0.04863 -0.09084 -0.28100 -0.64167
CAR 0.00284 -0.00979 -0.0465 1 -0.12908 -0.27715 -0.49848 -0.78749 -1.13131
Théoriques -0.00444 -0.01764 -0.05525 -0.13879 -0.28760 -0.50916 -0.79788 -1.14108
ARA 0.00668 0.00655 0.01791 0.00908 -0.00616 -0.08057 -0.27531 -0.64107
pour c 2
C,4R GIBBS 0.01048 -0.07029 0.01884 0.00296 0.04083 0.00182 0.07847 -0.00344 O. 11062 -0.02539 0.05894 -0.0397 -0.19982 -0.27322 -0.61180 -0.63926
Variances conditionnelles
Théoriques -0.00444 -0.00177 -0.00566 -0.01495 -0.03544 -0.09040 -0.27788 -0.64237
Tableau 5.7: Moments conditionnels pour rho = - 0.7
Moyennes conditionnelles pour {I
AR4 CAR GIBBS Théoriques 0.00433 0.00284 0.00743 -0.00444 -0.00153 -0.00979 -0.00948 -0.01764 -0.01823 -0.04651 -0.02115 -0.05525 -0.04718 -0.12908 -0.04858 -0.13879 -0.1 1629 -0.27715 -0.10942 -0.28760 -0.23607 -0.49848 -0.24007 -0.50916 -0.48 173 -0.78749 -0.47922 -0.79788 -0.81137 -1.13131 -0.82127 -1.14108 -1.22384 -1.51617 -1.22966 -1.52514
PQW t 2
ARA CAR GIBBS Théoriques 0.01777 0.01934 -0.02890 -0.00133 0.01247 0.02148 0.00833 -0.00532 0.00914 0.02500 -0.00463 -0.01697 -0.00853 0.02231 -0.03382 -0.04484 -0.07446 -0.01 580 -0.09487 -0.10533 -0.21984 -0.14877 -0.22479 -0.23429 -0.46060 -0.41390 -0.46477 -0.47271 -0.81532 -0.78081 -0.80908 -0.8 1540 -1.22418 -1,20457 -1.21978 -1.22480 3
Variances conditionnelles
Tableau 5.8: Moments conditionnels pour rho = - 0.2
Moyennes conditionnelles pour (1
-4RA CAR GIBBS Théoriques 0.00142 0.00284 -0.09727 -0.00444 -0.01001 -0.00979 -0.01248 -0.01764 -0.04206 -0.04651 -0.04432 -0.05525 -0.10307 -0.12908 -0.11699 -0.13879 -0.25226 -0.27715 -0.25102 -0.28760 -0.45256 -0.49848 -0.45894 -0.50916 -0.73219 -0.78749 -0.73931 -0.79788 -1.06330 -1.13131 -1.07994 -1.14108 -1.45986 -1.51611 -1.46545 -1.52514
ARA 0.02690 0.01345 -0.00999 -0.08589 -0.22917 -0.43011 -0.73833 -1.06068 -1.45563
Pour t2 CAR 0.02753 0.01675 -0.01428 -0.09947 -0.21895 -0.42839 -0.71193 -1.05626 -1.44525 L
Variances conditionnelles
GIBBS -0.02052 0.00229 -0.02855 -0.08545 -0.23186 -0.43906 -0.7198 1 -1.06162 -1.44871
Théoriques -0.00355 -0.01418 -0.04492 -0.11539 -0.24697 -0.45291 -0.73216 -1.07244 - 1.458 14
Tableau 5.9: Moments conditionnels pour rho = 0.0
Moyennes conditionnelles - Pour <r
AR4 CAR GIBBS Théoriques 0.00083 0.00284 -0.03193 -0.00444 -0.01016 -0.00979 -0.01371 -0.01764 -0.04835 -0.04651 -0.05231 -0.05525 -0,12842 -0.12908 -0.13796 -0.13879 -0.28263 -0.27715 -0.28940 -0.28760 -0.51838 -0.49848 -0.5 1331 -0.50916 -0.80847 -0.78749 -0.80368 -0.79788 -1.13003 -1.13131 -1.14776 -1.14108 -1.52782 -1.51617 -1.53211 -1.52514
- - -
pour c 2
CAR GIBBS Théoriques 0.02844 -0.02259 -0.00444 0.01468 -0.00085 -0.01764 -0.02425 -0.03858 -0.05525 -0.11027 -0.12233 -0.13879 -0.26251 -0.37170 -0.28760 -0.48783 -0.49430 -0.50916 -0.78009 -0.78439 -0.79788 -1.12629 -1.12904 -1.14108 -1.51227 -1.51447 -1.52514
Variances conditionnelles
Tableau 5.10: Moments conditionnels pour rho = 0.2
Moyennes conditionnelles pour J 1
ARA CAR GIBBS Théoriques 0.00036 0.00284 0.03371 -0.00444 -0.01168 -0.00979 -0.01026 -0.01764 -0.05488 -0.04651 -0.05501 -0.05525 -0.14339 -0.12908 -0.15165 -0.13879 -0.30891 -0.27715 -0.31668 -0.28760 -0.35875 -0.49848 -0.55294 -0.50916 -0.84998 -0.78749 -0.85181 -0.79788 -1.20257 -1.13131 -1.20014 -1.14108 -1.57801 -1.51617 -1.58541 -1.52514
- - -
pour (2
ARA CAR GIBBS Théoriques 0.02654 0.02849 -0.01803 -0.00529 0.01086 0.01307 -0.00337 -0.02086 -0.02765 -0.03021 -0.04723 -0.06431 -0.12070 -0.12461 -0.14124 -0.15803 -0.30228 -0.28822 -0.30305 -0.31942 -0.54204 -0.52468 -0.53678 -0.5Z234 -0.84422 -0.82510 -0.83429 -0.84867 -1.18419 -1,17565 -1.18231 -1.19534 -1.57518 -1.56330 -1.56798 -1.57969
"
Variances condi t iomelles Pour €1
Tableau 5.11: Moments conditionnels pour rho = 0.7
Moyennes condit ionneiles Pour <r
.4RA CAR GIBBS Théoriques 0.00312 0.00284 -0.03561 -0.00444 -0.01509 -0.00979 0.01776 -0.01764 -0.06322 -0.04651 -0.03585 -0.0.5525 -0.16725 -0.12908 -0.14567 -0.13879 -0.35029 -0.27715 -0.32742 -0.28760 -0.60672 -0.49848 -0.58107 -0.50916 -0.90718 -0.78749 -0.89464 -0.79788 -1.26719 -1.13131 -1.25389 -1.14108 -1.64445 -1.51617 -1.64668 -1.52514
pair <2
AM CAR GIBBS Théoriques
Variances condit ionneIles Pour €9
Tableau 5.12: Moments conditionnels pour rho = 0.9
Moyennes conditionnelles
pour (1
ARA CAR GIBBS Théoriques 0.003 12 0.00284 -0.03437 -0.00444 -0.01378 -0.00979 0.00668 -0.01764 -0.06252 -0.0465 1 -0.04554 -0.05525 -0.15479 -0.lS908 -0.14904 -0.13879 -0.33084 -0.27715 -0.31947 -0.28760 -0.58281 -0.49848 -0.55941 -0.50916 -0.88418 -0.78749 -0.86376 -0.79788 -1.24497 -1.13131 -1.21989 -1.14108 -1.63924 -1.51617 -1.61363 -1.52514
pour <2
CAR GIBBS Théoriques
Variances conditionnelles 1
Calcul du biais de sélection
Le problème de départ est de trouver une expressioii pour calculer E [(qli)] en se
rappelant que
E(qli) = Ef! j [E(q![ ) ] .
Pour évaluer cette expression, nous avons besoin des deux composantes E(ql<)
et E [<li] où [ est le terme d'erreur de la partie discrète et 7 le terme d'erreur de la
partie continue. La dérivation de E [clil vient de faire l'objet de la partie précédente
et il nous faut faire des hypothèses sur E(v1C) en tenant compte des distributions de
chacun des termes d'erreur qui la composent.
Soit
11 peut être démontré que
Dans notre cas,
Avec cette distribution, nous avons
ce qui implique qu'un simulateur naturel pour E(gli) est
qui est l'expression pour le biais de sélection et oh mi] peut être calculé tel que
décrit précédemment.
De façon générale E(vk 12) = Etji[E(7/C 1[)] où d est le kième moment. En effet,
partant du fait que E(q2 12) = [P(i)-'] J E ( q 2 / [ ) f (<)g = EFli[E($ l ~ ) ] > ~ O U Ç CO^- tE-4,
statons bien qu'il est nécessaire de calculer E(q2 l<) pour obtenir le deuxième moment
conditionnel. Ce dernier nous aidera dans le calcul de la matrice de variance covari-
ance basée sur la simulation étant donné la méthode en deux étapes. Nous allons
présenter sa dérivation dans les lignes qui suivent.
Pour 7 et < distribués comme précédemment, nous avons
ce qui nous donne le simulateur suivant
avec
5.1.4 Matrice de variance covariance basée sur la simulation
étant donné la méthode en deux étapes.
Pour aborder la problématique du calcul de la bonne matrice de variance covariance
compte tenu du fait que I'estimation est produite par une méthode en deux étapes,
nous allons nous inspirer largement des travaux de Heckrnan (1976): Amemiya (1978)
et Mwphy e t Topel (1985). La modélisation en deux étapes vient entre autres du fait
que l'estimation conjointe dans un cadre du maximum de vraisemblance B information
complète, dans plusieurs situations, est très complexe et très coûteuse en termes
de calcul. Si la formulation du problème en deux étapes permet de remédier aux
difEcultés signalées, il n'en demeure pas moins qu'elle nécessite certains ajustements
comme la correction de la matrice de variance covariance pour une bonne applicabilité.
Pour comprendre l'intuition derrière cette démarche, considérons un problème en
deux étapes dont:
- La première étape consiste en l'estimation d'un modèle auxilliaire (modèle de
chok discret dans notre cas). Cette étape conduit à des estimations des paramètres
réunis dans un vecteur 8 et une matrice de variance covariance asymptotique ~ ( 8 ) . - La deuxième étape consiste en l'estimation du modele d'intérêt qui est la finalité
du problème (la demande d'électricité dans notre cas) conditionnelle à la réalisation de
la première étape. Ce conditionnement donne lieu a une formulation dans la deuxième
étape qui incorpore des régresseurs non observables. Ceux-ci seront remplacés par
leurs estimations obtenues à la première étape, entrainant par la même occasion des
erreurs standards de la deuxième étape ératiques.
Heckman (1976), .4memiya (1978) préconisent une correction à la matrice de
variance covariance asymptotique ainsi obtenue à la deuxième étape dans un cadre
où la première étape consiste en un probit dichotomique ou un tobit. Dans cette
partie du travail, nous dérivons les expressions pour ia matrice de variance covariance
dans un cadre où la premihre étape fait état de l'estimation d'un probit polytomique
et dont les élements sont basés sur la simulation.
Les deux étapes que nous considérons se présentent comme suit:
- Étape 1: un problème de choix discret dont la résolution donne lieu à un vecteur
des paramètres et une matrice de Mnance covariance v(@, tous deux convergents.
- Étape 2: l'estimation de la fonction de régression
Pour tenir compte du biais de sélection, à l'instar de Heckman e t Amerniya,
réécrivons le modèle comme suit:
où E(gnli) est l'expression pour le biais de sélection.
Posons
E(vnl4 = F(0' Xi)?
avec O: vecteur des paramètres de la partie discrbte.
XI: vecteur des variables exogènes de la partie discrète.
Le modèle que nous allons considérer pour estimation s'écrit donc comme:
qui est un modèie hétéroscédastique avec E(e,li) = O et Vaî.(enli) = E($ii) -
N % l i ) ) * . Pour l'estimation, nous allons remplacer B par ê dans (5.33) et nous obtenons
avec
Posons
6 = ( r ) . Nous pouvons réécrire le modèle sous forme matricielle comme
L'estimateur des moindres carrés ordinaires (MCO) pour b est donné par
Sachant que ë = e - F(& XXi)7 + F(9, X i )7 , nous avons
Faisons une expansion de Taylor de ~ ( 8 , Xi)y autour de 8. Pour cela, nous trans-
formons cette dernière expression en
avec vec(F) défini comme suit : si la matrice F a J colonnes 9, C2, ..., CJ, vec(F) =
(CI, Ci, ..., Ci)'. L'expansion de Taylor nous donne alors
~ ( ê , XI) = (-,' O In) - v e c ( F ) + (y' 8 In) avec(F(e9 X1)) (8 - 8 ) + . . . (5.35) a01
~ ( 8 , XI) = F(0, XI)? + (y 8 I , ) F ' $ - O ) + ûuec(F 8,X1 où Fê = , ) L l p En mettant (5.35) dans (5.34), nous avons
La matrice de variance covariance asymptotique est donnée par
(*+@1n)~dê-8)] = ~ [ [ e - ( T ' B I , ) F ~ B - O ) ] [e - ( 7 1 8 i , ) ~ â ( ê - 6 ) ] i }
= E { [ e - ( f @ ~ n ) ~ ; ( ê - O ) ] [ e l - ( B - O)'F'r I,)])
Xo tons que E (e (ê - 0) ' ) = E ( (8 - O ) el) = O. En effet, avec
que nous pouvons réécrire comme
avec W, = [W - (y'@ I , )F&~- O ) ] . Pour appliquer les MCO, nous devons avoir
E(W, e) = O. Ce qui donne E [(w - (./ 8 I , ) F ~ ( ~ - 0 ) ) e] = O. Nous avons bien
E (W e) = 0: ce qui fait que E [((-{ 8 1,) Fê - (8 - O ) ) e] doit être égal à zéro.
Autrement dit les termes e et (y' @ I , ) F ~ ( ~ - 0) ne doivent pas être corrélés, si nous
voulons avoir un estimateur convergent pour 6.
La matrice de variance covariance asymptotique devient donc
avec
Var(e1i) = diag (~(2li)) - diag { (E(% ~ i ) ) ~ )
qui sont des éléments simulés et var(#) qui est la matrice de variance covariance
asymptotique de la première étape laquelle est aussi affectée par la simulation. Elle
se présente sous la forme suivante:
qui est la matrice d'information . La première composante est la matrice de variance
covariance conventionnelle et la deuxième est le bruit provenant de la simulation qui
tend vers O Lorsque le nombre de rirages T devient important.
Cette matrice de variance comriance asymptotique corrigée pour notre modèle en
deux étapes nous permet d'éviter la sous estimation des écarts types dans le cas où
nous ne nous en préoccupons pas.
Il apparaît très clairement que l'estimation de la matrice de variance covariance
est très différente de celles dérivées dans les travaux précités en ce sens qu'elle est faite
via la simulation étant donné que les fonctions objectives nécessaires à son évaluation
contiennent des formes qui ne sont pas facilement manipulables.
5.1.5 Évaluation empirique de 19estimat ion en deux étapes
s u r données simulées
Dans cette partie du travail nous estimons, sur données simulées, un modèle éconornétrique
de choix discrets/continus avec choix interdépendants.
Spécification de la partie discrète
Pour simplifier la démarche, nous prenons un modèle à trois modalités décrit comme
suit:
où Utw : utilité procurée par la modallité i,
V; : partie déterministe du modèle de choix,
(; : terme d'erreur relatif à chacune des modalités. Prenons le modèle en déviation par rapport à la troisième modalité. Celui-ci s'écrit
alors comme:
où
u* = u; - u;, v,=v,.-v;, 6 = <; - avec
En supposant que la dernière modalité est celle qui a été choisie par l'individu n,
nous devrions avoir:
ou bien
Cette dernière relation définit les inégalités qui doivent être satisfaites par les
termes d'erreur Et dans le simulateur: m
où 5' est un vecteur des composantes Kf lit li] du modèle de l'utilité en (5.37) sat-
isfaisant les inégalités dans (5.38) impliquées par le choix observé pour le ménage n.
Dans le cas où la dernière modalité ne correspond pas à celle choisie, nous devons
effectuer une transformation de variables pour avoir des moments conditionnels com-
patibles avec la spécification du modèle de choix qui est en déviation par rapport à
la dernière modalité. Deux situations peuvent se présenter lors de l'évaluation des
moments conditionnels d'intérêt:
1. Si le choix effectué est la dernière modalité pour l'individu n, aucune transfor-
mation n'est nécessaire.
2. Si le choix de l'individu ne correspond pas à la dernière modalité, une simple
transformation peut être faite pour obtenir les valeurs de CL et & compatibles
avec le choix observé. Par exemple, si le choix observé est la modalité 2, nous
savons que:
Dans ce cas, les valeurs des ci peuvent être retrouvées à partir de:
Spécification de la partie continue
La partie continue de notre modèle est décrite par l'équation de demande suivante
QI : une fonction des variables exogènes; où
E (rl, li) : le terme de correction pour le biais de sélection, avec
c22 : matrice de variance covariance des termes d'erreur de la partie discrète,
: vecteur (1 x 2) des covariances entre les termes d'erreur de la p m i e discrète Cz r
et celle continue. L'équation (5.39) peut s'écrire
avec E((li) un vecteur (2 x 1) des moyennes conditionnelles au choix effectué. E(cli)
étant simulé, nous pouvons réécrire la demande comme:
Sous forme vectorielle, le modèle se présente comme suit:
d = ~ + & + é ,
- - avec S = E ( ~ / i ) & k
Simulation des données
Les données sont simulées à partir d'une structure de covariance de b forme:
où 012 et o13 sont les covariances entre la partie continue et celle discrète alors que
023 est la covariance entre les deux modalités du choix discret lorsque le modèle est
pris en déviation par rapport a la troisième modalité.
Xotre modèle de choix discret est de la forme
O 1 ~ 2 , n
Xous générons à partir d'une structure de coMnance les données nécessaires pour - estimer notre modèle. Suite à l'estimation de la partie discrète, nous obtenons CG et E@), nous permettant ainsi de spécifier la demande comme suit
Résultats de l'estimation
Nous présentons ci-dessous quelques résultats de l'estimation de notre modèle de choix
discrets/continus sur des données simuEes telles que décrites précédemment. Dans les
lignes qui suivent, nous présentons les résultats des essais d'un modèle trichotornique
nous permettant d'estimer la partie discrète , les espérances conditionnelles qui y sont
reliées ainsi que la partie continue du modèle.
La première étape de ces essais consiste en la génération des données à partir
des différentes structures de corrélation entre les termes d'erreur des deux parties
impliquées dans le modèle. Une estimation est ensuite faite pour la partie discrète
nous donnant ainsi les espérances conditionnelles dont nous avons besoin pour tenir
compte de la simultanéité entre les deux décisions. Par la suite, nous estimons la
partie continue. Nous considérons plusieurs essais (100) avec la même structure de
corrélation et présentons les statistiques descriptives relatives à chaque paramètre de
la partie continue ( moyenne, variance de l'échantillon, écart-type, écart quadratique
moyen, le minimum, le maximum, Les percentiles 25, 50 et 75) ainsi que les tests t
de student (la moyenne sur toutes les répétitions), le ratio de vraisemblance (LR) et
de Fisher (F)'. La taille de l'échantillon est de 1000 observations. Les structures de
covariance considérées vont des deux cas extrêmes où les covariances entre les termes
d'erreur de la partie continue et celle discrète sont nulles , à celui où il y a une très
forte covariance entre les deux parties précitées. Entre les deux, nous présentons tous
les cas intermédiaires considérant des liens plus ou moins faibles.
Les résultats présentés dans les tableaux apparaissant dans les pages suivantes
sont basés sur une structure de corrélation donnée chacun. Des vraies valeurs sont
postulées pour chacun des paramètres présents dans les deux parties du modèle. Le
processus d'estimation est répété 100 fois pour une structure donnée et les statistiques
Tes tests pourraient être raffinés ultérieurement pour servir de tests formeis de spécification du modèie.
présentées portent sur chacun des paramètres.
À la lumière des résultats obtenus p o u les cas présentés, nous observons que
lorsque la structure de corrélation est très faible ou inexistante entre les deux parties
du modèle, l'estimation de la partie continue nous donne des valeurs des covariances
qui ne sont pas significativement différentes de zéro confirmant ainsi le fait qu'il
n'y a pas de lien entre les deux parties. Les tests LR et F confiontent le modèle
contraint où les corrélations sont absentes a celui non contraint où elles sont présentes.
L'hypothèse nulle veut que nl = n2 = O alors que celle alternative fait état de la
présence de conélation. Les résultats de ces tests lorsque nous postulons une structure
sans corrélation entre les deux parties montrent un faible rejet de l'hypothèse nulle
dans certains cas et aucun rejet dans la majorité des cas. Dans le cas où nous
postulons une forte corrélation entre les deux parties, l'estimation de notre modèle
de la demande donne lieu à des estimateurs des covariances qui sont significatifs
confirmant ainsi le fait que les deux parties sont reliées. Les tests rejettent l'hypothèse
nulle dans la totalité des cas considérés. Les cas les plus intéressants surviennent
lorsqu'il y une forte corrélation entre le terme d'erreur de la partie continue et un
seul des deux termes de la partie discrète l'autre accusant d'une faible corrélation.
Il en résulte, en effet, des estimateurs qui sont significatifs pour les deux termes de
covariance même si l'un des deux est faiblement relié a la partie discrète. Cela peut
trouver son explication dans le fait que les deux parties du modèle étant reliées font
que même si le terme d'erreur est faiblement relié à un des termes d'erreur de la
partie discrète, le lien via l'autre terme d'erreur renforce indirectement la covariance
observée. Quant aux cas intermédiaires, ils laissent voir une diminution du degré de
signification lorsqu'on part des fortes corrélations vers les plus faibles. Ces résultats
montrent que les espérances conditiomelles que nous évaluons reproduisent bel et bien
les faits observés tels que décrits par le modèle a l'étude: une forte corrélation fait
ressortir des estimateurs sigdcatifk alors qu'une faible conélation nous en montre
des moins en moins significatifs.
Avec les résultats obtenus au cours de ces études de Monte Carlo, nous utilisons
la procédure développée au cours de cette partie du travail pour faire une évaluation
empirique de la demande d'électricité des ménages québécois conditionnelle au choix
d'un mode de chadage parmi neuf possibilités de chauffage de l'eau et des locaux.
EXPÉRIENCE #1: Choix discrets fortement interdépendants et
demande non corrélée avec les choix
Structure de covariance
1.00 0.00 0.00
0.00 1.00 2.00
0.00 2.00 4.79
Structure de corrélation
Vraies -leurs: CI = 1, 8 = 1, K I = O, K.* = 0.
Résultats
Statistiques et tests
moyenne ect stat-t eqrn var.e. min. max. 25 perc. 50 perc. 75 perc.
Q 1.07 0.03 33.40 0.01 0.03 1.02 1.14 1.05 1.08 1.10
8 1.00 0.04 27.37 0.00 0.03 0.92 1.07 0.97 1 .O0 1.03
-0.02 0.07 -0.26 0.01 0.07 -0.21 0.14 -0.06 -0.02 0.04
~2 -0.04 0.13 -0.30 0.02 0.14 -0.41 0.25 -0.13 -0.04 0.06
Nombre de rejets par le test LR: 1.00
Nombre de rejets par le test F: 1.00
103
EXPÉRIENCE #2:Choix discrets fortement interdépendants et demande
fortement corrélée avec les choix
Structure de covariance
Structure de corrélation
Vraies valeurs: cr = 1, 0 = 1, = 0.235, n . ~ = 0.353.
Résultats
Statistiques et tests
moyenne ect stat-t eqm var.e. min. max. 25 perc. 50 perc. 73 perc.
a 1.02 0.01 138.08 0.00 0.01 1.01 1.04 1.01 1.02 1 .O3
0 1.00 0.01 121.82 0.00 0.01 0.98 1.03 0.99 1.00 1 .O0
KI 0.19 0.02 11.48 0.00 0.02 0.17 0.24 0.18 O. 19 0.20
~2 0.30 0.02 12.47 0.00 0.04 0.21 0.39 0.27 0.30 0.32
Nombre de rejets par le test LR: 100.00
Xombre de rejets par le test F: 100.00
EXPÉRIENCE #3:Choiu discrets fortement interdépendants et demande
moyennement corrélée avec les choix
Structure de covariance
Structure de corrélat ion
Vraies va1eurs:ûr = 1, 0 = 1, q = 0.44, Q, = 1.47.
Résultats
Statistiques et tests
moyenne ect stat-t eqm var.e. min. max. 25 perc. 50 perc. 75 perc.
1 Nombre de rejets par le test LR 100.00
1 Nombre de rejets par le test F: 100.00 1
EXPÉRZENCE #4:Choix discrets fortement interdépendants et demande
faiblement corrélée avec les choix
Structure de covariance
0.962 0.192 0.962
0.192 1.000 2.120
0.962 2.120 5.560
Structure de corrélation
Vraies valeurs: (Y = 1. 0 = 1, q = 0.192. ~2 = 0.962.
Résultats
Statistiques et tests --
moyenne ect stat-t eqm var.e. min. max. 25 perc. 50 perc. 75 perc.
ct 1.09 0.03 34.73 0.01 0.03 1.03 1.16 1.06 1.09 1.11
0 1.00 0.03 29.25 0.00 0.03 0.93 1.08 0.97 1 .O0 1.01
KI 0.29 0.06 4.82 0.02 0.08 0.06 0.47 0.24 0.29 0.34
K* 1.289 0.13 6.91 0.02 0.14 0.60 1.26 0.78 0.88 0.97
Nombre de rejets par le test LR: 20.00
Nombre de rejets par le test F: 16.00
EXPÉRIENCE #5:Chobc discrets faiblement interdépendants et
demande faiblement corrélée avec les choix
Structure de covariance
0.200 0.400 0.020
0.400 1.000 0.040
0.020 0.040 0.159
Structure de corrélation
Vraies valeurs: cu = 1, 8 = 1, K I = 0.40, = 0.02.
Résultats
I Statistiques et tests I moyenne ect stat-t eqm var.e. min. max. 25 perc. 50 perc. 75 perc.
a 1.03 0.01 76.87 0.00 0.01 1.00 1.07 1.02 1.04 1 .O4
e 1-00 0.02 65.35 0.00 0.01 0.96 1.03 0.99 1.00 1.01
K I 0.29 0.03 9.27 0.01 0.03 0.23 0.38 0.28 0.29 0.31
KQ 0.02 0.01 1.78 0.00 0.04 -0.08 0.12 0.00 0.02 0.05
Nombre de rejets par le test LR: 93.00
Nombre de rejets par le test F: 89.00
5.2 Évaluation empirique: Estimation en deux étapes
d'un modèle discret/continu de la demande
d'électricité dans le secteur résidentiel des québécois.
5.2.1 Introduction
Depuis la contribution de Dubin et McFadden (1984)' la demande d'électricité est
explicitement considérée comme le résultat d'une décision conjointe sur le choix des
appareils ménagers en fonction de la forme d'énergie utilisée pour leur fonctionnement
et la consommation d'électricité qui en découle. En s'inspirant de la littérature qui
r raitait du problème d'autosélection, ils considèrent que toute modélisation qui ignor-
erait le fait que les deux décisions sont interdépendantes conduirait A des estimateurs
non convergents, ce qui decterait la qualité des estimations des élasticités prix et
revenu. Dans leur travail, le choix entre les appareils était modélisé à l'aide d'une
approche logi t poiytomique (MNL) . L'estimation du modèle discret/continu a été ef-
fectuée en deux étapes et une correction de type Heckman fut développée pour le
contexte logit polytornique. BBB (1996) ont fait une extension de l'approche de Du-
bin et McFadden en permettant une structure peu restrictive lors de la modélisation
de la partie discrète à l'aide d'une formulation MNP. Le MNP est réputé être la
formule recommandée lorsque les alternatives sont interdépendantes entre elles.
Dans BBB (1996), parmi les neuf modes de chauffage de l'eau et des locaux con-
sidérés, admettre la présence d'interdépendances entre les modalités semblait justifié
et le processus d'estimation devait en tenir compte sous peine de donner lieu à des
estimateurs non convergents. La présence des interdépendances entre les modalités a
été introduite dans le modèle via la structure de corrélation de termes d'erreur nor-
malement distribués. Pour I'estimation, une méthode en deux étapes était utilisée. La
dimension discrète était modélisée à l'aide du maximum de vraisemblance simulée avec
des probabilités de choix probit remplacées par des simulateurs efficients. La deuxième
étape exploitait une régression instrumentale linéaire de façon à tenir compte de la
sirnult anéité entre les d e u décisions.
La contribution de cette partie du travail est de reconsidérer le modèle formulé
dans BBB (1996) à l'aide d'une approche en deux étapes où la deuxième concerne
l'estimation de la demande d'électricité par les MC0 en introduisant un terme de
correction pour le biais de sélection exprimé en terme d'espérances conditionnelles.
Cette dernière méthode fut précédemment laissée de côté en faveur de méthodes plus
ad-hoc, telles que les méthodes à formes réduites ou à variables instrumentales, à
cause des difficultés techniques résultants de son application Lorsque les choix discrets
sont interdépendants. La difficulté principale lors de l'estimation des modèles avec
choix interdépendants origine de la présence d'intégrales normales multidimension-
nelles qui se retrouvent non seulement dans la log-vraisemblance via les probabilités
de choix? mais aussi dans les expressions du biais de sélection via les moments con-
ditionnels. De plus, la partie discrète de notre modèle fait usage d'une formulation
M'IP conventionnelle contrairement à celui dans BBB qui considérait une formulation
MNP hybride à noyau logistique. Par ailleurs, à la différence de Dubin et YcFad-
den qui avaient, dans les mêmes circonstances, une expression du biais de sélection
fort bien manipulable, nous allons faire usage de récentes techniques de simulation
pour dériver le terme de correction pour la sélectivité lequel comporte des intégrales
multidimensionnelles. Les formes fonctionnelles ainsi que la spécification du modéle
suivent de très près l'étude de Dubin et McFadden. En effet, les fonctions de demande
conditionnelles d'électricité sont linéaires dans les prix et proviennent de l'application
des identités de Roy à une fonction d'utilité indirecte non linéaire bien spécifique.
Nous appliquons cette formulation pour modéliser la demande d'électricité dans le
secteur résidentiel québécois en prenant en compte le système de chauffage de l'eau
et des locaux utilisé.
Dans la province de Québec, il existe une vaste gamme de sources d'énergie pour
le chauffage de l'eau et des locaux. En 1989, 64% des ménages utilisaient l'électricité
pour le chauffage des locaux, dors que 16% utilisaient le mazout, 7% le gaz na-
turel, 6% la bi-énergie (électricitéfmazout ou électricité/bois). et 6% d'autres sources
(principalement le bois). L'électricité, le gaz naturel et le mazout sont aussi utilisés
dans le chadage de l'eau. Durant les vingt dernières années, le Québec a observé le
délaissement du mazout en faveur de l'électricité. La popularité de l'électricité a été
acquise aux dépens exclusivement du mazout alors que les autres sources d'énergie
ont gardé les mêmes parts. Il y a aussi une utilisation importante de la bi-énergie:
électricité/rnazout ou électricitéJbois. Considérant la part imposante de l'électricité
dans le chauffage de l'eau et des locaux, il apparak important d'analyser si les
phénomènes observés peuvent être expliqués en termes des variables économiques
de base comme les prix relatifs, le revenu et les caractéristiques des ménages.
Dans la section suivante, nous présentons un modèle de la demande d'électricité
qui découle du choix des appareils de chauffage en tenant compte de la forme d'énergie
qu'ils utilisent pour leur fonctionnement. Par la suite, le modèle économétrique re-
latif au système discret/continu est dérivé. L'analyse empirique proprement dite, en
particulier les estimations des élasticités prix et revenu de court et long terme sont
obtenues à l'aide de l'approche en deux étapes spécifiée ci-dessus. Les résultats de
l'estimation provenant de l'approche à correction sont comparés a ceux qui découlent
de l'application des approches ad-hoc.
5.2.2 Le système économétrique discret /continu
Le modèle discret/continu que nous considérons dans notre application part du problème
d'un agent n(n = 1: ...: N ) qui est appelé à prendre une décision sur le cho~u d'un
mode de chauffage de l'eau et des locaux dans un ensemble de choix comportant neuf
modalités ainsi que sur la quantité d'électricité à consommer. Techniquement cela
suppose la description de la réalisation de ( 2 , d) où i représente un mode de chauffage
de l'eau et des locaux donné parmi un ensemble de J, possibilités disponibles et où d
est la demande d'électricité. Étant donné que le choix sur i et la quantité d'électricité
consommée dépendent des mêmes facteurs: il devient important de modéliser les deux
de façon simultanée. Une méthode de vraisemblance A information complète permet
de déterminer A, le vecteur des paramètres du modèle qui maximise la densité jointe
P(i, dl A) associée à (i, d). Soit in la modalité choisie par le ménage n et soit dn
sa demande d'électricité. L'approche du maximum de vraisemblance à information
complbte peut être enectuée en spécifiant une forme pour la fonction de densité jointe:
qui reconnaît le caractère continu de d, (la demande d'électricité) et discret de in.
Le terme H, est un vecteur de variables exogènes alors que X est un vecteur de
paramètres à estimer.
L'aide des propriétés des probabilités coiiditionnelles, nous pouvons écrire la
fonction de densité comme le produit d'une probabilité et d'une fonction de densité
condit ionneNe. Nous obtenons:
P ( k , LI&; A) = P(kIH,; A) g(dnIG, H n ; A), (5.42)
où P(i,IH,; A) est la probabilité de choisir in étant donné H, et g(& lin, H,; A) est la
fonction de densité de la demande d'électricité conditionnelle au mode de chauffage
sélectionné.
Dans le but de maintenir une certaine cohérence entre les décisions sur le choix des
appareils de chauffage en fonction de la forme d'énergie qu'ils utilisent et celle continue
sur la décision de leur usage, nous exploitons une fonction de demande d'électricité
qui découle des identités de Roy appliquées à la fonction d'utilité relative à chaque
mode de chauffage. -4 l'instar de BBB, la fonction d'utilité indirecte décrivant l'utilité
procurée par une modalité i au ménage n est définie en fonction des prix des différentes
sources d'énergie, du revenu et des attributs spécifiques à chaque ménage comme suit:
vin : utilité non observée associée au système z telle que perçue par le ménage n,
Pen : prix de l'électricité,
Pm : prix du gaz naturel,
Pmn : p r k du mazout,
Qn : vecteur des caractéristiques du ménage,
Yn : le revenu du ménage n,
rin : coût total annualisé du cycle de vie du système i (rin = PIOPin + /PICPi,),
P I 0 Pin : coût total annuel d'opération dû a l'utilisation du système i par le ménage n,
PICPin : coût totai annuel du capital relatif à l'utilisation du système i par le ménage n,
P : taux d'escompte considéré, tout comme dans Dubin et McFadden,
comme une fonction linéaire du revenu y.
{in : un terme d'erreur propre au ménage n et à la modalité i.
Dans Dubin et McFadden (1984), les ch sont supposés i.i.d. Gumbel et cela donne
lieu au MNL. Quant à BBB, ils ont exprimé le terme d'erreur Q comme une somme de
deux composantes ci, = t vin où oi est l'écart type spécifique à la ième modalité
et i, = x i . W, ,, €in + Gin avec Ci, - i.i.d.N(O, 1). Ce terme d'erreur est considéré
issu d'un processus autoregréssif généralisé. Les composantes w,,, sont des poids,
p est un coefficient de corrélation et Y, - i.2.d gumbel. Ces hypothèses spécifient
un modèle MNP hybride à noyau logistique. L'avantage de cette spécification est de
produire des probabilités de choix qui prennent la forme d'espérances de probabilités
de choix logistiques conditionnelles5. Dans le présent texte, nous nous plaçons dans
un contexte purement normal pour les termes d'eneur Sin, i = 1, .. ., Jn, ce qui définit
un MIIP conventionnel. Par souci de parcimonie, la structure d'erreur est postulée
comme étant issue d'un processus similaire à celui employé dans BBB.
Appliquant les identités de Roy à la fonction d'utilité indirecte, nous obtenons la
demande conditionnelle d'électricité:
où 9 est un terme d'eneur reflétant les facteurs comme l'hétérogénéité non observée,
les erreurs de mesure et l'ignorance du chercheur. Les formes fonctionnelles pour V,,(.)
et Din(.) sont identiques à celles utilisées dans BBB donnant lieu à des demandes
linéaires dans les prix et le revenu. Dans les lignes qui suivent nous présentons une
discussion plus détaillée concernant chacune des deux dimensions du problème.
5.2.3 Le modèle de choix
.a de tenir compte des interdépendances entre les modalités présentes dans notre
étude, le modèle de choix discret que nous présentons utilise une formulation probit
polytomique. Pour un ménage donné n, n = 1, ..., iV, et une modalité i, i = 1, ..., Jn
où J, est le nombre de modalités dans l'ensembIe de choix Cn, nous pouvons écrire
le modèle comme suit:
( O autrement,
où chin est le c h ~ k observé et Uin est l'utilité que procure l'alternative i telle que
perçue par le ménage n et telle que définie a l'équation(5.43). Comme le laisse voir
la notation, nous supposons que chaque ménage a un ensemble de choix qui lui est
S~ou r plus de dét& consulter BBB (1996).
spécifique. Cela nous permet de tenir compte du fait que le gaz naturel n'est pas
disponible dans toutes les régions de la province.
La fonction d'utilité procurée par la modalité i telle que perçue par le ménage n
a pour forme fonctionnelle
Vin = ,Y,$ t (yn - rifil6 i (inin, (5 .44
où ,Y,, est un vecteur des variables exogènes du modèle, P un vecteur de paramètres,
6 un paramètre attaché a la Mnable revenu net du coût d'utilisation du système i.
les autres composantes ayant été définis précédemment.
Notons que <,, = [Sin, ..., Cgn] - N(0, C) où C est la matrice de variance-covariance
décrivant la structure d'interdépendances entre les utilités. Dans le but de réduire le
nombre de paramètres de nuisance constituant la matrice E, nous faisons l'hypothèse
que les 4 proviennent d'un processus autoregréssif généralisé d'ordre 1 (GAR(1)) (voir
Ben-Akiva et Bolduc (1991) et Bolduc (1992). Cette hypothèse a été utilisée dans
BBB (1996) et s'avère très utile car elle réduit de beaucoup les difficultés de calcul
lors de l'estimation du modèle. Par ailleurs, il est connu que certaines restrictions
d'identification devraient être imposées pour que les paramètres de la partie discrète
soient estimables. En règle générale, les pararnktres qui peuvent être estimables sont
ceux présents dans une version du modèle écrite en déviation par rapport à une
alternative donnée. De plus, pour fixer l'échelle, une variance doit fixée à une certaine
valeur. Par convention, nous retenons le modèle en déviation par rapport i la dernière
modalité que nous dénotons c. Le modèle en déviation s'écrit:
où les différentes variables sont en déviation.
Pour estimer les paramètres dans cette dernière équation par la méthode du max-
imum de vraisemblance, nous avons besoin de calculer la probabilité Pn(i) associée à
l'alternative sélectionnée. Prenant la dernière alternative comme référence, un ménage
damé choisira la modalité c si Um < U , Qi, ce qui implique que:
pour tout i, i = 1, ..., 8. Pour évaluer cette probabilité de choixo nous devrions cal-
culer des intégrales normales de dimension 8. Ceci ne peut pas être fait de façon
numérique dans des temps raisonnables. Étant donné ces difficultés, nous suggérons
le remplacement de Pn(i) par le simulateur de Geweke, Hajivassiliou et Keane (GHK)
que nous écrivons comme &z). Ce simulateur peut être calculé comme une moyenne
empirique prise sur T tirages différents des f*c,n:
où &(c) est calculé à l'aide de produits de fonctions de densité cumulatives6.
5.2.4 Le modèle de demande conditionnelle
Étant donné la fonction d'utilité dans l'équation (5.43), nous dérivons la demande
d'électricité à l'aide des identités de Roy. Dénotant la demande d'électricité par ci,, et
considérant ynl ri,, comme exogènes, la fonction de demande a la forme fonctionnelle
suivante:
di = + a e P e n - agPgn + %Pmn + Qin7 + 6(yn r in ) + k. (5.46)
Comme nous I'avans déjà mentionné, la demande et le choix sont corrélés. Cette
hypothèse implique donc que qn est corrélé avec les termes d'erreurs <in. R devient
6Pour plus de détails sut le simulateur se référer, entre autres, à GREENE (1996), pp. 156-157.
donc important et légitime d'introduire ce fait dans le modèle en écrinnt l'équation
de la façon suivante:
où Z*O est un terme spécifique à la partie continue alors que E (% Ii) est la correction
pour le biais de sélection et en a les propriétés habituelles d'un terme d'erreur de
régression. De façon plus compacte, nous écrivons:
5.2.5 Estimation de la partie discrète
La méthode d'estimation retenue pour la partie discrète est basée sur la maximisation
de la log-vraisemblance simulée. Soit X le vecteur des paramètres d'intérêt pour notre
modèle de choix discret. La fonction de vraisemblance pour une observation est
donnée par: ,
Il convient de noter que cette expression ne retiendra que la probabilité associée
choix effectué par le ménage n.
La fonction de vraisemblance va donc s'écrire comme suit:
et la log-vraisemblance
N Jn
L(.) = C 1 c h , ln Pn(IICn).
La version simulée de la log-vraisemblance consiste à remplacer Pn(i(Cn) par un
simulateur de probabilité tel que:
m, où &(il = n Oint. La forme spécifique de &(a') est décrite dans Bolduc (1999). Les
k l
paramètres d'intérêt sont obtenus en maximisant la log-vraisemblance simulée7.
5.2.6 Estimation de la partie continue
Partant de l'équation de la demande conditionnelle d'électricité, nous avons
Nous devons tout d'abord trouver une expression pour le biais de sélection. Sachant
que
E (714 = Etii [E (dc)1 7
et faisant I'hypothèse que
E (012) ne peut être obtenue de façon exacte. Nous utilisons donc un simulateur
"d'acceptation et rejet conventionnel" (CAR) pour l'évaluer. Comme mentionné plus
bas. cette approche a été préférée à d'autres techniques de simulation sur base de nos
expériences Monte Carlo. Pour un ensemble de choix donné de taille J1 nous avons:
C L2 = COV(~, {) = K!: est le vecteur (1 x J ) des covariances entre le terme
d'erreur de la partie continue et chacun des termes d'erreur de la partie discrète,
a CZ2: est la matrice (J x J) de va,riance comriance des erreurs de la partie discrète,
SLes détails sur la programmation et les dérivées andytiques sont fournis dans Bolduc (1999).
rn E (512): est le vecteur ( J x 1) des moyennes des erreurs conditionnelles au choix
effectué à la partie discrhte.
L'espérance E ([ii) se présente sous forme d'intégdes normales multidimension-
nelles, à cause de l'interdépendance entre les modalités. Pour l'évaluer, nous nous
servons d'un simulateur que nous dénotons E mi). En pratique, nous l'évaluons
comme suit:
où nous utilisons le fait que les composantes c;: et E (c/i) sont estimées de façon
convergente lors de la première étape.
Calcul des espérances conditionnelles
Sans entrer daos trop de détails techniques concernant la façon de produire le simu-
lateur de E ({li), il co"ent de noter qu'il est cakulé comme suit:
où tt est un vecteur 5 de composantes [<$ &li] du modèle d'utilité en (5.44)
qui respecte les inégalités en (5.45) découlant du choix observé pour le ménage n.
Dans le calcul de ce simulateur, tout tirage de 5 ne respectant pas les inégalités
en (5.45) est écarté. Ce simulateur est connu pour produire des estimations des
moments sans biais. Xous avons décidé de privilégier la méthode CAR aux dépens
de deux autres approches à savoir la méthode d'"acceptation rejet accéléré" (ARA)
et l'échantillonnage de Gibbs sur la base d'expériences cie Monte Carlo. Les détails
sur ces simulateurs peuvent être obtenus dans Gourieroux et Montfort (1996).
Cas particulier
Si les fi de la partie discrète sont normaux i.i.d., nous avons
Ceci implique que
Dubin et McFadden (1984) ont obtenu une expression similaire basée sur les hy-
pot hèses suivantes:
6 NGEV i.2.d (valeurs extrêmes généralisées) avec E(&) = O
a l'écart type de 77,
a R corrélation entre Si et 7.
Avec ces spécitications, le terme de correction devient:
- E (912) = RP;'E(&~Z) + R2~~1E((21i) + + R,a~~~(<,li).
Comme obtenu dans Dubin (EMS),
alors que
pour tout j # i.
De retour à
deuxième étape
Le terme de correction devient finalement:
notre spécification, le modèle de régression que nous estimons a la
est réécrit comme:
Sous forme matricielle, nous obtenons:
où
d: un vecteur (N x 1) des quantités d'électricité demandées par le ménage n,
0 X/3 e t 2 0 sont des vecteurs (N x 1) tels que définis antérieurement,
0 L6: un vecteur (iV x 1) où L est donné par (y - r), -
g: une matrice ( N x J ) des valeurs estimées telles que 8 =E (cli) z;;' , ( N x J ) ( J x J )
O Z - 1V(O, oz): un vecteur de termes d'erreur,
O avec J = max J,.
Xous allons donc appliquer les MC0 à I'équation ci-haut. Pour fins de com-
paraison, nous reproduirons aussi les résultats des deux autres méthodes à étapes
à savoir celles basées sur les variables instrumentales et les formes réduites utilisées
dans BBB. Pour dériver les deux autres approches, réécrivons la demande d'électricité
conditionnelle de la même manière que dans BBB:
où &,, est une variable indicatrice valant 1 si in = j et O autrement alors que in
est la modalité choisie par le ménage n. L'estimation des paramètres de l'équation
précédente par la méthode à forme réduite consiste à remplacer les 6ijn dans l'équation
précédente par Les estimations des probabilités Fn(i) de choix obtenues à la première
étape. Quant à la méthode à variables instrumentales, nous appliquons les MC0
à l'équation précitée où les 6,, sont remplacés par les valeurs prédites issues de la
et toutes les autres variables exogènes présentes dans Q,.
Matrice de variance covariance corrigée
La formulation du problème en deux étapes permet de remédier aux difficultés associés
à I'utilisation de I'approche du maximum de vraisemblance à information complète.
Mais l'utilisation de la méthode séquentielle nécessite des corrections à la matrice de
variance covariance des paramètres estimés. Les corrections que nous suggérons pour
le cas présent suivent de près l'étude de Murphy et Topel (1985).
Nous pouvons reprendre la demande conditionnelle en (5.48) comme
ou sous forme matricielle
Pour l'estimation de la partie continue, nous remplaçons S($) par s(,$) où $ est le
vecteur des paramètres estimés à la partie discrète. De façon plus compacte, nous
avons:
d = VVn + E,
où W = [X Z L S ] e t T = [P 19 6 n]. L'estirnateur des moindres carrés ordinaires
(MCO) pour T est donné par
ii = (w'w)-' W'd,
alors que la matrice de variance covariance corrigée se présente comme suit:
Var(?) = (w'w)-' W' [ ~ o r ( e l i ) + (n' 8 I,)F liar(4) Fi(I , 8 n)] W (w'w)-' ,
avec
e t
qui est formée d'éléments simulés et var@) qui est la matrice de mriance cornriance
asymptotique de la première étape laquelle est aussi affectée par la simulation. Elle
se présente sous la forme suivante:
avec
qui est la matrice d'information. La première composante est la matrice de variance
covariance conventionnelle et la deuxième est attribuable au bruit provenant de la
simulation qui tend vers O lorsque le nombre de tirages devient important, ce qui est
le cas dans notre travail.
Par ailleurs, pour évaluer Vur(eii), nous avons besoin d'un simulateur pour E(q2 [i) . Dans la pratique, suivant la même procédure que lors du calcul de mi), pour 7 et
5 distribués comme antérieurement, nous avons
avec
suggérant le simulateur suivant
avec
où les termes t? et sont estimés à la deuxième étape.
La matrice de variance covariance asymptotique ainsi comgée nous permet d'éviter
une évaluation érronée des écarts types.
5.2.7 Données et spécification du modèle
Données
Les données utilisées dans la présente étude proviennent d'une enquête postale faite
par HydreQuébec en 1989 sur la consommation d'électricité. Pour l'estimation, nous
avons utilisé la même banque de données que BBB (1996). Le taux de réponse à ce
questionnaire était de 44.9% alors que 46833 ménages ont répondu sur 101977 ques-
tionnaires envoyés. Le souséchantillon sélectionné pour cette étude était composé de
maisons uni-familiales (détachées, semi-détachées ou en rang avec entrées séparées),
qui étaient soit construites ou converties à une autre source d'énergie de chauffage
de locaux durant la période allant de 1986 à 1989. Ceux-ci étaient des restrictions
imposées pour avoir une période où les prix des différentes sources d'énergie étaient
relativement stables après la chute du prix du mazout en 1986 et aussi pour avoir un
échantillon homogène. L'échantillon retenu est composé de 3090 observations.
Le questionnaire comprend outre l'information sur les caractéristiques des ménages,
celle sur les Mnables socio-économiques. L'information sur la consommation a été
obtenue de Hydro-Québec, alors que les données sur les prix utilisés dans le calcul des
coûts d'usage et de capital des systèmes de chauffage de l'eau et des locaux ont ét4
recueillies auprès du gouvernement du Québec (1992). La disponibilité en gaz pour
chacun des ménages ont été déterminées sur base du code postal et de l'information
recueillie auprès de Gaz Métropolitain. Les valeurs et détails sur les calculs des coûts
de capital et d'opération se retrouvent dans Bélanger (1992).
Sp6cification du modèle
Comme mentionné précédemment, pour fins d'identification, une modalité devait être
considérée comme la base et les autres prises en déviation par rapport a elle. Nous con-
sidérons la modalité 7 (électricité/électricité) comme base. Ainsi, tous les effets sont
modélisés relativement à celle-ci. Comme stipulé dans la notation antérieurement,
certaines variables (X,, y,, et rin) apparaissent aussi bien dans la partie discrète
que celle continue, certaines d'autres (2,) dans la partie continue seulement. Cer-
taines wiables étaient exclues de certains groupes spécifiques sur base de statistiques
basées sur le ratio de i~aisembhmes. En ce qui concerne la structure de conélation
des termes d'erreur de notre probit, nous avons utilisé la même spécification que BBB
(1996).
Sans entrer dans les détails sur le processus GAR(l), pour les besoins de notre
étude, il suffit de signaler que ce processus nous a permis de représenter notre stnic-
ture de variance-covariance à l'aide de quelques paramètres supplémentaires. Ces
paramètres sont ol, 0 2 et p. Le paramètre ol est un coefficient d'échelle qui est com-
mun à toutes les alternatives qui ont en commun l'électricité comme source d'énergie
dans l'une des composantes du système, 0 2 est un effet d'échelle relatif auu alterna-
tives qui ont le bois comme une des sources d'énergie. Finalement, le coefficient p
est un paramètre de corrélation capturant les similarités entre les alternatives. Avec
un p positif, les alternatives sont considérées comme similaires alors qu'un p négatif
implique des dissimilarités.
5.2.8 Résultats et interprétations
La lecture des résultats apparaissant dans les tableaux relatifs à chacune des parties
de notre modèle veut que XOM q indique que la variable nom a un effet identique sur
les alternatives x et y. Les effets spécifiques à une seule alternative ont seulement une
valeur simple x. Il faut aussi noter que le mot générique veut dire que la variable est
relative à toutes les alternatives, même celle considérée comme la base. Les résultats
ont été obtenus à l'aide du maximum de vraisemblance simulé via le simulateur GHK
basé sur 100 tirages. Comparativement aux résultats obtenus a l'aide de 50 tirages,
nous observons que seules les estimations qui étaient non significatives changent de
valeur lorsque le nombre de tirages passe de 50 à 100. La valeur de la fonction objec-
tive à convergence est de - 1486.016. Nous présentons l'interprétation des résultats
obtenus.
Le modèle de choix
Les constantes spécifiques à chacune des modalités autres que la septième révèlent que
l'op tion 7 (électricit é/électricité) est préférée à toutes les autres: c'est ce que révèlent
les estimations négatives obtenues pour toutes les autres options étant donné que
le modèle est en déviation par rapport à l'option 7. Par ailleurs, les résultats lais-
sent voir que plus une option a de l'électricité comme source d'énergie, plus elle
sera préférée a u autres en contenant moins. Si l'on considère les options qui parta-
gent le même système de chauffage de l'eau ou des locaux, celle faisant plus appel à
l'électricité est préférée aux autres. C'est le cas de Bi-énergie/électricité (-2.27) qui
est préférée à Bi-énergie/mazout (- 2.93); mazout/électricité ( - 5.18) qui est préférée
à rnazout/mazout(-8.45). Ceci correspond bien aux conclusions de BBB (1996).
Secteur: Les estimations de la densité de la population sont positives? montrant
une préférence marquée de l'option 1 (gazlgaz) et de la bi-énergie par rapport à
l'électricité. Cela peut trouver son explication dans le fait que la distribution du
gaz naturel est principalement développée dans le milieu urbain où la densité de
la population est élevée. Cette mrîable est représentée par des valeurs numériques
augmentant avec la densité de la population (rural:l, peu urbain:2: urbain:3, haute
densité:4). 11 ressort de ces constatations qu'une augmentation de la densité de la
population entraîne une augmentation de la préférence pour l'option gaz/gaz.
Degrés-jours de chauûage: Cette wuiable décrit les effets du temps sur le choix
du système de chauffage. En se rappelant que les systèmes de chauffage électriques
ont des coûts de capital relativement faibles mais des coûts d'opération élevés alors
que les autres systèmes ont des coûts de capital relativement élevés contrairement aux
coûts d'opération, on peut dire que les estimations positives obtenues pour toutes les
mriables de degrésjours de chauffage signifient que plus il fait froid, plus les gens
préferent utiliser les options autres que l'électricité à cause des coûts d'opération
élevés.
Date de conversion et date de construction: Comme stipulé dans la partie
introductive, nous avons observé des changements dans les prix durant la période
à l'étude en faveur des autres formes d'énergie comparativement à l'électricité. De
plus, la disponibilité des certaines sources d'énergie comme le gaz naturel ont pris
de l'ampleur avec le temps. Ceci explique les estimations positives observées pour la
date de conversion et celle de construction. Plus la maison a été convertie à un autre
système récemment ou plus elle a été construite récemment, plus le choix du système
de chauffage est porté sur d'autres sources que l'i%xtricité.
Nombre de personnes: Plus il y a d'individus dans le ménage, pius les gens
préfèrent d'autres options par rapport à l'électricité; c'est ce qu'indiquent les estima-
tions positives obtenues.
Surface: En se rappelant que les autres options nécessitent un coût en capital
relativement plus élevé que l'électricité, si les gens y investissent, c'est qu'ils ont
des grands espaces à c h a d e r et pensent à leurs coûts d'opération. Les estimations
positives obtenues vont dans ce sens: plus la surface est grande, plus on préfère
d'autres systèmes au détriment de l'électricité.
Âge: Plus le soutien de famille est âgé, plus on est porté à choisir le gaz alors que
Les options contenant du bois (options 8 et 9) sont délaissées au profit de l'électricité.
Ceci s'explique par le fait que ces dernières options requièrent des efforts de manipu-
lation qui sont incompatibles avec l'âge.
Revenu: Les estimations négatives montrent que les ménages plus riches préfèrent
utiliser l'électricité comme source de chauffage.
Les coûts: Les variables de coût d'opération et fke ont des estimations négatives
stipulant que les systèmes plus coût eu^ diminuent l'utilité des ménages.
Les estimations obtenues pour les éléments de la structure de covariance des ter-
mes d'erreur de la partie discrète montrent bel et bien que les modalités sont in-
terdépendantes. En particulier, les valeurs de 01 et 0 2 qui représentent les écarts types
spécifiques à chaque alternative, estimations qui sont significatives dans notre modèle.
Combiné à cette manifestation de corrélation est le paramètre de l'autocorrélation
p,qui est aussi significatif, mesurant le degré de dépendance linéaire entre chaque
mode de chauffage et ceux qui lui sont proches. Cette combinaison des termes relatifs
A ia structure de corrélation des termes d'erreur de la partie discrète témoigne bien
de la pertinence du choix du UXP pour modéliser la partie discrète.
La demande d'électricité
Pour mesurer d,,, nous avons utilisé la quantité totale d'électricité en kWh consommée
par un ménage donné. Pour avoir une base comparative, nous fournissons aussi les
résultats de l'estimation de notre modèle de demande obtenus à l'aide de dewc autres
méthodes à savoir celle basée sur les formes réduites et ceile émanant des variables
instrumentales à l'aide de la spécification utilisée dans BBB (1996). A l'examen des
estimations pour les constantes, nous avons constaté que l'utilisation des systèmes
3, 4 et 9, lesquels contiennent essentiellement la bi-énergie, le mazout et le bois
diminue la consommation d'électricité pour le ménage considéré. Par ailleurs, le
prix de l'électricité (Prixel) a différents effets selon l'utilisation qui en est faite: les
consommateurs résidentiels utilisent l'électricité pour chauffer les locaiix (Peleloc) et
pour l'eau (Peleeau). Comme on devrait s'y attendre, l'effet global est négatif, Prive1
ayant la plus grande valeur absolue. Les prix du mazout et du gaz naturel ont un
effet positif sur la consommation d'électricité.
La variable pour la date de construction a un effet négatif insinuant que plus
récente est la date de construction (datcon) de l'habitation, moindre est la consomma-
tion d'électricité. Cela est le résultat des standards d'efficience dans la consommation
d'électricité imposés vers les années 80. Le type de maison (nhabi) (1: détaché, 2:
semi-détaché, 3: rangées de trois ou plus), indique que les habitations détachées con-
somment plus d'électricité. La consommation d'électricité augmente avec le nombre
de personnes (npers) dans l'habitation, la surface (surf) de la maison et l'âge (âge)
du chef de famille. Les gens qui sont propriétaires consomment moins d'électricité
comparativement aux locataires (nprlo). Enfin, plus le gaz est disponible. moins les
gens demandent d'électricité.
Les différentes valeurs obtenues pour les paamètres de la corrélation entre les
termes d'erreur de la partie discrète et ceux de la partie coutinue laissent voir qu'une
seule d'entre huit valeurs possibles est significative. Cet état de choses a en partie
Tableau 5.13: Résultats de l'estimation: Le modèle de choix (T=100)
M G D ~ L E DE CHOIX Variables explicatives Nom Effet Estimations &.type stat-t
Gaz/gaz Gaz/électrici té Bi-énergie/mazout Bi-énergie/électricité Mazout/mazout Mazout /électricité Bois /électricité ois-Électrici télélectricité Secteur
Degrés-jours de chauffage
Date de conversion
Date de construction
cons t 1 const2 const3 const4 const5 const6 const8 constg
sect 1 sec t 23 sec t89 hddml hddm2 hddmS hddm6
hddm89 datconvl datconv3 datconv4 datconv5 datconv6 datconv9 datconl2 datcon3 datconS
datcon89
Tableau 5.14: Résultats de I'estimation(suite): Le modèle de choix iT=100) Variables evplicatives Nom Effet Estimations Ec.type stat-t Nombre de personnes nbpersl 1 -0.478 O . -3.18
Surface
Age
Revenu
PIOP PICP
nbpers2 nbpers3 nbpers5 nbpers6 nbpers8 suxf4 surf56 surf89 age 1 age4 age89 rev2 rev3 rev4 rev56 rev8 rev9 coutm coutfk
2 3 5 6 8 4
5 et 6 8 et 9
I 4
8 et 9 2 3 4
5 et 6 8 9
générique générique
PICP x Y coutfiy générique O 3 3 0.12 4.41 STRUCTURE DE COVARIANCE DU TERME D'ERREUR
trouvé une explication lors de la conduite d'expériences Monte Car10 et le résultat
obtenu était que si les deux parties du modèle étaient reliées, les estimations obtenues
devraient être significatives. Dans le cadre de cette étude empirique, nous pouvons
expliquer le fait qu'un seul des éléments des covariances entre les deux parties soit
simcatif p u le fait que la structure de la partie discrète repose sur une formulation
destinée à capturer les similitudes entre les modes de chadage en blocs et non de
façon généralisée.
5.2.9 Élasticités prix et revenu
Le tableau à la page suivante résume les élasticités prix et revenu relatives à notre
modèle. Les valeurs sont calculées aux moyennes échantillonales. Les valeurs obtenues
sont différentes de celles qu'on retrouve dans BBB (1996).
Pour obtenir ces élasticités, nous avons utilisé l'équation de demande non condi-
t ionnelle:
E ( 4 = E(x/i)P,, (5 . 50) j
où E ( z / j ) est la demande d'électricité conditionnelle au choix de la modalité j dans
la demande totale. Avec ces résultats, nous pouvons écrire l'élasticité de E ( x ) par
rapport à p comme:
où iuj est la p a n des demandes conditionnelles à la modalité j .
5.2.10 Conclusion
La motivation de notre travail est de développer une technique d'estimation en deux
étapes des modèles économétriques de choix discret/continu dans le cas où les cho~u
discrets sont interdépendants. ?Tous utilisons les récentes techniques de simulation
pour évaluer les moments conditionnels qui entrent dans la formulation du biais de
sélection résultant de la simultanéité des décisiors discrètes et continues. En guise
d'application, nous appliquons la technique à l'évaluation de la demande d'électricité
conditionnelle au choix d'un mode de chauffage de l'eau et des locaux dans les ménages
québécois. Les estimations des élasticités ont les signes corrects et sont. pour la
pluparto conformes à nos attentes.
Tableau 5.15: Résultats de l'estimation: La demande conditi,onnelle d'électricité DEMANDE D'ELECTRICITE
MC0 MCOC FR VT Parms Estimations stat-t Estimations stat-t Estimations stat-t Estimations stat-t
7 1 2 3 4 5 6 8 9 prixel secteur datconv nhabi dat con npiec nbpers nprlo surf âge revnetc remet Picpc P~CP gasava Pelelo c Peleeau Primaz Prigaz S A 7 S37 S37 SA7 S-57 5-67 S N S37
hEOC: MC0 avec correction FR : Formes réduites VI: Variables instrumentales Parms: Paramètres
NOTE TO USERS
The original manuscript received by UMI contains pages with indistinct print. Pages were
microfilmed as received.
This reproduction is the best copy available.
UMI
Tableau 5.16: Élasticités prku et revenu
de l'électricité du mazout Options M C 0 GCOC FR VI MC0 MCOC FR VI
Gm/gaz - 11.4096 Gaz/électricité -10.6304 Bi-énergie/mazout - 1.3808 Bi-énergie/électricité -0.8656 Mazout /mazout -12.6084 Mazout /électricité -6.3386 Électricité/électricité -0.9323 Bois /électricité -7.4649 Bois-électricité/électricité - 1 .Xi 74
Moyenne -5.8764 -1.4774 -0.603 -0.674 0.1512 0.2032 0.042 0.01 Élasticité de long terme -1.2859 -2.0762 -0.053 -0.066 0.0990 0.1325 0.030 0.0:
du gaz revenu
Gaz/électricité Bi-énergie/mazout Bi-énergie/électricité Mazout/mazout Mazout/électricité Électricité/électricité Bois/élect ricité Bois-éiectricité/élect ricité
Moyenne 0.1015 0.0957 0.077 0.077 0.1328 0.1314 0.109 0.13' Élasticité de long terme 0.071 l 0.0671 0.057 0.057 0.0901 0.0892 0.076 0.09
MCOC: M C 0 avec correction. FR : Formes réduites VI: Variables instrumentales
Chapitre 6
Conclusions
Dans cette thèse, nous nous sommes intéressés à l'élaboration des techniques rel-
atives à l'estimation de façon efficiente des modèles économétriques de chok dis-
crets/continus lorsque les choix discrets sont interdépendants. Yous avons abordé
l'estimation dans le cadre des deux méthodes principalement utilisées à savoir celle
du maximum de vraisemblance à information complète qui consiste a estimer Ies
paramètres du modèle en une seule étape et celle du maximum de vraisemblance
à information limitée qui consiste à estimer le modèle en deux étapes. La princi-
pale difnculté associée à l'estimation de ce genre de modèles est liée à la présence
d'intégrales multidimensionnelles apparaissant non seulement dans la fonction de log-
vraisemblance via les probabilités de choix mais aussi dans les expressions du biais de
sélection sous forme de moments conditionnels. La contribution de ce travail est de
dériver un cadre permettant en un premier temps I'estimatisn des tels modèles en une
seule étape à l'aide des techniques de simulation des probabilités. Dans un deituième
temps, nous dérivons, dans le cadre de l'estimation en deux étapes. les expressions des
moments conditionnels lorsque les choix discrets sont interdépendants et cela grâce à
l'utilisation des récentes techniques de simulation des moments conditionnels. Nous
terminons chacune des parties de notre travail par une évaluation empirique de la
demande d'électricité par les ménages québécois étant donné le choix effectué parmi
un ensemble de modes de chauffage de l'eau et des locaux. Les résultats empiriques
obtenus sont conformes à nos attentes, en particulier en ce qui concerne les élasticités
prix et revenu.
Il convient de noter que lors de l'évaluation empirique de la demande d'électricité
conditionnelle au mode de chauffage de l'eau et des locaux pour les ménages québécois'
nous avons utilisé différentes bases à savoir Gaz/Gaz pour le FIML et Électricité
/Électricité pour le LIML. Il aurait été intéressant de considérer la même base pour
les deux cas afin de faciliter la comparaison même si les conclusions émanant de ceux-
ci sont indépendantes de la base choisie. Yous avons choisi de le faire en deus bases
différentes tout simplement parce que les études antérieures ayant traité le FIML e t le
LIML ont été faites sur des bases différentes et il était intéressant pour nous de choisir
les mêmes bases que ces études différentes afin de pouvoir comparer nos résultats à
chacune d'entre elles.
Annexe A
Correction à la Heckman
Lorsqu'on applique les MCO, on a généralement un modèle de la forme:
Y = Xi3 + u, avec u - (0: 0').
Cette régression consiste en Fait en:
Y = E ( Y ) i u = X P + v , (.LX!)
car E(Y) = E(XB i u) = E ( X @ ) + E(u) = X,û + O = .W. Mais dans certains cas! comme celui qui nous concerne, on a plutôt une demande
conditionnelle et la régression qui doit être faite est la suivante:
Y, = E(Y1i) + u.
Or E(Yji) = E(XPli) + E(u(i) = XP + E(uli) si E(uli) # O. D'où:
Y, = E(Y(i) + u = X,3 + E(u(i) + u . (A. 53)
En considérant (.4.52), les estirnateus des paramétres d'intérêts sont donnés par:
137
~ O U V O ~ S E(,3) = (XtX)-%%(Y) = (XtX)-1X1E(dY,3 i .u) = D + E(u) = 3. Dans ce cas l'estimateur n'est pas biaisé.
Si par contre l'estimation concerne la demande conditionnelle, on aura par (-A.%'):
D'où on voit bien que l'estimateur est biaisé. La vraie régression qu'on devrait
faire est donc:
où E (uli) est le biais d'autosélec tion.
Annexe B
Espérance conditionnelle
Soient deux
conditionnelles,
Par ailleurs,
d'où
Mnables aléatoires .Y e t Y . .i l'aide des propriétés des espérances
on peut écrire:
sachant que f (yjx) = #:on a
On a aussi J' /(z, y)dx = f(yjx E A) P(z E A): ce qui nous amène à xE.4
Trouvons maintenant l'espérance de y conditionnelle à x E A.
En remplaçant (B.54) dans (B.55), on a
OU encore
Annexe C
Le Logit Polytomique
Une variable aléatoire ( est distribuée Gumbel si eiie a une fonction de distribution
de probabilité de la forme
et une fonction de distnbu tion cumulative
où fl est un paramètre d'échelle e t rl un paramètre d'emplacement. Les propriétés
de cette distribution sont les suivantes:
1. Elle a pour mode q.
2. Sa moyenne est de q + $ où y est la constante d'Euler (= 0.577).
3. Sa variance est de S. 4. Si { Gumbel(q, 8) et u, a > O deux constantes, on a a( t u Gurnbel(<rq +
8 U! ,).
5. Si el,& sont i.i.d. Gumbel avec (vl, 6) et (q2,fl), on a E' = c2 - 5, 11
(logistique) avec 1
Appliquons ces propriétés au cas du YXL.
Posons 7 = O pour simpMcation.
On sait que la probabilité que la modalité i soit choisie est donnée par
Posons L; = mauj=2,....~(~~ + 6). Sachant que G - Gumbel(0, O ) e t que u, est une
constante, on a de la propriété 4, (suj + t,) N (ujl 8 ) . J
De la propriété 6, on a U = maxj,?,...,,(uj + &) N Gumbel(j ln 1 e8"j y O ) . ]=2
De la propriété 4, on a li = ,u + < avec u = f ln f: eh> et f - Gumbel(Oo 8). i=2
D 'où
Enfin de la propriété 5: on a
qui est la forme que prennent les probabilités de choix lorsque les termes d'erreur
sont Gumbel iid donnant lieu au modèle MNL.
Annexe D
Le simulateur GHK
Le simulateur GHK exploite la structure récursive imposée par La transformation de
Cholesky de l'équation de I'utilité prise en déviation par rapport à l'alternative choisie.
En supposant que Le choix correspond à la dernière alternative, comme démontré dans
Bolduc et Kaci (l993), on peut réécrire la fonction d'utilité comme:
Ceci implique:
ou:
où:
.4 l'aide de cette notation, les probabilités de choix deviennent:
Le simulateur GHK utilise cette décomposition pour chaque tirage de d j ~ . Soit
t un tirage donné et unt la réalisation du vecteur un. Le simulateur GHK est une
moyenne empirique prise sur T valeurs calculées a partir de ces tirages. On peut
écrire:
où T représente le nombre total des tirages et:
De façon plus élégante, nous avons:
où a(.) est la fonction de distribution cumulative d'une variable normale standard
avec :
Yotons que Whn,t est calculé à l'aide de @ - ' ( W Q ( U ~ , , ~ ) ) avec IL un nombre aléatoire
uniforme compris entre (O, 1).
Annexe E
Les dérivées premières
Par rapport à ,B
où:
avec Ah, = é d u é à alnyt et:
O Par rapport à 6
où:
et:
Par rapport à po
où:
et:
a Par rapport à p,
où:
et:
a Par rapport B 0
a Par rapport h o
Les dérivées par rapport aux éléments de la matrice de variance-covariance.
Les dérivées par rapport à ces déments sont détaillés dans Bolduc et Kaci (1993).
Annexe F
Calculs théoriques des moments
conditionnels
d- 5 L'espérance pour (G/C1 < -V) = -01 + . [+(-,il Preuve
Partons du calcul de la moyenne tronquée pour un terme d'erreur u .- J ( 0 . 1 ) . a
E(U lu < a) = / ug(u)du -34
avec
Avec ça l'expression pour la moyenne conditionnelle peut s'écrire comme
car $ u(p(u)du = -v(u) . Nous avons
Yous recherchons plutôt 5 -V) avec CL .- X ( O ? oll). Il apparait que CL n'est
qu'une transformation affine de u. YOUS avons de ce fait la relation suibante entre les
d e ~ u termes d'erreur
Ce qui implique que CL = al u.
La variance pour 5 -V) = oll QI
Preuve
Pour avoir la variance conditionnelle ci-dessus: nous allons passer par la dérivation
de celle d'un terme d'erreur 1~ - N ( 0 : 1) pour enfin utiliser la transformation a f i e
à cet effet. Par ailleurs, pour obtenir cette dernière, nous dérivons' en premier lieu
13(u21u < a ) 9 une des deux composantes de la variance conditionnelleo la première
étant la moyenne conditionnelle calculée précédemment.
I u2 " ~ ( u ~ l u < a ) = - uexp(-T)l ( 2 4 l /* 0 ( a ) -al --
1 ~ ( u ~ j u < a ) = [ - a ( ~ n ) l / ~ ~ ( a ) i ( 2 ~ ) ~ / ~ @ ( a ) ]
(2n) <P (a )
Cette dernière expression nous permet d'avoir la variance conditionnelle
.i l'aide de la transformation affine. nous obtenons
D'où
-- -1) v a ~ ( c d c l s 4,
[1- (-;; -- ;;) (-;; -- ;) - (-;))lm Ql
Preuve
Par définition,
-v r - v 1
Pour simplifier la notation, posons
L'expression de la moyenne conditionnelle recherchée devient
-a L -00
Utilisant la propriété des espérances conditionnelles
nous obtenons
Nous pouvons aussi réécrire B comme
Cette expression peut être décomposée à l'aide de l'une des propriétés de la loi
normale bidimensionnelle tronquée stipdant que pour
nous avons (6) - lv(*: :i;)'
Il ressort de ce résultat que
Ainsi? nous arrivons à
De retour à la moyenne conditionnelle, nous pouvons l'écrire de façon alternative
comme
Posons, une fois de plus, pour faciliter l'écriture
Sachant que
nous pouvons t3n déduire que
Yotons que
La moyenne conditionnelle que nous recherchons est ainsi donnée par
Utilisant, une fois de plus, la loi normale bidimensionnelle tronquée.
L'expression pour la moyenne devient alon:
La moyenne conditionnelle est finalement donnée par:
La variance pour (hicl < -VI & 5 -V)
Preuve
La variance conditionnelle est fonction de deux composantes dont la moyenne
conditionnelle calculée précédemment. De ce fait, posons, tout d'abord
La variance est par définition donnée par
Cette variance peut être réécrite comme
Remarquons que cette dernière peut aussi se présenter sous la forme
considérant que
Les composantes de la variance conditionnelle sont:
a) Première composante
b) Deuième composante
c) Troisième composante : E({i1& 5 -KG).
(y) , (y) l c = [ + ( ) ( - @ (Y) ) ] + ~ i * p * ( 4 (7) ) :
nous avons
La variance conditionnelle pour 6 est findement donnée par
Bibliographie
[l] ALBRIGHT, R.L., S.R. LERhfAX and C.F. MVIANSKI. (1977), " Repon on
the Development of an Estimation Program for the Multinomial Probit Model",
Prepared for the Federal Higliwuy Administration.
[2] AMEMIYA, T. (1978), " The Estimation of Simuitaneous Equations Generalized
Probit Models" , Economehica, J8(2).
[3] BÉLAYGER, D.? (l992), "Estimations des Probabilités de Chok Reliées au
Problème d'évaluation de la demande d'électricité Résidentielle au Québec" ,
Thèse de maitrise. Université Laval.
[4] BEN-AKIV-4' M. and S. LE>R&LIIAN (1985): "Discrete Choice Analysis: Sheory
and Application to Trawl Demand" , Cambridge. MA: MIT Press.
[5] B E N - A m \ , m. and D. BOLDUC ( lgg l ) , "3fultinomia Probit wit h Autore-
gressive Error Structure" : GREEN, Université Laval.
[6] BÉLANGER: D., J.T. BERNARD and D. BOLDUC (1996): "Québec Residen-
tial Electricity Demand: A Microeconometric Approach" Canada'an Journal of
Economics, vo1.29 No. 1.
[?j BOLDUC, D., (1999), "A Practicd Technique to Estimate Multinomial Probit
ModeIs in Transportation ", Transportation Research-B, 33, pp 63-79.
[8] BOLDUC, D. et M. KACI (1993), "Estimation des Modèles Probit Polytomiques:
Un survol des techniques", Actualité économique, vol.69(3), 161- 19 1.
[9] BOLDUC, D., (l992), "Generalized Autoregressive Errors in the Multinomial
Probit Yodel", Transportution Research-B, vol. 26B, 'To. 2.
[IO] BORSCH-SUP.W, A. and V. Ha4JIV.4SSILIOU (1993), "Srnooth Unbiased Md-
tiMnate Probability Simulators for Maximum Likelihood Estimation of Limited
Dependent Variable Models", Journal of Econometn'cs, Vol.58. 347-368.
[il] BUTLER, J.S. and R. MOFFIT (1982), "4 Computationally Efficient Quadra-
ture Procedure for the One-factor Multinomial Probit Modeln , Econometrica.
VOL 50(3), 761-764.
[12] CLARK. C. (1961), " The Greatest of a Finite Set of Randorn Variables". Op-
eration Research, 9, 145- 162.
[13] DUBIN, J.A. (1985): "Consummer Durable Choice and the Demand For Elec-
tricity " Yorth-Holland.
[14] DUBN, J.A. and D. McFADDEN (1984), "An Econornetric Analysis of Resi-
dentiai Electricity Appliance Holdings and Consumption" . Econometrica. vol. 52
Y0 2.
[El GEWEKE, J.: M. KEANE and D. RUXKLE (l994), %iternative Cornputacional
Approaches to StatisticaI Inference in the Multinomial Probit Model", Revieu
of Economics and Statiatics, L X W , 609-632.
[16] GOURIÉROUX, C. (1984), "Économétrie des Variables Qualitatives''
Économica.
[17] GOURIÉROUX, C. and F. JOUNEAU (MM), "?vlultimriate Distributions for
Limited Dependant Variable models", Centre de Recherche en Économie et
Statistiques (CREST).
il81 GOURIÉROUX. C. and A. MONFORT (1996), "Simulation Based Methods in
Econometrics" , O.dord University Press: Oxford.
[19] GOURIÉROUX, C. and A. MONFORT (1992): "Simulation Based Inference
in Models with Heterogeneity" , ..Linales d'Economie et de Statistiques; 20-2 1,
69-107.
[20] G O ~ R I É R O U X ~ C., A. !dOZIFORT and E. RENAULT (1993), "Indirect Infer-
ence", Journal of Applzed Econometncs; 8, S85-S118.
[21] GREENE, W.H. (1996) "Econometric Analysis", MacMillan, Yew York.
[22] HANEMa4YN, M. W., (1984) ! "Discrete/Continuous Models of Consumer De-
mand" , Econometn'ca. Vol.52 No3.
[23] HAJIV.\SSILIOU, V A . and D. MCFADDEN (1994), 'The Method of Simulated
Scores for the Estimation of LDV Models with an Application to External Debt
Crises!', Cowles Foundation discussion paper, 'io.967, kale University. Conn.
[24] H..ZJIV.ASSILIOU, V A . and P. RUUD (l994), *'Classical Estimation Me thods
for Limited Dependant Variable Models using Simulation", Handbook of Econo-
rnetrics, vol. W .
[25] HAJIVASSILIOU, VA., D. McMDDEN and P. RUUD (1996), '9irnulation of
Multiwiate Normal Rectangle Pro babilities and their Derivatives" Journal of
Econometn'cs: 72, 85-135.
[26] HAUSMAX, J.A. and D.A. WISE (1978), "-4 Conditional Probit for Qualita-
tive Choice: Discrete Decisions Recognizing Interdependence and Heterogeneous
Preferences" , Econornetrica, 46, 403-426.
[27] HAUSMANo J.A. and P. RUUD (1987), "SpeciS.ing and Testing Econometric
hludels for Rank-ordered Data*', Journal of Econometrics, vol. 34, 83-104.
[28] HECKMAN, J. (1976), "The Common Structure of Statistical 'ilodels of Tnin-
cation, Sarnple Selection and Limited Dependent Variables and a Simple Esti-
mation for Such Models", Anna23 of Economics and Social Mea~urements~ vol.5.
475-492.
[291 HECKMAN. J. ( W g ) , "Sample Selection Bias as a Specification Er~or" , Econo-
m e t r i a ; 47.
[30] KING, MA. (1980), "An Econometric Model of Tenue Choice and Demand for
Housing as Joint Decision", Journal of Public Economicso vol. 14.
[3 11 LAYCASTER. K. J. ( lg ïg ) , "Variety, Equity and Efficiency" , New York:
Columbia University Press.
[32] LEE, L. F., G.S. MADDALA and R.P. TROST (1980). "Asymptotic Covariance
Matrices of Two-stage Probit and Two-stage Tobit 'vlethods for Simultaneous
Equations Models with Selectivity" , Econornetrica! vol. 48, Yo.2.
[33] LEE, E. F. and R. TROST (1978), "Estimation of Some Limited Dependant
Variable Models with -4ppIications to Housing Demandt . Journal of Econornet-
n'cs, vol. 8 , 357-382.
[34] McCULLOH, R., and P.E. ROSSI (1994), "An E,xact Likelihood hnalysis of the
Multinornial Probit Model", Journul of Econornetrics, vol. 64(1), 207-240.
[35] McF.4DDENY D. (l978), "Modelling the Choice of Residentid Location" , in Spa-
tial Interaction Theory and Planning Models, ed. by A. Karliquist , L. Lundquist,
F. Snickars, and J.L. Weibull. Amsterdam: North Houand.
[36] McFADDEX, D. (1989), "A Method of Simulated Moments for Estimation of
the Multinornial Probit Models without Yumerical Integration" , Econometrica,
vol. 57(5).
[37] McFPIDDEN, D., P. RUUD (1994), "Estimation by Simulation", Review of Eco-
nomics and Statistics; 76 (4), 591-608.
[38] MURPHY, K. and R TOPEL, (1985), "Estimation and Inference in Two Step
Econometrics Models" , Journal of Business and Economic Statistics. 3, 370-379.
[39] NOVSHEK, W. and H. SONXENSCHEIN (1979), "Marginal Consumers of Yeo-
classical Dernand Theory" , Journal of Political Economy, 87. 13684376.
[40] OWEN, D. (1956), " Tables for Computing Bivariate Yormal Probabilities",
Annal3 of Mathematical Statzstâc, 27, 1C75-1090.
[41] P.\KES, -4. and D. POLLARD (l989), "Simulation and the Asynptotics of O p
timisation Estimations", Econometrica, vol. 57(5).
[42] RUUD, P. A. (1991), "Extensions of Estimation Methods using the EM Algo-
rithm", Journal of Econometrica, vol. 49, 305-341.
[43] STERIV, S. (1992): "-4 Method for Smoothing Simulated Moments of Discrete
Probabilities in Multinornial Probit Models", Econometrica, vol. 60(4), 943-952.
14441 TRAIN, K., (1986), "Qualitative Choice .halysis: Sheory, Econometrics and an
Application to Automobile Demand", MIT Press, Cambridge. 'ilass.