estimac»ao do posto da matriz dos par~ ametros^ …
TRANSCRIPT
ESTIMACAO DO POSTO DA MATRIZ DOS PARAMETROSDO MODELO DE REGRESSAO DIRICHLET
TATIANE FERREIRA DO NASCIMENTO MELO DA SILVA
Orientador: Prof. Dr. Klaus Leite Pinto Vasconcellos
Area de concentracao: Estatıstica Matematica
Dissertacao submetida como requerimento parcial para obtencao do grau de Mestre emEstatıstica pela Universidade Federal de Pernambuco
Recife/PEnovembro, 2004
Dedico este trabalho aos meus pais, Pedro
e Rosangela, aos meus irmaos, Cristiano e
Patricia, e ao meu esposo, Alessandro.
i
Agradecimentos
A DEUS, que e minha base, meu refugio, minha certeza, Aquele em que tudo posso, e tudoconfio. Pois sem Ele nada seria possıvel e tudo seria vazio.
Ao meu orientador, Klaus Leite Pinto Vasconcellos, pela atencao, pela paciencia, pela com-petencia e por ter acreditado na minha capacidade.
Aos meus pais e aos meus irmaos pelo apoio, pelo amor, pela forca, por nunca deixarem eudesistir e pelas palavras de conforto.
Ao meu esposo pela compreensao, pelo amor incondicional, pelo carinho e por abdicar donosso tempo juntos para que mais essa etapa em minha vida fosse concluıda.
Ao professor Francisco Cribari-Neto, pela competencia, pela seriedade, pelo profissionalismo,pelo incentivo e pela confianca.
A toda famılia do Alessandro que sempre esteve do nosso lado quando decidimos vir paraRecife.
A tia Santina pelo carinho, pela forca e por participar de todas as fases de minha vida.
A Fatima de Sousa Maior pela amizade, pelo apoio, pela forca e confianca.
As minhas grandes amigas: Ana Rosa, Flavia, Karla, Marcia, Sigreice e Tatiana pela forca,pelo apoio e pela confianca. Ao meu amigo Cleyton pela forca.
Aos meus amigos de mestrado de que nunca vou esquecer. As pessoas com que pude com-partilhar esses dois anos, pessoas que sempre me ajudaram a conhecer a Estatıstica mais deperto e que me receberam com muito carinho nesta nova area de estudo, que para mim eraate entao desconhecida.
Ao Andre pela amizade, pelos momentos de descontracoes, pela alegria e pelas sugestoes.
A Andrea pela amizade fortalecida no segundo ano de mestrado, por deixar eu conhecer apessoa meiga, simples e doce que e.
Ao Braga Junior pela amizade, pela paciencia, pela alegria e por sempre me ajudar com suassugestoes.
A Gecy pela amizade, pela alegria em que ve a vida, por sempre me ajudar neste mestrado,pelo apoio, pelo entusiasmo, otimismo e coragem.
A Renata pela amizade, pelo alto astral, por sempre me ouvir nos momentos tristes e alegres,pelo carinho, pela alegria e empolgacao nos estudos.
A minha amiga Sandra Maria, pela serenidade, centralidade, pelo exemplo de vida, pelapaciencia e por sempre me ajudar nas duvidas estatısticas.
ii
A Sandra Rego pela amizade, paciencia, confianca, perseveranca, por me permitir fazer partede sua vida e me ajudar nos estudos.
Ao meu colega Cherubino (em memoria) pelas ideias compartilhadas.
Aos meus colegas de mestrado, Artur, Camilo, Carlos Gadelha, Carlos Tome, Daniela, Denis,Francisco, Hernando, Katya, Lenaldo, Milena, Polyane, Themis e Tiago.
A Keila Mara pelo incentivo para estudar na Universidade Federal de Pernambuco.
A Tatiene pela paciencia, amizade e atencao com que me recebeu em Recife.
Ao Gilson, Patrıcia Leal, Moises e Silvia pela amizade e respeito.
Aos professores Jesus Carlos da Mota e Maurılio Marcio Melo da Universidade Federal deGoias pelo incentivo a estudar Estatıstica.
As professoras Maria Cristina Falcao Raposo, Viviana Giampaoli e Claudia Regina pelosmomentos de descontracao e aprendizado proporcionados.
Aos professores do Programa de Mestrado em Estatıstica da UFPE.
A Valeria Bittencourt, pela competencia com que sempre cuidou dos assuntos relacionadosa pos-graduacao, pela compreensao e por sempre me ouvir nos momentos tristes e alegres.
A todos que direta ou indiretamente colaboraram para que mais esta etapa de minha vidafosse concluıda.
Aos participantes da banca examinadora pelas sugestoes.
A CAPES, pelo apoio financeiro.
iii
Resumo
O modelo de regressao Dirichlet e util, por exemplo, na modelagem de taxas e pro-porcoes, onde a soma das componentes de cada vetor de observacoes e igual a um. Oscoeficientes deste modelo de regressao constituem uma matriz. Se esta matriz nao tem postocompleto, ou seja, se alguns de seus elementos podem ser escritos como combinacoes linea-res de outros, entao a quantidade de parametros do modelo a serem estimados e menor.Nosso objetivo e estimar o posto desta matriz de parametros, utilizando uma estatısticade teste proposta por Ratsimalahelo (2003), atraves do procedimento de teste sequencial edos criterios de informacao BIC (Bayesian Information Criteria) e HQIC (Hannan QuinnInformation Criteria). Em seguida, avaliamos o desempenho dos estimadores do posto damatriz de coeficientes, baseados nestes procedimentos.
Neste trabalho consideramos dois modelos de regressao Dirichlet. Atraves dos resultadosde simulacao de Monte Carlo, observamos que quando utilizamos o procedimento de testesequencial, para estimar o posto da matriz de coeficientes dos modelos de regressao Dirichlet,o desempenho dos estimadores, em geral, e melhor em termos de vies e erro quadratico mediodo que quando utilizamos os criterios de informacao BIC e HQIC.
iv
Abstract
The Dirichlet regression model is useful in the modelling of rates and proportions, wherethe sum of the components of each vector of observations is one. The coefficients of thisregression model constitute a matrix. If this matrix does not have full rank, in other words,if some of its rows or columns can be written as linear combinations of others, then thequantity of estimated parameters of the model is reduced. Our goal is to first estimate therank of this matrix of parameters, using a test statistic proposed by Ratsimalahelo (2003),via the sequential testing strategy, the Bayesian information criterion (BIC), and HannanQuinn information criterion (HQIC). We then evaluate the performance of the estimator ofthe rank of the coefficient matrix based on these procedures.
In this work we consider two Dirichlet regression models. From the Monte Carlo simula-tion results we observe that, when we use the sequential test procedure to estimate the rankof the coefficient matrix of the Dirichlet regression models, the performance of these estima-tors is generally better in terms of bias and mean square error than those of the informationcriteria BIC and HQIC.
v
Indice
1. Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1. Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1. Organizacao da dissertacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.2. Suporte computacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2. Estimadores de maxima verossimilhanca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2. O modelo de regressao Dirichlet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.1. Modelo beta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4
2.1.1. Definicao e estimacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4
2.2. Modelo Dirichlet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.1. Definicao e estimacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.2. Modelo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.2.3. Modelo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3. Estimador do posto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.1. Consideracoes iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .27
3.1.1. Teste de hipotese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .28
3.1.2. Decomposicao em valores singulares e a estatıstica de teste . . . . . . . . . . . . 29
3.2. Procedimento de teste sequencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3. Criterios de informacao BIC e HQIC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4. Avaliacao numerica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.1. Resultados numericos para o Modelo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
vi
4.2. Resultados numericos para o Modelo 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
5. Aplicacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .80
5.1. Dados do polen fossilizado em flores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .80
5.2. Dados da composicao de leucocitos no sangue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
6. Conclusoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .85
. Apendice 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
. Apendice 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
. Apendice 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
. Apendice 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
. Apendice 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
A5.1. Programas principais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
A5.2. Biblioteca de funcoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
A5.3. Programas de ligacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
. Referencias bibliograficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .151
vii
Capıtulo 1
Introducao
1.1 Introducao
Neste trabalho estudamos um estimador para o posto da matriz dos coeficientes de umaregressao em que as observacoes seguem uma distribuicao Dirichlet, que e uma extensaomultivariada da distribuicao beta. Esta ultima distribuicao e util na modelagem de dadosestatısticos que assumem valores no intervalo (0, 1), enquanto que a primeira se presta amodelagem probabilıstica de um vetor de variaveis compreendidas no intervalo (0, 1) cujasoma e igual a um. Com o objetivo de definir uma estrutura de regressao para dados comdistribuicao Dirichlet, consideramos duas parametrizacoes, que denotaremos por “modelo1” e “modelo 2”. Na primeira parametrizacao, a media da variavel resposta e modeladajuntamente com um parametro de precisao, ou seja, a j-esima componente, µj , da respostamedia e modelada atraves de uma estrutura de regressao juntamente com um parametro deprecisao φ. Na segunda parametrizacao a variavel resposta se distribui como Dirichlet comparametros α1, α2, . . . , αp, onde estes parametros obedecem estrutura de regressao.
Os coeficientes na estrutura de regressao multivariada do modelo de regressao Dirichletconstituem uma matriz, que denotaremos por B. Quando essa matriz nao tem posto com-pleto, algumas de suas colunas (ou linhas) sao linearmente dependentes, ou seja, alguns deseus parametros podem ser escritos como combinacoes lineares de outros. Pensando nisso,nosso objetivo principal e estimar o posto da matriz dos coeficientes nos dois modelos deregressao Dirichlet considerados. Varios testes foram propostos para estimacao do posto dematrizes desconhecidas. Em particular, Ratsimalahelo (2003) desenvolveu um teste usandoa teoria da perturbacao de matrizes. O teste consiste em determinar quantos valores sin-gulares de uma matriz estimada sao significantemente diferentes de zero, ja que o posto deuma matriz e igual ao numero de valores singulares diferentes de zero. Outros pesquisadores,como Stewart (1984), Gill e Lewbel (1992), Robin e Smith (2000) tambem desenvolveramtestes para posto de matrizes, mas o teste desevolvido por Ratsimalahelo (2003) tem umagrande vantagem sobre os outros testes, a facilidade de seu calculo.
Na estimacao do posto da matriz B usamos a estatıstica de teste proposta por Rat-simalahelo (2003); associados a esta estatıstica de teste, usamos tres procedimentos paraestimacao do posto, a saber: o teste sequencial e os criterios de informacao BIC (BayesianInformation Criteria) e HQIC (Hannan Quinn Information Criteria). Usando estes procedi-mentos, Ratsimalahelo (2003) estabelece um estimador fortemente consistente para o postode B, a partir de um estimador fortemente consistente de B. Para os resultados numericos,utilizamos o metodo de simulacao Monte Carlo. Com tais resultados avaliamos o desem-penho numerico do teste sequencial e dos criterios de informacao BIC e HQIC para as duasparametrizacoes consideradas quando a matriz B tem ou nao posto completo. Alem disso,aplicamos o segundo modelo de regressao Dirichlet considerado a dois conjuntos de dados
1
reais e estimamos o posto da matriz de parametros desse modelo usando a estatıstica deteste de Ratsimalahelo (2003) juntamente com os tres procedimentos citados acima.
1.1.1 Organizacao da dissertacao
A estrutura do restante desta dissertacao e composta da seguinte maneira: no capıtulo 2apresentamos as distribuicoes beta e Dirichlet, algumas propriedades amostrais de ambas econsideramos ainda dois modelos de regressao Dirichlet, mostrando como obter as estimativasdos parametros desconhecidos. No capıtulo 3, apresentamos a estatıstica de teste propostapor Ratsimalahelo (2003) juntamente com o procedimento de teste sequencial e os criteriosde informacao BIC e HQIC para estimacao do posto da matriz de coeficientes da regressaoDirichlet. No quarto capıtulo, com base em simulacoes de Monte Carlo para os modelos deregressao Dirichlet, investigamos o comportamento do procedimento de teste sequencial edos criterios de informacao BIC e HQIC na estimacao do posto. No capıtulo 5, aplicamos omodelo de regressao Dirichlet a dois conjuntos de dados reais e estimamos o posto da matrizde coeficientes do modelo. As conclusoes desta dissertacao sao apresentadas no capıtulo 6.
1.1.2 Suporte computacional
As ferramentas computacionais utilizadas para o desenvolvimento deste trabalho forama linguagem de programacao Ox e o programa R.
Para as avaliacoes numericas, utilizamos a linguagem de programacao matricial Ox, cria-da por Jurgen Doornik em 1994, que permite a implementacao de tecnicas estatısticas comfacilidade e atende a requisitos como precisao e eficiencia, o que tem contribuıdo para suaampla utilizacao no campo da computacao numerica. A versao utilizada aqui foi a 3.30para sistemas operacionais Linux e esta disponıvel gratuitamente para uso academico noendereco http://www.nuff.ox.ac.uk/Users/Doornik. Detalhes sobre esta linguagem deprogramacao podem ser encontrados em Doornik (2001) e Cribari–Neto e Zarkos (2003). Osgraficos apresentados neste trabalho foram feitos utilizando o programa R, que e baseado emuma linguagem de alto nıvel desenvolvida para analise, manipulacao e apresentacao graficade dados. Ver Cribari–Neto e Zarkos (1999) para detalhes.
2
1.2 Estimadores de maxima verossimilhanca
Suponha que x e o valor observado de um vetor aleatorio X = (X1, . . . , XN )> cuja dis-tribuicao e caracterizada por uma funcao de probabilidade ou densidade com forma analıticaf(x; θ) conhecida, mas dependente de um vetor θ = (θ1, . . . , θp)
> de parametros desconheci-dos. Seja Θ ⊂ IRp o espaco parametrico, que representa o conjunto de valores possıveis parao vetor θ.
A funcao de verossimilhanca L(θ; x) e definida como sendo igual a funcao do modelo,embora seja interpretada diferentemente, como funcao de θ. Assim L(θ; x) = f(x; θ). Usual-mente, trabalha-se com a log-verossimilhanca `(θ; x) = log L(θ; x). A funcao de verossimi-lhanca informa a ordem natural de preferencia entre diversas possibilidades para θ. Entreos possıveis candidatos para estimar o parametro verdadeiro, θ0, a partir dos mesmos dadosx, o vetor de parametros mais plausıvel e aquele de maior verossimilhanca. Neste sentido,o metodo de maxima verossimilhanca objetiva escolher o valor do vetor θ de parametrosque fornece a chance maior de ocorrer novamente os mesmos dados que ocorreram. Assim,para estimar o vetor verdadeiro θ0 de parametros, escolhe-se aquele vetor de parametros quemaximiza a funcao de verossimilhanca no espaco parametrico Θ. O estimador de maximaverossimilhanca (EMV) de θ e portanto o vetor que maximiza L(θ; x) em Θ. Como a funcaologaritmo e monotona crescente, maximizar L(θ; x) e `(θ; x) em Θ sao processos equivalentes.
Entao o EMV θ e definido como o vetor
θ = argmaxθ∈Θ
L(θ; x) = argmaxθ∈Θ
`(θ; x).
Se Θ e um conjunto discreto, calcula-se `(θ; x) para diversos θ’s e escolhe-se θ como aquelevalor de θ correspondente ao maximo `(θ; x). Quando `(θ; x) e contınua e diferenciavel em
Θ, o EMV θ pode ser obtido resolvendo-se o sistema de equacoes simultaneas
∂`(θ; x)
∂θj= 0, com j = 1, . . . , p
desde que θ nao se encontre na fronteira do espaco parametrico. A primeira derivada da
funcao log-verossimilhanca U(θ) = ∂`(θ;x)∂θ e chamada funcao escore. As equacoes de maxima
verossimilhanca sao usualmente nao-lineares e nestes casos as solucoes de U(θ) = 0 devemser obtidas por tecnicas iterativas, como as apresentadas no apendice 3.
Os estimadores de maxima verossimilhanca possuem algumas propriedades bem conheci-das, ver Cordeiro (1992). Uma propriedade importante e que, sob condicoes bastante gerais,os EMV’s sao assintoticamente normais, ou seja,
√N (θ − θ0)
d7−→ N (0, I(θ0)−1),
onde θ0 e o valor verdadeiro do parametro, o sımbolod7−→ significa convergencia em dis-
tribuicao e I(θ0) e a informacao de Fisher,
I(θ) ≡ Eθ
(∂`(θ; x)
∂θ
∂`(θ; x)
∂θ>
)
Esta propriedade sera utilizada em nosso trabalho.
3
Capıtulo 2
O modelo de regressao Dirichlet
2.1 Modelo beta
Na pratica, o uso de modelos de regressao e bastante comum para analisar dados quepossivelmente tem algum tipo de relacao com outras variaveis. O modelo mais utilizadoe o de regressao normal linear, mas este nao e apropriado para situacoes onde a variavelresposta esta restrita ao intervalo (0, 1). Uma solucao e usar um modelo de regressao onde aresposta e modelada por uma distribuicao beta, usando, por exemplo, uma parametrizacaodefinida pela media e por um parametro de dispersao, ver Ferrari & Cribari-Neto (2004). Adistribuicao beta tem sido bastante utilizada para se definir modelos probabilısticos. Bury(1999) lista um conjunto de aplicacoes da distribuicao beta em engenharia. Janardan &Padmanabhan (1986) modelam variaveis hidrologicas usando a distribuicao beta. A seguir,consideramos algumas propriedades da distribuicao beta, como sua funcao de densidade eseus primeiros momentos.
2.1.1. Definicao e estimacao
Seja Y uma variavel aleatoria. Dizemos que Y tem distribuicao beta com parametrosα1, α2 > 0, denotado por Y ∼ B(α1, α2), se sua funcao de densidade e dada por
f(y; α1, α2) =
Γ(α1+α2)Γ(α1)Γ(α2)
yα1−1 (1− y)α2−1 se 0 < y < 1,
0 caso contrario,
(2.1.1.1)
onde Γ(.) e a funcao gama.
Os parametros α1 e α2 sao parametros de ajuste, pois atraves de α1 e α2 podem serobtidas diferentes distribuicoes em (0, 1). Quando α1 = α2 = 0.5, a distribuicao betase reduz a chamada “distribuicao arco seno”, a qual e util no estudo de passeios aleatorios.Distribuicoes beta para as quais α1 +α2 = 1 com α1 6= 0.5 sao conhecidas como distribuicoes“arco seno generalizadas”. Se α1 = α2 obtemos densidades simetricas em torno de 0.5 equando α1 = α2 = 1 temos a distribuicao uniforme. Logo, a distribuicao beta e uma famıliade distribuicoes, como pode ser visto na Figura 2.1.1.1.
Para estudar o comportamento da distribuicao beta, temos que conhecer algumas pro-priedades da distribuicao como, por exemplo, a media e a variancia. O n-esimo momentoem torno de zero da distribuicao B(α1, α2) e
4
Figura 2.1.1.1: Grafico da densidade beta para diferentes valores de α1 e α2.
0.0 0.2 0.4 0.6 0.8 1.0
01
23
45
6
y
dens
idad
e
(0.5,0.5)
(0.7, 0.3)
(5,5)
(30,30)(0.3, 0.7)
(1,1)
E(Y n) =
∫ 1
0ynf(y; α1, α2)dy
=
∫ 1
0yn Γ(α1 + α2)
Γ(α1)Γ(α2)yα1−1 (1− y)α2−1dy
=Γ(α1 + α2)
Γ(α1)Γ(α2)
[∫ 1
0yn+α1−1 (1− y)α2−1dy
].
A integral entre colchetes acima e facilmente obtida usando-se a funcao beta definidapor
B(s, r) =1
as+r−1
∫ a
0zs−1(a− z)r−1dz, ∀ a ∈ (0, 1)
ou ainda,
∫ a
0zs−1(a− z)r−1dz = B(s, r) as+r−1. (2.1.1.2)
Fazendo a = 1, s = n + α1, r = α2 e z = y em (2.1.1.2) temos que
∫ 1
0yn+α1−1 (1− y)α2−1dy = B(n + α1, α2).
5
Tendo em vista a propriedade da funcao Beta,
B(s, r) =Γ(s)Γ(r)
Γ(s + r), (2.1.1.3)
temos ∫ 1
0yn+α1−1 (1− y)α2−1dy =
Γ(n + α1)Γ(α2)
Γ(n + α1 + α2),
portanto
E(Y n) =Γ(α1 + α2)
Γ(α1)Γ(α2)
Γ(n + α1)Γ(α2)
Γ(n + α1 + α2)
=Γ(α1 + α2)Γ(n + α1)
Γ(α1)Γ(n + α1 + α2)
A expressao acima pode ser simplificada aplicando-se uma propriedade muito conhecidada funcao gamma, a de que Γ(z + 1) = z Γ(z) temos
Γ(z + n) = Γ[(z + (n− 1)) + 1]
= (z + (n− 1))Γ[z + (n− 1)]
= (z + (n− 1))Γ[(z + (n− 2)) + 1]
= (z + (n− 1))(z + (n− 2))Γ[z + (n− 2)]
. . .
= (z + (n− 1))(z + (n− 2)) . . . (z + 1)Γ(z + 1)
= (z + (n− 1))(z + (n− 2)) . . . (z + 1)zΓ(z),
(2.1.1.4)
Entao usando (2.1.1.4) temos
E(Y n) =α1(α1 + 1)(α1 + 2) . . . (α1 + n− 1)
(α1 + α2)(α1 + α2 + 1)(α1 + α2 + 2) . . . (α1 + α2 + n− 1).
Logo,
E(Y ) =α1
α1 + α2,
E(Y 2) =α1(α1 + 1)
(α1 + α2)(α1 + α2 + 1).
Entao , a variancia eVar(Y ) = E(Y 2)− [E(Y )]2
=α1α2
(α1 + α2)2(α1 + α2 + 1).
6
Podemos observar na Figura 2.1.1.1 que, quando α1 e α2 aumentam, a variabilidade dadistribuicao diminui, o que e confirmado pela expressao da variancia.
Para obter uma estrutura de regressao que permita modelar a media de uma variavelresposta sujeita a um parametro de precisao, usamos uma parametrizacao diferente damostrada na densidade (2.1.1.1). Seja µ = α1/(α1 + α2) e φ = α1 + α2, ou seja, α1 = µφe α2 = (1 − µ)φ. A funcao de densidade de Y pode ser reescrita, na nova parametrizacao,como
f(y; µ, φ) =
Γ(φ)Γ(µφ)Γ((1−µ)φ) yµφ−1 (1− y)(1−µ)φ−1 se 0 < y < 1,
0 caso contrario,
(2.1.1.5)
onde 0 < µ < 1 e φ > 0. O valor esperado e a variancia de Y sao expressos, na novaparametrizacao, como:
E(Y ) = µ,
Var(Y ) =V (µ)
1 + φ,
(2.1.1.6)
onde V (µ) = µ(1−µ) denota a funcao de variancia, e onde φ pode ser interpretado como umparametro de precisao, no sentido de que, para µ fixo, se o valor de φ aumenta, a varianciada variavel resposta diminui. A Figura 2.1.1.2 apresenta diferentes densidades beta sob anova parametrizacao , correspondentes a alguns valores dos parametros (µ, φ). Observamosque quando µ = 0.5 as densidades se apresentam de forma simetrica; quando µ 6= 0.5 asformas sao nao simetricas.
Quando a variavel resposta assume valores no intervalo arbitrario (a, b), com a e b co-nhecidos, pode-se modelar a variavel (Y −a)/(b−a), a qual e uma padronizacao que permitetrabalhar com a funcao de densidade (2.1.1.5), no intervalo (0, 1). O modelo proposto porFerrari & Cribari-Neto (2004) e definido estabelecendo uma relacao entre variaveis aleatoriascom distribuicao beta e algumas variaveis explicativas; nele uma relacao e estabelecida entreµ e estas variaveis. Todo o desenvolvimento apresentado no restante desta secao esta descritoem Ferrari & Cribari-Neto (2004).
Sejam Y1, . . . , YN variaveis aleatorias independentes, onde cada Yi, i = 1, . . . , N , temdistribuicao beta (2.1.1.5), isto e, Yi ∼ B(µi, φ). O modelo e obtido supondo que a media deYi pode ser escrita atraves de
h(µi) = β1xi1 + . . . + βkxik = ηi,
onde h : (0, 1) → IR e uma funcao de ligacao estritamente monotona e duplamente diferen-ciavel. Os parametros da regressao β1, . . . , βk sao desconhecidos e xi1, . . . , xik sao observacoesem k covariaveis (k < N), que assumem valores fixos e conhecidos. Existem diversas relacoesfuncionais para h(·), mas uma funcao bastante util e a funcao logit definida por h(µi) =log[µi/(1− µi)]. Com esta funcao, pode-se reescrever µi como
7
Figura 2.1.1.2: Graficos das densidades beta para diferentes valores de (µ, φ).
0.0 0.2 0.4 0.6 0.8 1.0
02
46
810
12
y
dens
idad
e
(0.05,5) (0.95,5)
(0.25,5) (0.75,5)
(0.50,5)
(0.10,5) (0.90,5)
0.0 0.2 0.4 0.6 0.8 1.0
05
1015
y
dens
idad
e
(0.05,25) (0.95,25)
(0.10,25) (0.90,25)
(0.25,25) (0.75,25)
(0.50,25)
0.0 0.2 0.4 0.6 0.8 1.0
05
1015
20
y
dens
idad
e
(0.05,100) (0.95,100)
(0.10,100) (0.90,100)
(0.25,100) (0.75,100)
(0.50,100)
0.0 0.2 0.4 0.6 0.8 1.0
05
1015
2025
30
y
dens
idad
e
(0.05,300) (0.95,300)
(0.10,300) (0.90,300)
(0.25,300) (0.75,300)
(0.50,300)
8
µi =e−x>i β
1 + e−x>i β, (2.1.1.7)
onde x>i = (xi1, . . . , xik) e β = (β1, . . . , βk), i = 1, . . . , N .Considerando a funcao de densidade dada em (2.1.1.5), a funcao de log-verossimilhanca
baseada em uma amostra de N observacoes para o modelo proposto e dada por
`(β, φ) =N∑
i=1
`i(µi, φ), (2.1.1.8)
onde
`i(µi, φ) = log Γ(φ)− log Γ(µiφ)− log Γ((1− µi)φ) + (µiφ− 1) log yi
+ ((1− µi)φ− 1) log(1− yi),
µi, definida atraves de (2.1.1.7) como µi = h−1(ηi), e uma funcao de β, e φ e o parametrode precisao.
A funcao de escore e obtida pela diferenciacao da funcao de log-verossimilhanca (2.1.1.8)com relacao aos parametros desconhecidos. Segue que para u = 1, . . . , k,
∂`(β, φ)
∂βu=
N∑
i=1
∂`i(µi, φ)
∂µi
dµi
dηi
∂ηi
∂βu(2.1.1.9),
mas
dµi
dηi=
1
h′(µi),
∂ηi
∂βu= xiu
(2.1.1.10)
e
∂`i(µi, φ)
∂µi= φ
[log
yi
1− yi− {ψ(µiφ)− ψ((1− µi)φ)}
]
= φ [y∗i − µ∗i ],(2.1.1.11)
onde ψ(. ) e a funcao digamma, ou seja, ψ(z) = d log Γ(z)/dz para z > 0, y∗i = log{yi/(1−yi)}e µ∗i = {ψ(µiφ)− ψ((1− µi)φ)}. Substituindo (2.1.1.10) e (2.1.1.11) em (2.1.1.9) temos
∂`(β, φ)
∂βu= Uβ(β, φ) = φ
N∑
i=1
(y∗i − µ∗i )1
h′(µi)xiu. (2.1.1.12)
Temos ainda que
9
∂`(β, φ)
∂φ= Uφ(β, φ) =
N∑
i=1
{µi[y∗i − µ∗i ] + log(1− yi) + ψ(φ)− ψ((1− µi)φ)}. (2.1.1.13)
Pode-se reescrever as equacoes (2.1.1.12) e (2.1.1.13) na forma matricial como
Uβ(β, φ) = φX>T (y∗ − µ∗) e Uφ(β, φ) = ({(y∗ − µ∗)>diag(µi)} − a>)1I,
onde X e a matriz formada pelas covariaveis do modelo, com dimensao N × k e i-esimo
vetor linha x>i , y∗ = (y∗1, . . . , y∗N ), µ∗ = (µ∗1, . . . , µ
∗N ), T = diag
(dµidηi
), e de forma analoga,
a> = (log(1−y1)+ψ(φ)−ψ((1−µ1)φ), . . . , log(1−yN )+ψ(φ)−ψ((1−µN )φ)) e 1I = (1, . . . , 1)>e o vetor de uns de dimensao N × 1.
A matriz de informacao de Fisher e dada por
K = K(β, φ) =
(Kββ Kβφ
Kφβ Kφφ
),
onde Kββ = φX>WX, Kβφ = KTφβ = X>Tc, Kφφ = tr(D), sendo W , c e D descritos a
seguir. W = diag(w1, . . . , wN ), com
wi = φψ′(µiφ) + ψ′((1− µi)φ)1
[h′(µi)]2,
c = (c1, . . . , cN ), com ci = φ[ψ′(µiφ)µi − ψ′((1 − µi)φ)(1 − µi)], onde ψ′(. ) e a funcaotrigamma e D = diag(d1, . . . , dN ), di = ψ′(µiφ)µ2
i − ψ′((1− µi)φ)(1− µi)2 − ψ′(φ).
Diante das condicoes de regularidade para estimacao por maxima verossimilhanca dis-cutidas em Cordeiro (1999), se o tamanho da amostra e grande, tem-se
(β
φ
)∼ N
((βφ
), K−1
),
aproximadamente, onde β e φ sao os estimadores de maxima verossimilhanca de β e φ,respectivamente. Estes estimadores sao obtidos pela solucao do sistema
Uβ(β, φ) = 0,
Uφ(β, φ) = 0,
e nao tem forma fechada. Consequentemente eles devem ser obtidos pela maximizacaoda funcao de log-verossimilhanca, usando um algoritmo de otimizacao nao-linear, como oalgoritmo de Newton (Newton-Raphson, Escore de Fisher, etc.) ou algum algoritmo quasi-Newton (BFGS, entre outros). O algoritmo de otimizacao requer um valor inicial paraser usado no esquema iterativo. Para isso, Ferrari & Cribari-Neto (2004) sugerem comovalor inicial para β a estimativa dos mınimos quadrados ordinarios, (X>X)−1X>z comz = (h(y1), . . . , h(yN )), onde h(y) = log[y/(1 − y)]. Sugerem tambem o valor inicial para φdado pela expressao
10
1
N
N∑
i=1
µi(1− µi)
σ2i
− 1,
onde µi e obtido aplicando h−1(. ) ao i-esimo valor ajustado da regressao linear de z emX, ou seja, µi = h−1(x>i (X>X)−1XTz), e σ2
i = e>e/[(N − k){g′(µi)}2], sendo e = z −(X>X)−1XTz o vetor de resıduos de mınimos quadrados da regressao linear na variavelresposta transformada.
2.2. Modelo Dirichlet
Agora consideraremos uma extensao para o modelo de regressao descrito anteriormente.Esta e baseada em uma extensao multivariada da distribuicao beta tambem conhecida comodistribuicao Dirichlet.
A distribuicao beta pode ser empregada no estudo de variaveis que possam ser colocadasno intervalo (0, 1). A distribuicao Dirichlet, por sua vez, pode ser usada para modelar adistribuicao conjunta de variaveis que estao compreendidas no intervalo (0, 1) e cuja soma eigual a um. Esta distribuicao e muito util em estudos de proporcoes, divisao aleatoria de umintervalo (Mauldon, 1951), alem de ser usada como distribuicao a priori na analise bayesiana(Good, 1965). A seguir, consideramos algumas propriedades da distribuicao Dirichlet, comosua funcao de densidade e seus primeiros momentos.
2.2.1. Definicao e estimacao
Consideremos um modelo de regressao com observacoes multivariadas, em que, paratodo i = 1, . . . , N , a observacao (Yi1, . . . , Yip), com Yi1 + . . . + Yip = 1, tem distribuicaoDirichlet, com parametros αi1 > 0, αi2 > 0, . . . , αip > 0. O vetor aleatorio (Y1, . . . , Yp), comY1 + . . . + Yp = 1, tem distribuicao Dirichlet com parametros α1 > 0, α2 > 0, . . . , αp > 0,quando (Y1, . . . , Yp−1) admite a funcao de densidade
f(y1, . . . , yp−1; α1, . . . , αp) =
Γ(∑p
j=1αj)∏p
j=1Γ(αj)
∏p−1j=1 y
αj−1j (1−∑p−1
j=1 yj)αp−1 y ∈ R,
0 c.c,(2.2.1.1)
onde Γ(.) e a funcao gamma e a regiao R e dada por:
R ={
(y1, . . . , yp−1) ∈ IRp−1; yj > 0 e
p−1∑
j=1
yj < 1}
.
11
Mostraremos a seguir que f(y1, . . . , yp−1; α1, . . . , αp) e efetivamente uma densidade. Ini-
cialmente notamos que f(y1, . . . , yp−1; α1, . . . , αp) ≥ 0, ja que Γ(.) > 0, (1 −∑p−1j=1 yj) > 0,
pois∑p−1
j=1 yj < 1, e, como yj > 0, temos entao que∏p−1
j=1 yαj−1j > 0 , j = 1, . . . , p − 1. A
seguir mostraremos que a densidade (2.2.1.1) integra um. Por exemplo, se p = 3, temos que
∫ ∞
−∞
∫ ∞
−∞f(y1, y2; α1, α2, , α3)dy1dy2 =
Γ(∑3
j=1 αj)∏3j=1 Γ(αj)
∫ 1
0
∫ 1−y2
0
2∏
j=1
yαj−1j
(1−2∑
j=1
yj)α3−1dy1dy2
=Γ(α1 + α2 + α3)
Γ(α1)Γ(α2)Γ(α2)
∫ 1
0
∫ 1−y2
0yα1−11 yα2−1
2 (1− y1 − y2)α3−1 dy1 dy2
=Γ(α1 + α2 + α3)
Γ(α1)Γ(α2)Γ(α2)
∫ 1
0
[∫ 1−y2
0yα1−11 (1− y1 − y2)
α3−1dy1
]yα2−12 dy2. (2.2.1.2)
A integral entre colchetes que aparece em (2.2.1.2) pode ser obtida usando (2.1.1.2). Sefizermos a = 1− y2, s = α1 e r = α3, entao, teremos
∫ 1−y2
0yα1−11 (1− y1 − y2)
α3−1dy1 = B(α1, α3)(1− y2)(α1+α3−1),
logo (2.2.1.2) pode ser reescrita como
Γ(α1 + α2 + α3)
Γ(α1)Γ(α2)Γ(α2)B(α1, α3)
∫ 1
0yα2−12 (1− y2)
(α1+α3−1) dy2.
Usando novamente (2.1.1.2) fazendo a = 1, s = α2 e r = α1 + α3 temos∫ ∞
−∞
∫ ∞
−∞f(y1, y2; α1, α2, α3) dy1 dy2 =
Γ(α1 + α2 + α3)
Γ(α1)Γ(α2)Γ(α2)B(α1, α3)B(α2, α1 + α3);
por (2.1.1.3) temos∫ ∞
−∞
∫ ∞
−∞f(y1, y2; α1, α2, α3) dy1 dy2 =
Γ(α1 + α2 + α3)
Γ(α1)Γ(α2)Γ(α3)
Γ(α1)Γ(α3)
Γ(α1 + α3)
Γ(α2)Γ(α1 + α3)
Γ(α1 + α2 + α3)
=Γ(α1 + α2 + α3)
Γ(α1)Γ(α2)Γ(α2)
Γ(α1)Γ(α2)Γ(α2)
Γ(α1 + α2 + α3)= 1.
Generalizando o desenvolvimento acima, temos que∫ ∞
−∞. . .
∫ ∞
−∞f(y1, . . . , yp−1; α1, . . . , αp) dy1 dy2 . . . dyp−1
12
sera igual a
Γ(∑p
j=1αj)∏pj=1 Γ(αj)
[∫ 1
0
∫ 1−yp−1
0. . .
∫ 1−y2−...−yp−1
0
p−1∏
j=1
yαj−1j (1−
p−1∑
j=1
yj)αp−1dy1 . . . dyp−1
].
Logo, usando (2.1.1.2) p− 1 vezes temos que a integral anterior entre os colchetes e igual a
B(α1, αp) B(α2, α1 + αp) . . . B(αp−1, α1 + α2 + . . . + αp−2 + αp),
e, por (2.1.1.3), e equivalente a
Γ(α1)Γ(αp)
Γ(α1 + αp)
Γ(α2)Γ(α1 + αp)
Γ(α1 + α2 + αp). . .
Γ(αp−1)Γ(α1 + α2 + . . . + αp−2 + αp)
Γ(α1 + α2 + . . . + αp−2 + αp−1 + αp),
que depois de algumas simplificacoes se torna
Γ(α1)Γ(α2) . . . Γ(αp)
Γ(α1 + α2 + . . . + αp).
Logo
∫ ∞
−∞. . .
∫ ∞
−∞f(y1, . . . , yp−1; α1, . . . , αp) dy1 dy2 . . . dyp−1 =
Γ(∑p
j=1αj)∏pj=1 Γ(αj)
∏pj=1 Γ(αj)
Γ(∑p
j=1αj).
Portanto a funcao de densidade da distribuicao Dirichlet integra um, ou seja,∫ ∞
−∞. . .
∫ ∞
−∞f(y1, . . . , yp−1; α1, . . . , αp) dy1 dy2 . . . dyp−1 = 1
Algumas propriedades da distribuicao Dirichlet como, por exemplo, a media, a varianciae a covariancia serao apresentadas a seguir. Inicialmente encontramos o valor esperado deY q1
1 Y q22 . . . Y
qp−1
p−1 , que e dado por
E(Y q11 Y q2
2 . . . Yqp−1
p−1 ) =
∫ ∞
−∞. . .
∫ ∞
−∞
p−1∏
j=1
yqj
j f(y1, . . . , yp−1; α1, . . . , αp)dy1 . . . dyp−1
=
∫ 1
0
∫ 1−yp−1
0. . .
∫ 1−y2−...−yp−1
0
p−1∏
j=1
yqj
j
Γ(∑p
j=1αj)∏pj=1 Γ(αj)
p−1∏
j=1
yαj−1j (1−
p−1∑
j=1
yj)αp−1dy1 . . . dyp−1
=Γ(
∑pj=1αj)∏p
j=1 Γ(αj)
∫ 1
0
∫ 1−yp−1
0. . .
∫ 1−y2−...−yp−1
0
{p−1∏
j=1
yqj+αj−1j (1−
p−1∑
j=1
yj)αp−1dy1 . . . dyp−1
}.
Usando a integral dada em (2.1.1.2) p− 1 vezes temos
E(Y q11 Y q2
2 . . . Yqp−1
p−1 ) =Γ(
∑pj=1αj)∏p
j=1 Γ(αj)B(α1 + q1, αp)B(α2 + q2, α1 + αp + q1) . . .
B(αp−1 + qp−1, α1 + α2 + . . . + αp−2 + αp + q1 + . . . + qp−2)
13
=Γ(
∑pj=1αj)∏p
j=1 Γ(αj)
Γ(α1 + q1)Γ(αp)
Γ(α1 + αp + q1)
Γ(α2 + q2)Γ(α1 + αp + q1)
Γ(α1 + α2 + αp + q1 + q2). . .
Γ(αp−1 + qp−1)Γ(α1 + α2 + . . . + αp−2 + αp + q1 + . . . + qp−2)
Γ(α1 + α2 + . . . + αp−2 + αp−1 + αp + q1 + . . . + qp−2 + qp−1)
=Γ(α1 + α2 + . . . + αp)Γ(α1 + q1)Γ(α2 + q2) . . . Γ(αp−1 + qp−1)
Γ(α1 + α2 + . . . + αp + q1 + . . . + qp−1)Γ(α1)Γ(α2) . . . Γ(αp−1). (2.2.1.4)
Se q1 = n e q2 = q3 = . . . = qp−1 = 0 temos
E(Y n1 ) =
Γ(α1 + α2 + . . . + αp)Γ(α1 + n)Γ(α2) . . . Γ(αp−1)
Γ(α1 + α2 + . . . + αp + n)Γ(α1)Γ(α2) . . . Γ(αp−1)
=Γ(α1 + α2 + . . . + αp)Γ(α1 + n)
Γ(α1 + α2 + . . . + αp + n)Γ(α1),
e, usando a relacao (2.1.1.4), temos
E(Y n1 ) =
Γ(∑p
j=1 αj)(α1 + (n− 1))(α1 + (n− 2)) . . . (α1 + 1)α1Γ(α1)(Γ(α1))−1
(∑p
j=1 αj + (n− 1))(∑p
j=1 αj + (n− 2)) . . . (∑p
j=1 αj + 1)(∑p
j=1 αj)Γ(∑p
j=1 αj)
=(α1 + (n− 1))(α1 + (n− 2)) . . . (α1 + 1)α1
(∑p
j=1 αj + (n− 1))(∑p
j=1 αj + (n− 2)) . . . (∑p
j=1 αj + 1)(∑p
j=1 αj).
Logo, o n-esimo momento em torno de zero da distribuicao Dirichlet, com j = 1, 2, . . . , p− 1sera
E(Y nj ) =
(αj + (n− 1))(αj + (n− 2)) . . . (αj + 1)αj
(∑p
t=1 αt + (n− 1))(∑p
t=1 αt + (n− 2)) . . . (∑p
t=1 αt + 1)(∑p
t=1 αt).
Entao, o valor esperado de Yj , com j = 1, 2, . . . , p − 1, obtido quando n = 1 na expressaoacima, e
E(Yj) =αj∑pt=1 αt
,
e, se n = 2,
E(Y 2j ) =
αj(αj + 1)
(∑p
t=1 αt)(∑p
t=1 αt + 1),
14
logo, a variancia de Yj , com j = 1, 2, . . . , p− 1 e
Var(Yj) = E(Y 2j )− [E(Yj)]
2
=αj(αj + 1)
(∑p
t=1 αt)(∑p
t=1 αt + 1)− α2
j
(∑p
t=1 αt)2
=αj(
∑pt6=j αt)
(∑p
t=1 αt)2(∑p
t=1 αt + 1).
A Figura 2.2.1.2 apresenta diferentes densidades Dirichlet, quando p = 3, correspon-dentes a alguns valores dos parametros (α1, α2, α3). Observamos que quando α1, α2 e α3
aumentam, a variabilidade da distribuicao diminui, o que e confirmado pela expressao davariancia.
Para o calculo da covariancia basta fazer q1 = q2 = 1 e q3 = . . . = qp−1 = 0 em (2.2.1.4):
E(Y1Y2) =Γ(α1 + α2 + . . . + αp)Γ(α1 + 1)Γ(α2 + 1)Γ(α3) . . . Γ(αp−1)
Γ(α1 + α2 + . . . + αp + 1 + 1)Γ(α1)Γ(α2)Γ(α3) . . . Γ(αp−1)
=Γ(α1 + α2 + . . . + αp)Γ(α1 + 1)Γ(α2 + 1)
Γ(α1 + α2 + . . . + αp + 1 + 1)Γ(α1)Γ(α2)
=Γ(α1 + α2 + . . . + αp)α1Γ(α1)α2Γ(α2)
Γ(α1 + α2 + . . . + αp + 1 + 1)Γ(α1)Γ(α2)
=Γ(α1 + α2 + . . . + αp)α1α2
Γ[(α1 + α2 + . . . + αp + 1) + 1]
=α1α2
(α1 + α2 + . . . + αp + 1)(α1 + α2 + . . . + αp),
entao, para j 6= j∗, com j, j∗ = 1, . . . , p− 1
E(YjYj∗) =αjαj∗
(∑p
t=1 αt)(∑p
t=1 αt + 1),
portanto,
15
Cov(Yj , Yj∗) = E(YjYj∗)− E(Yj)E(Yj∗)
=αjαj∗
(∑p
t=1 αt)(∑p
t=1 αt + 1)− αjαj∗
(∑p
t=1 αt)2
= − αjαj∗(∑p
t=1 αt)2(∑p
t=1 αt + 1).
A log-densidade de (2.2.1.1) e da forma
log Γ( p∑
j=1
αj
)−
p∑
j=1
log Γ(αj) +
p∑
j=1
(αj − 1) log yj ,
assim, as derivadas de primeira ordem da log-densidade da distribuicao Dirichlet sao
∂ log f(y1, . . . , yp−1; αj)
∂αj= ψ
( p∑
t=1
αt
)− ψ(αj) + log yj ,
com j = 1, . . . , p e ψ(.) denotando a funcao digamma. Como o valor esperado da funcaoescore e nulo, ou seja,
E
{∂ log f
∂αj
}= 0,
temos que
E
{∂ log f
∂αj
}= E
{ψ
( p∑
t=1
αt
)− ψ(αj) + log yj
}
= ψ( p∑
t=1
αt
)− ψ(αj) + E[log yj ] = 0,
logo
E[log yj ] = ψ(αj)− ψ( p∑
t=1
αt
). (2.2.1.5)
Considerando a funcao de densidade dada em (2.2.1.1), a funcao de log-verossimilhancabaseada em uma amostra de N observacoes e dada por
`(α1, . . . , αp) =N∑
i=1
`i(αi1, . . . , αip), (2.2.1.6)
16
Figura 2.2.1.2: Graficos das densidades Dirichlet, quando p = 3,para diferentes valores de (α1, α2, α3).
x
y
densidade
(5,10,15)
x
y
densidade
(30,35,40)
x
y
densidade
(5,5,5)
x
y
densidade
(30,30,30)
17
onde
`i(αi1, . . . , αip) = log
{Γ(
∑pj=1 αij)∏p
j=1 Γ(αij)
p−1∏
j=1
yαij−1ij
[1−
p−1∑
j=1
yij
]αip−1}
= log
{Γ(
∑pj=1 αij)∏p
j=1 Γ(αij)
p∏
j=1
yαij−1ij
}
= log Γ( p∑
j=1
αij
)−
p∑
j=1
log Γ(αij) +
p∑
j=1
(αij − 1) log yij .
Portanto,
`(α1, . . . , αp) =N∑
i=1
{log Γ
( p∑
j=1
αij
)−
p∑
j=1
log Γ(αij) +
p∑
j=1
(αij − 1) log yij
}. (2.2.1.7)
Nas duas secoes seguintes sao considerados dois modelos de regressao para modelarvariaveis aleatorias que seguem uma distribuicao Dirichlet, a qual possui densidade dada por(2.2.1.1), indexada pelos parametros α1, . . . , αp.
2.2.2. Modelo 1
Para obter uma estrutura de regressao que permita modelar a media de uma variavelresposta juntamente com um parametro de precisao, usamos uma parametrizacao diferentedaquela mostrada na densidade (2.2.1.1). Seja φ = α1 + α2 + . . . + αp e µj = αj/φ, com
j = 1, 2, . . . , p − 1 e µp = 1 −∑p−1j=1 µj . A funcao de densidade de (Y1, . . . , Yp−1), dada em
(2.2.1.1), pode ser reescrita, na nova parametrizacao, como
f(y1, . . . , yp−1; µ1, . . . , µp−1; φ) =
Γ(φ)∏p
j=1Γ(φµj)
∏p−1j=1 y
φµj−1j (1−∑p−1
j=1 yj)φµp−1 y ∈ R,
0 c.c,(2.2.2.1)
com j = 1, 2, . . . , p− 1. O valor esperado e a variancia de Yj sao dados por
E(Yj) =αj
φ=
φµj
φ= µj ,
Var(Yj) =αj(φ− αj)
φ2(φ + 1)=
φµj(φ− φµj)
φ2(φ + 1)=
µj(1− µj)
φ + 1=
V (µj)
φ + 1,
(2.2.2.2)
18
a covariancia entre Yj e Yj∗ para j 6= j∗ e dada por
Cov(Yj , Yj∗) = − αjαj∗(∑p
t=1 αt)2(∑p
t=1 αt + 1)
=φµj φµj∗φ2(φ + 1)
=µjµj∗φ + 1
,
onde µj e a media da variavel resposta, V (µj) = µj(1−µj) denota a funcao variancia, com je j∗ ∈ {1, 2, . . . , p−1}, e φ pode ser interpretado como um parametro de precisao, no sentidode que, para µj fixo, se o valor de φ aumenta, a variancia da variavel resposta diminui. Omodelo considerado aqui e obtido supondo que a media de cada Yij , com i = 1, . . . , N , podeser escrita como
µij =
h−1(ηij) se j = 1
h−1(ηij)[1−∑j−1
t=1 µit] se j = 2, 3, . . . , p− 1
=
g(ηij) se j = 1
g(ηij)[1−∑j−1
t=1 µit] se j = 2, 3, . . . , p− 1
(2.2.2.3)
onde h−1(. ) = g(. ) e uma funcao de ligacao que assume valores reais em (0, 1), estritamentemonotona e duas vezes diferenciavel e
ηij = xi1β1j + xi2β2j + xi3β3j + . . . + xikβkj
= x>i β˜
j ,
sendo x>i = (xi1, . . . , xik), com i = 1, . . . , N , e β˜ j = (β1j , β2j , . . . , βkj)
>. Os parametros
da regressao, β˜ j , com j = 1, . . . , p − 1, sao desconhecidos e x>i , com i = 1, . . . , N , sao
observacoes em k covariaveis (k < N), que assumem valores fixos e conhecidos. A vantagemdeste modelo e que a media da variavel resposta e modelada diretamente, como se usa napratica.
A relacao funcional usada para h(. ) pode ser, por exemplo, a funcao logit, ou seja,
h−1(ηij) = g(ηij) =eηij
1 + eηij, i ∈ {1, . . . , N}, j ∈ {1, . . . , p− 1}.
Considerando a funcao de densidade dada em (2.2.2.1) e B = [ β˜
1 β˜
2 . . . β˜
p−1] a ma-
triz dos parametros β’s, a funcao de log-verossimilhanca baseada em uma amostra de N
19
observacoes e dada por
`(B, φ) =N∑
i=1
`i(B, φ)
onde
`i(B, φ) = log
{Γ(φ)∏p
j=1 Γ(φµij)
p−1∏
j=1
yφµij−1ij
[1−
p−1∑
j=1
yij
]φµip−1}
= log Γ(φ)−p∑
j=1
log Γ(φµij) +
p∑
j=1
(φµij − 1) log yij ,
sendo µij dado em (2.2.2.3) e yip = 1−∑p−1j=1 yij .
Portanto,
`(B, φ) =N∑
i=1
{log Γ(φ)−
p−1∑
j=1
log Γ(φµij)− log Γ[φ(1−
p−1∑
j=1
µij
)]
+
p−1∑
j=1
(φµij − 1) log yij +[φ(1−
p−1∑
j=1
µij
)− 1
](1−
p−1∑
j=1
log yij
)}.
(2.2.2.4)
Para a obtencao da funcao escore precisamos da primeira derivada da funcao log-ve-rossimilhanca, (2.2.2.4) com relacao aos parametros desconhecidos. Como e apresentado noApendice 1, para v = 1, . . . , k e u = 1, . . . , p− 1
∂` (B; φ)
∂βvu= g′(ηiu) [1−
u−1∑
t=1
µit]
{log yiu − ψ(φµiu)−
[log yi(u+1) − ψ(φµi(u+1))
]g(ηi(u+1))
−p−1∑
j=u+2
[log yij − ψ(φµij)
]g(ηij)
j−1∏
t=u+1
[1− g(ηit)]−(
log[1−
p−1∑
j=1
yij
]
− ψ[φ(1−
p−1∑
j=1
µij
)])(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)}
(2.2.2.5)e
∂` (B; φ)
∂φ=
N∑
i=1
{ψ(φ) +
p∑
j=1
[ψ(φµij)− log yij ]µij
}=
N∑
i=1
di, (2.2.2.6)
20
onde
di = ψ(φ) +
p∑
j=1
[ψ(φµij)− log yij ]µij . (2.2.2.7)
As derivadas apresentadas em (2.2.2.5) e (2.2.2.6) podem ser expressas matricialmente.Seja X a matriz formada pelas covariaveis do modelo, com dimensao N × k e x>v =[x1v x2v . . . xNv] o v-esimo vetor coluna de X. Defina a matriz C de dimensao N × (p− 1)com cu = [c1u c2u . . . cNu], o u-esimo vetor coluna, dado por
ciu = g′(ηiu) [1−u−1∑
t=1
µit]
{log yiu − ψ(φµiu)−
[log yi(u+1) − ψ(φµi(u+1))
]g(ηi(u+1))
−p−1∑
j=u+2
[log yij − ψ(φµij)
]g(ηij)
j−1∏
t=u+1
[1− g(ηit)]−(
log[1−
p−1∑
j=1
yij
]
− ψ[φ(1−
p−1∑
j=1
µij
)])(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)}.
Seja D = (d1 d2 . . . dN ), com di definido em (2.2.2.7), e 1I = (1, . . . , 1)> o vetor de uns dedimensao N × 1. Entao a equacao (2.2.2.5) pode ser reescrita como
∂` (B; φ)
∂βvu= φx>v cu, (2.2.2.8)
logo, de (2.2.2.8) e (2.2.2.6)
∂`(B, φ)
∂B= UB (B, φ) = φX>C
e∂`(B, φ)
∂φ= Uφ(B, φ) = D1I.
Os estimadores de maxima verossimilhanca de B e φ sao obtidos pela solucao do sistema
UB (B, φ) = 0
Uφ(B, φ) = 0
e tais estimadores nao possuem forma fechada. Assim, eles devem ser obtidos numericamen-te usando um algoritmo de otimizacao nao-linear, como o algoritmo de Newton ou algumalgoritmo quasi-Newton, como por exemplo, BFGS. Usando a ideia de Ferrari & Cribari-Neto(2004), no esquema iterativo usamos como valor inicial para B a estimativa dos mınimosquadrados ordinarios, (X>X)−1X>Z com Z = [z1 z2 . . . zN ]> onde
zi =
[h(yi1) h
(yi2
1− yi1
)h
(yi3
1− yi1 − yi2
). . . h
(yi(p−1)
1− yi1 − . . .− yi(p−2)
)]
21
e h(y) = log[y/(1− y)]. Usamos tambem o valor inicial para φ dado pela expressao
1
N(p− 1)
N∑
i=1
p−1∑
j=1
µij(1− µij)
σ2ij
− 1,
onde µij e obtido aplicando h−1(. ) ao i-esimo valor ajustado da regressao linear de Z em
X, ou seja, µij = h−1j (x>i (X>X)−1XTzj), e σ2
ij = e>j ej/[(N − k){h′(µij)}2], sendo ej =
zj − (X>X)−1XTzj o vetor de resıduos de mınimos quadrados da regressao linear sob avariavel resposta transformada.
A matriz de informacao de Fisher e dada por
I(B; φ) =
(Iββ Iβφ
Iφβ Iφφ
), (2.2.2.9)
onde
Iββ = Var
(∂` (B; φ)
∂B
)
= E
[∂` (B; φ)
∂B
∂` (B; φ)
∂B>
]− E
[∂` (B; φ)
∂B
]E
[∂` (B; φ)
∂B>
]
= −E
[∂2` (B; φ)
∂B ∂B>
]− E
[∂` (B; φ)
∂B
]E
[∂` (B; φ)
∂B>
]
(2.2.2.10)
mas
E
[∂` (B; φ)
∂B
]= 0
logo
Iββ = −E
[∂2` (B; φ)
∂B ∂B>
].
Observamos, pelo Apendice 1, que para v, n ∈ {1, 2, . . . , k} e u, m ∈ {1, 2, . . . , p − 1},temos
−E
[∂2` (B; φ)
∂βmu∂βvu
]=
N∑
i=1
Xiv Xin U(1)mu,i,
onde U(1)mu,i e definido de acordo com os casos abaixo.
22
Caso 1: Se u = m,
U(1)uu,i = φ2 g′(ηiu)2 [1−
u−1∑
t=1
µit]2
{ψ′(φµiu) + ψ′(φµi(u+1)) g(ηi(u+1))
2
+
p−1∑
j=u+2
ψ′(φµij)g(ηij)2
j−1∏
t=u+1
[1− g(ηit)]2 + ψ′
[φ(1−
p−1∑
j=1
µij
)]
(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)2}.
Caso 2: Se u > m,
U(1)mu,i = φ2 g′(ηiu)g′(ηim) [1−
u−1∑
t=1
µit] [1−m−1∑
t=1
µit]
[−ψ′(φµiu)g(ηiu)
u−1∏
t=m+1
[1− g(ηit)]
+ ψ′(φµi(u+1)) g(ηi(u+1))2
u∏
t=m+1
[1− g(ηit)] +
p−1∑
j=u+2
ψ′(φµij) g(ηij)2
j−1∏
t=m+1
[1− g(ηit)]
j−1∏
t=u+1
[1− g(ηit)] + ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1)
−p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)].
Caso 3: Se u < m,
U(1)mu,i = φ2 g′(ηiu) g′(ηim) [1−
u−1∑
t=1
µit] [1−m−1∑
t=1
µit]
[− ψ′(φµim) g(ηim)
m−1∏
t=u+1
[1− g(ηit)]
+ ψ′(φµi(m+1)) g(ηi(m+1))2
m∏
t=u+1
[1− g(ηit)] +
p−1∑
j=m+2
ψ′(φµij)g(ηij)2
j−1∏
t=m+1
[1− g(ηit)]
j−1∏
t=u+1
[1− g(ηit)] + ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1))
−p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)].
23
Portanto,Iββ = (Ip−1 ⊗X)> U (Ip−1 ⊗X),
onde Ip−1 e uma matriz identidade de dimensao (p− 1)× (p− 1), o sımbolo ⊗ representa oproduto de Kronecker e U e uma matriz N(p−1)×N(p−1) particionada em (p−1)×(p−1)blocos diagonais de dimensao N ×N da forma
Umu = diag (U(1)mu,1, U
(1)mu,2, . . . , U
(1)mu,N ),
com u e m ∈ {1, 2, . . . , p−1}. Note ainda que (Ip−1⊗X) tem dimensao N(p−1)×k(p−1),o que implica que a matriz Iββ tem dimensao k(p− 1)× k(p− 1).
Observamos ainda, tambem pelo Apendice 1, que para v = 1, 2, . . . , k e u = 1, 2, . . . , p−1,
−E
[∂2` (B; φ)
∂φ∂βvu
]=
N∑
i=1
XivV(1)iu ,
onde
V(1)iu = φ g′(ηiu) [1−
u−1∑
t=1
µit]
[ψ′(φµiu) µiu − ψ′(φµi(u+1)) µi(u+1) g(ηi(u+1))
−p−1∑
j=u+2
ψ′(φµij) µij g(ηij)
j−1∏
t=u+1
[1− g(ηit)]− ψ′[φ(1−
p−1∑
j=1
µij
)] (1−
p−1∑
j=1
µij
)
(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]
e
−E
[∂2` (B; φ)
∂φ2
]=
N∑
i=1
{−ψ′(φ) +
p∑
j=1
ψ′(φµij) µ2ij
}.
Logo
Iβφ = I>φβ = vec(X> V (1)),
onde vec(.) e o operador que transforma uma matriz em vetor coluna sobrepondo as colunas
da matriz e V (1) e uma matriz de dimensao N × (p− 1); entao Iβφ tem dimensao k× (p− 1),e Iφφ e um escalar, dado por
Iφφ =N∑
i=1
{−ψ′(φ) +
p∑
j=1
ψ′(φµij) µ2ij
}.
Portanto a matriz de informacao de Fisher I(B; φ) tem dimensao (k(p−1)+1)×(k(p−1)+1).Usando a expressao padrao para a inversa de matrizes particionadas temos que a inversa
da matriz de informacao de Fisher (2.2.2.9) e
24
I(B; φ)−1 =
(Iββ Iβφ
Iφβ Iφφ
)−1
=
(Iββ Iβφ
Iφβ Iφφ
),
onde, por Rao (1973),
Iββ = I−1ββ + I−1
ββ Iβφ
[Iφφ − Iφβ I−1
ββ Iβφ
]−1(I−1ββ Iβφ
)>,
Iβφ = −I−1ββ Iβφ
[Iφφ − Iφβ I−1
ββ Iβφ
]−1,
Iφβ = −[Iφφ − Iφβ I−1
ββ Iβφ
]−1[I−1ββ Iβφ
]>e
Iφφ =[Iφφ − Iφβ I−1
ββ Iβφ
]−1.
Diante das condicoes de regularidade para estimacao de maxima verossimilhanca discu-tidas em Cordeiro (1999), se o tamanho da amostra N e grande, tem-se
(vec(B)
φ
)∼ N
((vec(B)
φ
), I(B; φ)−1
),
aproximadamente, onde B e φ sao os estimadores de maxima verossimilhanca da matriz deparametros B e do parametro φ, respectivamente.
2.2.3. Modelo 2
Nesta secao definimos o segundo modelo de regressao Dirichlet considerado. Este modeloe obtido supondo que αij = g(ηij), ou seja, a media de cada Yij , com i = 1, . . . , N ej = 1, . . . , p, pode ser escrita como
µij =g(ηij)
g(ηi1) + g(ηi2) + . . . + g(ηip),
onde ηij e definido da mesma forma do primeiro modelo e g(·) = h−1(·) onde h(·) e umafuncao de ligacao que assume valores reais em (0,∞), estritamente monotonica e duas vezesdiferenciavel; neste trabalho consideramos g(ηij) = eηij .
25
Sabemos que αij = g(ηij) = eηij onde ηij = x>i β˜ j , com β
˜ j = (β1j , β2j , . . . , βkj)> e
xi = (xi1, . . . , xik)>. Seja x∗i tal que x∗il = xil + 1, onde l = 1, 2, . . . , k; temos ainda que
α∗ij = g(η∗ij) = eη∗ij , onde η∗ij = x∗i> β
˜ j. Entao
α∗ijαij
=eη∗ij
eηij= e
x∗i>
β
˜j −x>i β
˜j
= eβlj ,
logo
βlj = log(α∗ij)− log(αij).
Entao os parametros βlj ’s representam a variacao no log αij quando os xil’s aumentam deuma unidade.
A vantagem deste modelo e que se permutarmos as componentes, Yj , de Y as compo-nentes estimadas, µj , tambem sao permutadas; isso decorre da nao dependencia da com-ponente µj de componentes anteriores, diferentemente do que ocorre no modelo 1. E adesvantagem e que este modelo nao modela diretamente a media, como se usa na pratica.
Considerando a funcao log-verossimilhanca dada em (2.2.2.4), temos que sua derivadacom relacao aos parametros deconhecidos e dada pela expressao abaixo; os detalhes daderivacao podem ser visto no Apendice 2.
∂` (B)
∂βvu=
N∑
i=1
Xiv
{g′(ηiu)
[ψ(φi) + log yiu − ψ(φiµiu)
]}
=N∑
i=1
Xivciu, v = 1, . . . , k e u = 1, . . . , p
(2.2.3.1)
onde
ciu = g′(ηiu)[ψ(φi) + log yiu − ψ(φiµiu)
](2.2.3.2)
e
φi =
p∑
j=1
g(ηij).
A derivada apresentada em (2.2.3.1) pode ser expressa matricialmente, ou seja,
∂` (B)
∂B= UB (B) = X>C,
onde X e a matriz formada pelas covariaveis do modelo, com dimensao N × k e a matriz Cdefinida em (2.2.3.2) tem dimensao N × p.
Os estimadores de maxima verossimilhanca de B sao obtidos pela solucao do sistema
UB (B) = 0
26
e, como ja foi dito no estudo do primeiro modelo, estes estimadores nao possuem formafechada e para serem obtidos deve-se usar um algoritmo de otimizacao nao-linear. Para oesquema iterativo, consideramos a matriz nula como valor inicial para B.
Neste presente modelo, a matriz de informacao de Fisher de B e obtida fazendo calculosanalogos a (2.2.2.10). Pelo Apendice 2, temos que para v, n ∈ {1, 2, . . . , k} e u, m ∈{1, 2, . . . , p}
−E
[∂2` (B)
∂βmu∂βvu
]=
N∑
i=1
Xiv Xin U(2)mu,i,
onde
U(2)mu,i =
− g′(ηiu)2[ψ′(φi)− ψ′(φiµiu)
]se u = m
− g′(ηiu) g′(ηim) ψ′(φi) se u 6= m
Logo, a matriz de informacao de Fisher de B e
I(B) = (Ip ⊗X)> U∗ (Ip ⊗X),
onde Ip e uma matriz identidade de ordem p, o sımbolo ⊗ representa o produto de Kroneckere U∗ e uma matriz Np × Np particionada em p × p blocos diagonais de dimensao N × N ,U∗
mu, definidos por
U∗mu = diag (U
(2)mu,1, U
(2)mu,2, . . . , U
(2)mu,N ),
com u e m ∈ {1, 2, . . . , p}. Ainda, (Ip ⊗ X) tem dimensao Np × kp, o que implica que amatriz I(B) tem dimensao kp× kp.
Como ja foi dito, se o tamanho da amostra N e grande, tem-se
vec(B) ∼ N(vec(B), I(B)−1
),
aproximadamente, onde B e a matriz de estimadores de maxima verossimilhanca da matrizde parametros B.
27
Capıtulo 3
Estimador do Posto
3.1. Consideracoes Iniciais
Muitos modelos sao especificados por meio do posto de uma certa matriz desconhecidapara a qual uma estimativa consistente existe. Por exemplo, o problema classico de iden-tificacao em modelos de equacoes simultaneas lineares envolve o posto de uma submatrizparticular de forma reduzida. No que se refere a verossimilhanca, o posto da matriz de in-formacao relata identificabilidade de um vetor de parametros (Hsiao, 1986). Lewbel (1991)e Lewbel e Perraudin (1995) mostraram que varios resultados na teoria de consumo podemdepender do verdadeiro posto de certas matrizes a serem estimadas.
Determinar o posto de uma matriz e uma tarefa ainda mais difıcil se a matriz contemerros, que e sempre o caso em aplicacoes estatısticas baseadas em matrizes estimadas. Ometodo comumente usado para avaliar o posto de uma matriz baseia-se na fatorizacao QR,ver Stewart (1984). Esta ferramenta, contudo, somente ajuda a tomar decisoes e nao cons-titui um teste. Gill e Lewbel (1992) introduzem um teste para o posto baseado na decom-posicao Lower-Diagonal-Upper (LDU). Mas a distribuicao assintotica dada pela estatısticade teste e incorreta, exceto para alguns casos especiais. Cragg e Donald (1996) mostramuma modificacao apropriada. Seu teste tem a vantagem de possuir uma distribuicao qui-quadrado. Anderson e Kunitomo (1994), Robin e Smith (2000) definem uma estatıstica deteste que e N vezes uma funcao do menor valor singular, onde esta estatıstica de teste ea da raiz caracterıstica (CRT). Esta classe de estatısticas (CRT) inclui muitas estatısticasde teste particulares como estatıstica da razao de verossimilhanca, a estatıstica de escoree estatıstica de Wald, ver Anderson e Kunitomo (1994). Segundo Robin e Smith (2000)a estatıstica CRT e distribuıda assintoticamente como uma combinacao linear de variaveisaleatorias independentes com distribuicoes qui-quadrado. A desvantagem desta estatıstica eque as matrizes pesos sao desconhecidas e devem ser estimadas; na amostra, suas estimativasintroduzem variabilidade, e, consequentemente, menos poder no procedimento do teste.
Sabemos que o posto de uma matriz e igual ao numero de valores singulares diferentes dezero. Assim, um teste formal pode ser expresso como um teste do numero de valores singu-lares nulos da matriz. Ratsimalahelo (2003) construiu um teste de posto baseado nos menoresvalores singulares de uma matriz estimada. Ele usou a teoria da perturbacao de matrizespara estimar uma base satisfatoria do nucleo da matriz e para determinar distribuicoes limitepara os estimadores dos menores valores singulares da matriz. O teste permite determinarquantos valores singulares da estimativa de uma matriz sao significantemente diferentes dezero. A vantagem deste teste sobre os testes padroes e a facilidade de seu calculo.
Os coeficientes do modelo de regressao Dirichlet constituem uma matriz B. Se B naotem posto completo, ou seja, se algumas de suas colunas (ou linhas) podem ser escritascomo combinacoes lineares de outras, entao a quantidade de parametros do modelo a seremestimados e menor. Entao nosso objetivo neste trabalho e estimar o posto b da matriz B
28
de parametros do modelo de regressao Dirichlet. Para isso vamos utilizar a estatıstica deteste L(b), proposta por Ratsimalahelo (2003), associada a estrategia de teste sequencial eaos criterios de informacao BIC (Bayesian Information Criteria) e HQIC (Hannan QuinnInformation Criteria).
3.1.1. Teste de Hipotese
Consideramos uma matriz nao-observavel B de dimensao k × q, com posto verdadeirodesconhecido b > 0; sem perda de generalidade, assumimos que k ≥ q.
Seja B, estimador consistente de B tal que
√N vec(B −B)
d7−→ N (0, Σ), (3.1.1.1)
onde a matriz de covariancia Σ tem dimensao kq × kq e e nao-nula.Ratsimalahelo (2003) construiu um teste para o posto b de B, r(B). Suponha que
desejamos testar a hipotese nulaH0 : r(B) = b
contra a hipotese alternativaH1 : r(B) > b.
O posto verdadeiro de B e desconhecido, mas B com probabilidade um tem posto com-
pleto. Assim, a hipotese nula baseada em um teste usando B e satisfeita somente assin-toticamente em N . Entao, o interesse se prende a testes estatısticos que nos habilitam a
determinar o posto de B, dado o estimador B.
Seja B a matriz perturbada
B = B + εC, (3.1.1.2)
onde a matriz εC e a perturbacao da matriz B. Assumimos que a matriz B, k×q, tem postob, mas que a matriz perturbacao C, composta de valores pequenos, tem posto completo.Entao, usando (3.1.1.1) e o teorema central do limite, os elementos da matriz perturbacaotem media zero e variancia de ordem N−1. Isto implica que o termo dominante da matrizεC e de ordem N−1/2, denotado por
εC = Op(N−1/2),
ou seja, εC e de ordem no maximo N−1/2 em probabilidade, isto e, ∀ δ > 0, ∃ Mδ tal que
P
(∣∣∣∣εC
N−1/2
∣∣∣∣ ≥ Mδ
)≤ δ.
A analise de perturbacao de matrizes estuda a sensibilidade dos autoelementos da matriza uma perturbacao em suas componentes. Existem bons desenvolvimentos matematicos paraperturbacao de matrizes apresentados por Kato (1982), Golub e Van Loan (1996), Stewarte Sun (1990).
29
Uma boa tecnica para determinar o posto de uma matriz e usar a decomposicao damatriz em valores singulares e contar o numero de valores singulares diferentes de zero. Estatecnica esta descrita na proxima secao.
3.1.2. Decomposicao em Valores Singulares e a Estatıstica de Teste
A decomposicao em valores singulares de uma matriz foi proposta de forma independentepor Beltrami em 1873 e Jordan em 1874. Sua generalizacao para espacos de dimensao infinitafoi desenvolvida em um contexto de equacoes integrais por Smith (1907) e Weyl (1912).
Pelo teorema (Golub e Van Loan, 1996) de existencia da decomposicao em valores sin-gulares, temos que se B e uma matriz real de dimensao k × q, entao, existem duas matrizesortogonais
U = [u1, u2, . . . , uk] ∈ IRk×k e V = [v1, v2, . . . , vq] ∈ IRq×q
tais que
U>BV = diag(λ1, λ2, . . . , λδ) = D,
onde λ1 ≥ λ2 ≥ . . . ≥ λδ sao os valores singulares de B e δ = min(k, q).A decomposicao em valores singulares da matriz B de dimensao k×q e B = UDV >, com
U e V ortogonais, onde U tem dimensao k × k, D e uma matriz diagonal retangular k × qe V tem dimensao q × q. Um algoritmo para decompor a matriz B em valores singulares sek > q e
(I) Encontre os autovalores da matriz B>B e os organize em ordem decrescente;
(II) Encontre o numero de autovalores diferentes de zero da matriz B>B;
(III) Encontre autovetores ortonormais vi, com i = 1, 2, . . . , q, da matriz B>B, correspon-dentes aos seus respectivos autovalores, calculados em (II);
(IV) Forme uma matriz diagonal D ∈ IRk×q colocando na diagonal principal as raızesquadradas
√λ∗i dos q autovalores da matriz B>B em ordem decrescente;
(V) Encontre os primeiros q vetores colunas de uma matriz U ∈ IRk×k tal que
ui = (√
λ∗i )−1Bvi, com i = 1, 2, . . . , q;
(VI) Complete a matriz U com (k − q) vetores ortonormais usando o processo de ortonor-malizacao de Gram-Schmidt.
Processo de ortonormalizacao de Gram-Schmidt: Se (v1, v2, . . . , vk) e uma k-uplade vetores linearmente independentes em um espaco vetorial euclidiano V , entao, definindov1 := v1/‖v1‖ e utilizando a formula de recorrencia
νj+1 :=νj+1 −
∑ji=1〈νj+1, νi〉νi
‖νj+1 −∑j
i=1〈νj+1, νi〉νi‖,
30
para j = 1, 2, . . . , k − 1, obtemos um sistema ortonormal (v1, v2, . . . , vk). Os primeiros j ve-tores v1, v2, . . . , vj geram o mesmo subespaco que o conjunto de vetores originais v1, v2, . . . , vj .Se (v1, v2, . . . , vn) em particular era uma base de V , entao (v1, v2, . . . , vn) sera uma baseortonormal de V . Os sımbolos 〈., .〉 e ‖.‖ sao o produto interno entre dois vetores e a normaeuclideana de um vetor, respectivamente.
Podemos escrever ainda a decomposicao em valores singulares de B na forma
B = UDV > = ( U1 U2 )
D1 0
0 D2
V >1
V >2
onde U1, com dimensao k × b, e uma base ortonormal do subespaco gerado pelas colunasde B, U2, com dimensao k × (k − b), e uma base ortonormal do complemento ortogonal dosubespaco gerado pelas colunas de B, V1, com dimensao q × b, e uma base ortonormal dosubespaco gerado pelas linhas de B e V2, q× (q− b), e uma base ortonormal do espaco nulode B. Por causa da ortogonalidade de U e V , ou seja, U>U = Ik×k e V >V = Iq×q, a matrizD pode ser escrita como
D =
U>1
U>2
B ( V1 V2 ) =
U>1 BV1 U>
1 BV2
U>2 BV1 U>
2 BV2
;
assim
D1 = U>1 B V1 = diag (λ1, λ2, . . . , λb),
D2 = U>2 B V2 = Ok−b, q−b,
onde Ok−b, q−b e uma matriz nula de dimensao k − b× q − b, e as expressoes
U>1 B V2 = Ob, q−b e U>
2 B V1 = Ok−b, b
sao validas, pois B V2 = 0 e U>2 B = (B>U2)
> = 0.
Seja B um estimador da matriz B; entao, sua decomposicao em valores singulares e
B = UDV > =(U1 U2
)
D1 0
0 D2
V >1
V >2
.
Particionamos as matrizes U , V , e D de acordo com a particao feita para U , V , e D, onde
U1 tem b colunas e U2 tem k − b colunas. Os espacos gerados por U1, U2, V1 e V2 sao
aproximacoes para os subespacos correspondentes a U1, U2, V1 e V2. A matriz diagonal Dpode ser escrita como
D =
U>1
U>2
B
(V1 V2
)=
U>1 BV1 U>
1 BV2
U>2 BV1 U>
2 BV2
,
31
que satisfaz as equacoes
D1 = U>1 B V1 = diag (λ1, λ2, . . . , λb) com λi ≥ λi+1
D2 = U>2 B V2 = diag (λb+1, λb+2, . . . , λq)
e
U>2 B V1 = 0 = U>
1 B V2
Definimos
L = U>2 B V2,
que define uma matriz aleatoria como funcao da matriz aleatoria B. Se a hipotese nula everdadeira entao D2 = Ok−b, q−b. Neste caso, o vetor
√N l, l = vecL, e assintoticamen-
te distribuıdo como uma normal com media zero e matriz de covariancia Q, de dimensao(k − b)(q − b)× (k − b)(q − b), finita e positiva definida, dada por
Q = (V >2 ⊗ U>
2 ) Σ (V2 ⊗ U2).
Sob estas condicoes e sob a hipotese nula
H0 : r(B) = b,
a estatıstica de teste, proposta por Ratsimalahelo (2003), dada por
L(b) = N l > Q−1 l,
onde
Q−1 = (V >2 ⊗ U>
2 ) Σ−1 (V2 ⊗ U2) e l = vec(U>2 B V2),
converge em distribuicao para uma qui-quadrado com (k − b)(q − b) graus de liberdade, ouseja,
L(b)d7−→ χ2
(k−b)(q−b).
Tres procedimentos foram considerados para estimar o posto de B: o teste sequencial e oscriterios de informacao BIC e HQIC. Estes procedimentos estao descritos nas proximas secoesjuntamente com condicoes para consistencia forte dos estimadores baseados nos mesmos.
3.2. Procedimento de Teste Sequencial
Sabemos que o procedimento chamado de teste sequencial nao conduz a uma estimativaconsistente do verdadeiro valor do posto da matriz a nao ser que algum ajuste seja feitono nıvel de significancia, ver Cragg e Donald (1997); Robin e Smith (2000). Ratsimalahelo(2003) propoe um nıvel de significancia apropriado para a obtencao de consistencia forte
32
do estimador do posto da matriz B usando o procedimento de teste sequencial, supondo
consistencia forte de B.A estatıstica de teste L(b) tem distribuicao assintotica qui-quadrado com (k − b)(q − b)
graus de liberdade, ou ainda, χ2(k−b)(q−b). Seja γb CN > 0 o valor crıtico da estatıstica de teste
L(b) para o nıvel de significancia escolhido. O valor γb representa o quantil correspondenteda distribuicao χ2
(k−b)(q−b) e CN e uma sequencia predeterminada de numeros. Para um
estimador fortemente consistente do posto da matriz B, Ratsimalahelo (2003) assume que afuncao CN satisfaz as tres condicoes
(i) CN > 0
(ii) CN/N → 0 (3.2.1)
(iii) CN/ log log(N) →∞Ha varias possıveis escolhas de CN satisfazendo (i)-(iii) de (3.2.1); para o nosso caso
escolhemos CN =√
log(N).O teste sequencial e feito da seguinte forma: Comecamos com b = 0, daı verificamos
se L(b) ≤ γb CN , se isso acontecer entao o estimador de b sera 0, ou seja, b = 0, senaoverificaremos a desigualdade quando b = 1. E esse processo e repetido ate que L(b) ≤ γb CN ,onde b ∈ {0, 1, 2, . . . , q−1}, se a desigualdade anterior nao for satisfeita, entao, consideramos
b = q.
3.3. Criterios de Informacao BIC e HQIC
Agora consideramos a aproximacao do criterio de informacao para estimativa do postoda matriz.
A funcao criterio de informacao e definida da seguinte forma:
IC(b, CN ) = L(b) + ϕ(b) CN ,
com b = 0, 1, 2, . . . , q, onde a funcao ϕ(b) e estritamente crescente e a constante CN e otermo de penalidade que satisfaz as condicoes dadas em (3.2.1). Quando b = q consideramosL(b) = 0.
O estimador b do posto b e o valor que minimiza a funcao criterio, ou seja,
b = arg min IC(b, CN ),
com b = 0, 1, 2, . . . , q. Ratsimalahelo (2003) mostra que b e estimador fortemente consistente
de b, ou seja, b converge quase certamente para b, (bq.c.7−→ b).
Na literatura estatıstica, algumas escolhas fixas de CN tem sido sugeridas tais como ocriterio em que CN = 2 por Akaike(1974), chamado de AIC; CN = c log log(N) para algumc > 2 por Hannan e Quinn (1979), chamado de HQIC; CN = log(N) por Schwarz (1978),chamado BIC. O procedimento AIC nao satisfaz a condicao CN/ log log(N) 7−→ ∞, emconsequencia nao podemos garantir que o estimador baseado no AIC e consistente.
Para o calculo da funcao criterio consideramos neste trabalho os criterios de informacaoBIC, HQIC e ϕ(b) = b, com b = 0, 1, 2, . . . , q.
33
Capıtulo 4
Avaliacao numerica
Neste capıtulo apresentamos os resultados de simulacao para as estimativas do posto damatriz B dos parametros do modelo de regressao Dirichlet. Todo procedimento de calculo foiprogramado na linguagem de programacao Ox e o programa de simulacao esta apresentadono apendice 5.
Para simulacao utilizamos o metodo de Monte Carlo. Consideramos 10.000 replicas deMonte Carlo e para os tamanhos de amostra usamos N = 50, 100, 150 e 200. Os numeros deregressores da matriz X considerados foram k = 3, 4, 5, 6 e os numeros de componentes dosvetores de observacoes foram p = 2, 3, 4 para os modelos 1 e 2, lembrando que, na primeiraparametrizacao, a matriz B tem dimensao k × (p − 1) e na segunda tem dimensao k × p,onde em todos os casos assumimos, sem perda de generalidade, que k ≥ (p − 1) no modelo1 e k ≥ p no modelo 2.
Para os valores verdadeiros dos parametros da matriz B consideramos a base canonica;por exemplo, se k = 3, p = 4, no modelo 1, e o posto verdadeiro da matriz B for b, temos
B =
1 0 00 0 00 0 0
se b = 1; B =
1 0 00 1 00 0 0
se b = 2; B =
1 0 00 1 00 0 1
se b = 3;
consideramos b = 0, 1, 2 e 3; para b = 0 a matriz B e nula, e para o parametro de precisaoverdadeiro usamos φ = 30 no modelo 1. A funcao de ligacao que usamos no modelo 1 foia logit, ou seja, g(ηij) = eηij/(1 + eηij ), j = 1, 2, . . . , p − 1, enquanto no modelo 2 usamosg(ηij) = eηij , j = 1, 2, . . . , p.
Para cada replica de Monte Carlo geramos uma amostra aleatoria da variavel respostaY = (yi1, yi2, . . . , yip), com i = 1, 2, . . . , N , obtida atraves da parametrizacao (2.2.2.3) da dis-tribuicao Dirichlet. Os valores da covariavel X foram obtidos aleatoriamente da distribuicaouniforme no intervalo (0,1), U(0,1); ressaltamos que os valores de X permanecem constantesem todo o experimento, ou seja, X e gerado apenas uma vez antes do inıcio do metodo deMonte Carlo. No primeiro modelo, dados os valores da matriz resposta e da matriz deregressores, avaliamos a regressao auxiliar
(X>X)−1X>Z,
onde Z e a matriz da variavel resposta transformada definida no capıtulo 2. Tomamos asestimativas dos parametros obtidas da regressao auxiliar como valores iniciais para o processode maximizacao da funcao de log-verossimilhanca (2.2.2.4). A funcao de log-verossimilhancae maximizada atraves do metodo BFGS, discutido no Apendice 3, e os valores do ponto de
maximo desta funcao sao as estimativas B e φ de maxima verossimilhanca dos parametros.Para o modelo 2 tomamos a matriz nula como valor inicial no processo de maximizacao da
34
funcao de log-verossimilhanca, onde tambem foi usado o metodo BFGS, e o valor do ponto
de maximo desta funcao e a estimativa B de maxima verossimilhanca.Em seguida usamos a decomposicao em valores singulares de B, descrita no capıtulo 3, e
preenchemos a matriz de informacao de Fischer para calcular a estatıstica de teste, descritana secao (3.1.3), que e dada por
L(b) = N l > Q−1 l,
com
Q−1 = (V >2 ⊗ U>
2 ) Σ−1 (V2 ⊗ U2),
onde Σ−1 = (Iββ)−1, quando o primeiro modelo e usado, sendo Iββ definido na secao 2.2.2
e Σ−1 = I(B), definido na secao 2.2.3, se usamos o segundo modelo. Como ja foi dito nocapıtulo 3, a estatıstica de teste L(b) converge em distribuicao para uma qui-quadrado com(k−b)(q−b) graus de liberdade; nos modelos 1 e 2 temos que q = p−1 e p, respectivamente,e o nıvel de significancia usado em ambos os casos foi de 5%.
Para estimar o posto b da matriz B utilizamos tres procedimentos: o teste sequencial eos criterios de informacao BIC e HQIC. Atraves desses procedimentos estimamos b, usandoa estatıstica de teste L(b), para cada replica de Monte Carlo. Depois calculamos, para cadatamanho de amostra e para cada procedimento, a proporcao em que cada posto estimado e0, 1, 2, . . . , p− 1 para o modelo 1 e 0, 1, 2, . . . , p para o modelo 2. O vies e o erro quadratico
medio do estimador b tambem foram calculados para a analise dos resultados.Nas proximas secoes estao descritos os resultados numericos para as duas parametrizacoes
consideradas neste trabalho.
4.1. Resultados Numericos para o Modelo 1
Ao longo desta secao, apresentamos os resultados da simulacao feita para a estimacaodo posto b referente ao primeiro modelo considerado, que esta descrito na secao 2.2.2.
Os resultados da simulacao estao expostos em tabelas. Em cada tabela, para diferentestamanhos de amostra N e dimensoes da matriz B, apresentamos: o valor verdadeiro do postoda matriz B, a proporcao de vezes em que o teste sequencial e os criterios de informacaoBIC e HQIC acertam o verdadeiro posto de B, o vies e o erro quadratico medio (EQM) do
estimador b.Nas tabelas numeradas de 4.1 a 4.6 consideramos b = 0; isto significa que a matriz
B e nula, ou seja, o numero de valores singulares diferentes de zero da matriz B e nulo.Notamos, atraves destas tabelas, que os vieses e os EQM’s das estimativas de b sao proximosde zero quando o teste usado para estimacao de b e o sequencial. Por exemplo, na tabela 4.5
observamos que o vies e o EQM de b sao, respectivamente, 0.0007 e 0.0013, se N = 50 e Btem dimensao 3× 3.
Quando consideramos b = 1, k = 3, 4, 5, 6 e p − 1 = 1, em todas as 10.000 replicas deMonte Carlo o teste sequencial e os criterios de informacao BIC e HQIC apontaram que o
posto estimado b e igual a um, isto pode ser visto nas tabelas 4.7 e 4.8.
35
Observamos que, na maioria das vezes, se aumentamos o tamanho da amostra N , o vies
e o EQM de b diminuem, como esperado, pois sabemos que b e assintoticamente nao-viesadoe consistente. Por exemplo, para N = 50, 100, 150 e 200, os EQM’s das estimativas de bsao 0.3122, 0.2177, 0.1971 e 0.1862, respectivamente, como se pode observar na tabela 4.9,quando B tem dimensao 3×2, b = 1 e o teste usado para estimacao de b e o sequencial. Outroexemplo pode ser visto na tabela 4.15, se k = 4, b = 2 e p−1 = 3, para N = 50, 100, 150 e 200;os vieses das estimativas de b sao 0.6303, 0.4972, 0.4623 e 0.4304, respectivamente, quandoo criterio de informacao usado para estimacao de b e o BIC. A medida que acrescentamosvariaveis explicativas no modelo, os resultados da estimacao de b, usando os tres testes ja
mencionados, sao piores na maioria dos casos, ou seja, os vieses de b aumentam. Por exemplo,nas tabelas 4.11 e 4.12 temos que se k = 3, 4, 5 e 6, b = 1 e N = 200 os vieses das estimativasde b sao 0.3287, 0.5144, 0.5673 e 0.6391, respectivamente, quando o teste usado e o sequenciale 1.0051, 1.3321, 1.5493 e 1.6964 para o criterio de informacao HQIC.
Para todas as dimensoes da matriz B consideradas, percebemos que quando aumentamoso numero de componentes p da matriz Y, o teste sequencial e os criterios de informacao BICe HQIC tornam-se cada vez mais imprecisos. Isto pode ser visto, por exemplo, nas tabelas4.10 e 4.12 onde p = 3 e 4, respectivamente, e em ambos os casos, b = 1; observamos para
N = 100 que, se p = 3 o vies de b e 0.7512 e se p = 4 o vies e 1.4408, ou seja, as estimativasdo posto da matriz B tornam-se mais viesadas quando p cresce.
Consideramos varios casos em que a matriz B, de dimensao k×p−1, tem posto completo,b = p− 1, ou seja, casos em que a matriz B tem p− 1 valores singulares diferentes de zero.Estes casos estao apresentados nas tabelas 4.7, 4.8, 4.13, 4.14, 4.17 e 4.18.
Nos resultados de simulacao percebemos que se a matriz B tem posto completo, o criteriode informacao HQIC tem desempenho ligeiramente melhor que o BIC e o teste sequencial.Isso pode ser visto, por exemplo, na tabela 4.13 quando B tem dimensao 3 × 2, b = 2e N = 50; o criterio HQIC acerta em 97, 87% das 10.000 replicas o posto da matriz B,enquanto o criterio BIC acerta em 96, 27% e o teste sequencial em 84, 02%. Como ja foi dito,se aumentamos o valor de p, por exemplo, quando B tem dimensao 3× 3 e N = 50, os testesacertam menos, mas o criterio HQIC continua um pouco melhor que o BIC e o sequencial; ocriterio HQIC acerta em 74, 85% das 10.000 replicas o posto da matriz B, enquanto o criterioBIC acerta em 68, 72% e o teste sequencial em 54, 93%, como pode ser visto na tabela 4.17.Quando a matriz B nao tem posto completo, o teste sequencial tem um desempenho bemmelhor que os criterios de informacao BIC e HQIC. Por exemplo, na tabela 4.16 se k = 6,p − 1 = 3, b = 2 e N = 200, o teste sequencial acerta em 61, 98% das 10.000 replicas oposto da matriz B, enquanto o criterio BIC acerta em 25, 53% e o HQIC em 14, 96%. Outroexemplo pode ser visto na tabela 4.12 quando k = 6, p − 1 = 3, b = 1 e N = 200; o testesequencial acerta em 50, 81% das vezes o posto da matriz B, enquanto o criterio BIC acertaem 3, 85% e o HQIC em 0.92%.
36
Tabela
4.1
.P
roporc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
0,k
=3,4
ep−
1=
1.
b=
0D
imen
sao:
3×1
Dim
ensa
o:
4×1
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,9
945
0,9
983
0,9
992
0,9
996
0,9
953
0,9
991
0,9
992
0,9
998
10,0
055
0,0
017
0,0
008
0,0
004
0,0
047
0,0
009
0,0
008
0,0
002
Vie
s(b)
0,0
055
0,0
017
0,0
008
0,0
004
0,0
047
0,0
009
0,0
008
0,0
002
EQ
M(b
)0,0
055
0,0
017
0,0
008
0,0
004
0,0
047
0,0
009
0,0
008
0,0
002
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,6
971
0,7
810
0,8
122
0,8
428
0,5
388
0,6
444
0,6
971
0,7
345
10,3
029
0,2
190
0,1
878
0,1
572
0,4
612
0,3
556
0,3
029
0,2
655
Vie
s(b)
0,3
029
0,2
190
0,1
878
0,1
572
0,4
612
0,3
556
0,3
029
0,2
655
EQ
M(b
)0,3
029
0,2
190
0,1
878
0,1
572
0,4
612
0,3
556
0,3
029
0,2
655
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,5
399
0,6
044
0,6
310
0,6
537
0,3
660
0,4
350
0,4
679
0,4
908
10,4
601
0,3
956
0,3
690
0,3
463
0,6
340
0,5
650
0,5
321
0,5
092
Vie
s(b)
0,4
601
0,3
956
0,3
690
0,3
463
0,6
340
0,5
650
0,5
321
0,5
092
EQ
M(b
)0,4
601
0,3
956
0,3
690
0,3
463
0,6
340
0,5
650
0,5
321
0,5
092
37
Tabela
4.2
.P
roporc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
0,k
=5,6
ep−
1=
1.
b=
0D
imen
sao:
5×1
Dim
ensa
o:
6×1
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,9
966
0,9
994
0,9
995
0,9
998
0,9
950
0,9
993
0,9
993
0,9
999
10,0
034
0,0
006
0,0
005
0,0
002
0,0
050
0,0
007
0,0
007
0,0
001
Vie
s(b)
0,0
034
0,0
006
0,0
005
0,0
002
0,0
050
0,0
007
0,0
007
0,0
001
EQ
M(b
)0,0
034
0,0
006
0,0
005
0,0
002
0,0
050
0,0
007
0,0
007
0,0
001
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,3
866
0,5
048
0,5
644
0,6
009
0,2
496
0,3
642
0,4
252
0,4
739
10,6
134
0,4
952
0,4
356
0,3
991
0,7
504
0,6
358
0,5
748
0,5
261
Vie
s(b)
0,6
134
0,4
952
0,4
356
0,3
991
0,7
504
0,6
358
0,5
748
0,5
261
EQ
M(b
)0,6
134
0,4
952
0,4
356
0,3
991
0,7
504
0,6
358
0,5
748
0,5
261
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,2
296
0,2
871
0,3
218
0,3
371
0,1
254
0,1
756
0,2
048
0,2
305
10,7
704
0,7
129
0,6
782
0,6
629
0,8
746
0,8
244
0,7
952
0,7
695
Vie
s(b)
0,7
704
0,7
129
0,6
782
0,6
629
0,8
746
0,8
244
0,7
952
0,7
695
EQ
M(b
)0,7
704
0,7
129
0,6
782
0,6
629
0,8
746
0,8
244
0,7
952
0,7
695
38
Tabela
4.3
.P
roporc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
0,k
=3,4
ep−
1=
2.
b=
0D
imen
sao:
3×2
Dim
ensa
o:
4×2
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,9
988
1,0
000
1,0
000
1,0
000
0,9
988
0,9
999
1,0
000
0,9
999
10,0
009
0,0
000
0,0
000
0,0
000
0,0
010
0,0
001
0,0
000
0,0
001
20,0
003
0,0
000
0,0
000
0,0
000
0,0
002
0,0
000
0,0
000
0,0
000
Vie
s(b)
0,0
015
0,0
000
0,0
000
0,0
000
0,0
014
0,0
001
0,0
000
0,0
001
EQ
M(b
)0,0
021
0,0
000
0,0
000
0,0
000
0,0
018
0,0
001
0,0
000
0,0
001
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,4
446
0,5
588
0,6
290
0,6
659
0,2
634
0,3
737
0,4
444
0,4
913
10,4
772
0,3
959
0,3
407
0,3
114
0,5
555
0,5
190
0,4
835
0,4
483
20,0
782
0,0
453
0,0
303
0,0
227
0,1
811
0,1
073
0,0
721
0,0
604
Vie
s(b)
0,6
336
0,4
865
0,4
013
0,3
568
0,9
177
0,7
336
0,6
277
0,5
691
EQ
M(b
)0,7
900
0,5
771
0,4
619
0,4
022
1,2
799
0,9
482
0,7
719
0,6
899
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,2
576
0,3
263
0,3
604
0,3
926
0,1
208
0,1
698
0,1
965
0,2
152
10,5
738
0,5
485
0,5
378
0,5
123
0,5
524
0,5
778
0,5
924
0,5
878
20,1
686
0,1
252
0,1
018
0,0
951
0,3
268
0,2
524
0,2
111
0,1
970
Vie
s(b)
0,9
110
0,7
989
0,7
414
0,7
025
1,2
060
1,0
826
1,0
146
0,9
818
EQ
M(b
)1,2
482
1,0
493
0,9
450
0,8
927
1,8
596
1,5
874
1,4
368
1,3
758
39
Tabela
4.4
.P
roporc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
0,k
=5,6
ep−
1=
2.
b=
0D
imen
sao:
5×2
Dim
ensa
o:
6×2
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,9
992
1,0
000
1,0
000
1,0
000
0,9
987
1,0
000
1,0
000
1,0
000
10,0
006
0,0
000
0,0
000
0,0
000
0,0
011
0,0
000
0,0
000
0,0
000
20,0
002
0,0
000
0,0
000
0,0
000
0,0
002
0,0
000
0,0
000
0,0
000
Vie
s(b)
0,0
010
0,0
000
0,0
000
0,0
000
0,0
015
0,0
000
0,0
000
0,0
000
EQ
M(b
)0,0
014
0,0
000
0,0
000
0,0
000
0,0
019
0,0
000
0,0
000
0,0
000
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,1
349
0,2
247
0,2
831
0,3
336
0,0
605
0,1
194
0,1
666
0,2
063
10,5
522
0,5
878
0,5
736
0,5
467
0,4
733
0,5
625
0,5
813
0,5
764
20,3
129
0,1
875
0,1
433
0,1
197
0,4
662
0,3
181
0,2
521
0,2
173
Vie
s(b)
1,1
780
0,9
628
0,8
602
0,7
861
1,4
057
1,1
987
1,0
855
1,0
110
EQ
M(b
)1,8
038
1,3
378
1,1
468
1,0
255
2,3
381
1,8
349
1,5
897
1,4
456
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
485
0,0
759
0,0
904
0,1
057
0,0
159
0,0
265
0,0
380
0,0
432
10,4
610
0,5
272
0,5
546
0,5
600
0,3
231
0,4
144
0,4
477
0,4
689
20,4
905
0,3
969
0,3
550
0,3
343
0,6
610
0,5
591
0,5
143
0,4
879
Vie
s(b)
1,4
420
1,3
210
1,2
646
1,2
286
1,6
451
1,5
326
1,4
763
1,4
447
EQ
M(b
)2,4
230
2,1
148
1,9
746
1,8
972
2,9
671
2,6
508
2,5
049
2,4
205
40
Tabela
4.5
.P
roporc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
0,k
=3,4
ep−
1=
3.
b=
0D
imen
sao:
3×3
Dim
ensa
o:
4×3
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,9
995
0,9
999
1,0
000
1,0
000
0,9
998
1,0
000
0,9
999
0,9
999
10,0
004
0,0
001
0,0
000
0,0
000
0,0
002
0,0
000
0,0
001
0,0
001
20,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
30,0
001
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
Vie
s(b)
0,0
007
0,0
001
0,0
000
0,0
000
0,0
002
0,0
000
0,0
001
0,0
001
EQ
M(b
)0,0
013
0,0
001
0,0
000
0,0
000
0,0
002
0,0
000
0,0
001
0,0
001
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,2
749
0,3
804
0,4
498
0,4
932
0,1
242
0,2
078
0,2
636
0,3
003
10,5
297
0,4
998
0,4
572
0,4
341
0,4
784
0,5
201
0,5
320
0,5
196
20,1
739
0,1
126
0,0
869
0,0
686
0,3
401
0,2
438
0,1
869
0,1
654
30,0
215
0,0
072
0,0
061
0,0
041
0,0
573
0,0
283
0,0
175
0,0
147
Vie
s(b)
0,9
420
0,7
466
0,6
493
0,5
836
1,3
305
1,0
926
0,9
583
0,8
945
EQ
M(b
)1,4
188
1,0
150
0,8
597
0,7
454
2,3
545
1,7
500
1,4
371
1,3
135
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,1
208
0,1
689
0,1
929
0,2
105
0,0
394
0,0
600
0,0
776
0,0
836
10,5
114
0,5
392
0,5
483
0,5
502
0,3
548
0,4
244
0,4
625
0,4
638
20,3
083
0,2
546
0,2
284
0,2
119
0,4
723
0,4
132
0,3
780
0,3
807
30,0
595
0,0
373
0,0
304
0,0
274
0,1
335
0,1
024
0,0
819
0,0
719
Vie
s(b)
1,3
065
1,1
603
1,0
963
1,0
562
1,6
999
1,5
580
1,4
642
1,4
409
EQ
M(b
)2,2
801
1,8
933
1,7
355
1,6
444
3,4
455
2,9
988
2,7
116
2,6
337
41
Tabela
4.6
.P
roporc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
0,k
=5,6
ep−
1=
3.
b=
0D
imen
sao:
5×3
Dim
ensa
o:
6×3
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,9
998
0,9
999
0,9
999
1,0
000
0,9
997
1,0
000
1,0
000
1,0
000
10,0
002
0,0
001
0,0
001
0,0
000
0,0
002
0,0
000
0,0
000
0,0
000
20,0
000
0,0
000
0,0
000
0,0
000
0,0
001
0,0
000
0,0
000
0,0
000
30,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
Vie
s(b)
0,0
002
0,0
001
0,0
001
0,0
000
0,0
004
0,0
000
0,0
000
0,0
000
EQ
M(b
)0,0
002
0,0
001
0,0
001
0,0
000
0,0
006
0,0
000
0,0
000
0,0
000
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
465
0,0
988
0,1
323
0,1
751
0,0
144
0,0
387
0,0
633
0,0
806
10,3
481
0,4
535
0,4
915
0,4
995
0,2
072
0,3
347
0,3
890
0,4
219
20,4
724
0,3
729
0,3
254
0,2
903
0,5
268
0,4
787
0,4
439
0,4
116
30,1
330
0,0
748
0,0
508
0,0
351
0,2
516
0,1
479
0,1
038
0,0
859
Vie
s(b)
1,6
919
1,4
237
1,2
947
1,1
854
2,0
156
1,7
358
1,5
882
1,5
028
EQ
M(b
)3,4
347
2,6
183
2,2
503
1,9
766
4,5
788
3,5
806
3,0
988
2,8
414
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
106
0,0
176
0,0
219
0,0
302
0,0
015
0,0
043
0,0
077
0,0
086
10,1
892
0,2
729
0,2
924
0,3
225
0,0
827
0,1
398
0,1
650
0,1
870
20,5
293
0,5
053
0,5
140
0,4
938
0,4
766
0,5
224
0,5
380
0,5
366
30,2
709
0,2
042
0,1
717
0,1
535
0,4
392
0,3
335
0,2
893
0,2
678
Vie
s(b)
2,0
605
1,8
961
1,8
355
1,7
706
2,3
535
2,1
851
2,1
089
2,0
636
EQ
M(b
)4,7
445
4,1
319
3,8
937
3,6
792
5,9
419
5,2
309
4,9
207
4,7
436
42
Tabela
4.7
.P
roporc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
1,k
=3,4
ep−
1=
1.
b=
1D
imen
sao:
3×1
Dim
ensa
o:
4×1
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
11,0
000
1,0
000
1,0
000
1,0
000
1,0
000
1,0
000
1,0
000
1,0
000
Vie
s(b)
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
EQ
M(b
)0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
11,0
000
1,0
000
1,0
000
1,0
000
1,0
000
1,0
000
1,0
000
1,0
000
Vie
s(b)
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
EQ
M(b
)0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
11,0
000
1,0
000
1,0
000
1,0
000
1,0
000
1,0
000
1,0
000
1,0
000
Vie
s(b)
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
EQ
M(b
)0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
43
Tabela
4.8
.P
roporc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
1,k
=5,6
ep−
1=
1.
b=
1D
imen
sao:
5×1
Dim
ensa
o:
6×1
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
11,0
000
1,0
000
1,0
000
1,0
000
1,0
000
1,0
000
1,0
000
1,0
000
Vie
s(b)
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
EQ
M(b
)0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
11,0
000
1,0
000
1,0
000
1,0
000
1,0
000
1,0
000
1,0
000
1,0
000
Vie
s(b)
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
EQ
M(b
)0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
11,0
000
1,0
000
1,0
000
1,0
000
1,0
000
1,0
000
1,0
000
1,0
000
Vie
s(b)
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
EQ
M(b
)0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
44
Tabela
4.9
.P
roporc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
1,k
=3,4
ep−
1=
2.
b=
1D
imen
sao:
3×2
Dim
ensa
o:
4×2
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,6
878
0,7
823
0,8
029
0,8
138
0,5
681
0,6
903
0,7
351
0,7
455
20,3
122
0,2
177
0,1
971
0,1
862
0,4
319
0,3
097
0,2
649
0,2
545
Vie
s(b)
0,3
122
0,2
177
0,1
971
0,1
862
0,4
319
0,3
097
0,2
649
0,2
545
EQ
M(b
)0,3
122
0,2
177
0,1
971
0,1
862
0,4
319
0,3
097
0,2
649
0,2
545
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,4
379
0,5
273
0,5
509
0,5
582
0,2
652
0,3
470
0,3
845
0,3
919
20,5
621
0,4
727
0,4
491
0,4
418
0,7
348
0,6
530
0,6
155
0,6
081
Vie
s(b)
0,5
621
0,4
727
0,4
491
0,4
418
0,7
348
0,6
530
0,6
155
0,6
081
EQ
M(b
)0,5
621
0,4
727
0,4
491
0,4
418
0,7
348
0,6
530
0,6
155
0,6
081
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,3
568
0,4
181
0,4
287
0,4
247
0,1
894
0,2
457
0,2
566
0,2
673
20,6
432
0,5
819
0,5
713
0,5
753
0,8
106
0,7
543
0,7
434
0,7
327
Vie
s(b)
0,6
432
0,5
819
0,5
713
0,5
753
0,8
106
0,7
543
0,7
434
0,7
327
EQ
M(b
)0,6
432
0,5
819
0,5
713
0,5
753
0,8
106
0,7
543
0,7
434
0,7
327
45
Tabela
4.1
0.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
1,k
=5,6
ep−
1=
2.
b=
1D
imen
sao:
5×2
Dim
ensa
o:
6×2
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,5
288
0,6
581
0,6
877
0,7
135
0,4
552
0,6
102
0,6
721
0,7
086
20,4
712
0,3
419
0,3
123
0,2
865
0,5
448
0,3
898
0,3
279
0,2
914
Vie
s(b)
0,4
712
0,3
419
0,3
123
0,2
865
0,5
448
0,3
898
0,3
279
0,2
914
EQ
M(b
)0,4
712
0,3
419
0,3
123
0,2
865
0,5
448
0,3
898
0,3
279
0,2
914
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,1
772
0,2
488
0,2
624
0,2
976
0,1
070
0,1
624
0,1
922
0,2
122
20,8
228
0,7
512
0,7
376
0,7
024
0,8
930
0,8
376
0,8
078
0,7
878
Vie
s(b)
0,8
228
0,7
512
0,7
376
0,7
024
0,8
930
0,8
376
0,8
078
0,7
878
EQ
M(b
)0,8
228
0,7
512
0,7
376
0,7
024
0,8
930
0,8
376
0,8
078
0,7
878
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,1
131
0,1
530
0,1
559
0,1
733
0,0
604
0,0
888
0,0
961
0,1
071
20,8
869
0,8
470
0,8
441
0,8
267
0,9
396
0,9
112
0,9
039
0,8
929
Vie
s(b)
0,8
869
0,8
470
0,8
441
0,8
267
0,9
396
0,9
112
0,9
039
0,8
929
EQ
M(b
)0,8
869
0,8
470
0,8
441
0,8
267
0,9
396
0,9
112
0,9
039
0,8
929
46
Tabela
4.1
1.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
1,k
=3,4
ep−
1=
3.
b=
1D
imen
sao:
3×3
Dim
ensa
o:
4×3
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,4
201
0,5
956
0,6
590
0,7
026
0,2
925
0,4
431
0,5
392
0,5
608
20,4
794
0,3
607
0,3
033
0,2
661
0,5
237
0,4
473
0,3
792
0,3
640
30,1
005
0,0
437
0,0
377
0,0
313
0,1
838
0,1
096
0,0
816
0,0
752
Vie
s(b)
0,6
804
0,4
481
0,3
787
0,3
287
0,8
913
0,6
665
0,5
424
0,5
144
EQ
M(b
)0,8
814
0,5
355
0,4
541
0,3
913
1,2
589
0,8
857
0,7
056
0,6
648
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,1
538
0,2
265
0,2
638
0,2
837
0,0
600
0,0
953
0,1
316
0,1
381
20,6
494
0,6
583
0,6
278
0,6
224
0,5
307
0,5
902
0,5
820
0,5
894
30,1
968
0,1
152
0,1
084
0,0
939
0,4
093
0,3
145
0,2
864
0,2
725
Vie
s(b)
1,0
430
0,8
887
0,8
446
0,8
102
1,3
493
1,2
192
1,1
548
1,1
344
EQ
M(b
)1,4
366
1,1
191
1,0
614
0,9
980
2,1
679
1,8
482
1,7
276
1,6
794
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,1
009
0,1
390
0,1
579
0,1
626
0,0
325
0,0
471
0,0
633
0,0
613
20,6
422
0,6
859
0,6
689
0,6
697
0,4
724
0,5
333
0,5
354
0,5
453
30,2
569
0,1
751
0,1
732
0,1
677
0,4
951
0,4
196
0,4
013
0,3
934
Vie
s(b)
1,1
560
1,0
361
1,0
153
1,0
051
1,4
626
1,3
725
1,3
380
1,3
321
EQ
M(b
)1,6
698
1,3
863
1,3
617
1,3
405
2,4
528
2,2
117
2,1
406
2,1
189
47
Tabela
4.1
2.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
1,k
=5,6
ep−
1=
3.
b=
1D
imen
sao:
5×3
Dim
ensa
o:
6×3
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,2
148
0,4
144
0,4
810
0,5
369
0,1
625
0,3
362
0,4
309
0,5
081
20,5
063
0,4
192
0,3
907
0,3
589
0,4
665
0,4
304
0,3
836
0,3
447
30,2
789
0,1
664
0,1
283
0,1
042
0,3
710
0,2
334
0,1
855
0,1
472
Vie
s(b)
1,0
641
0,7
520
0,6
473
0,5
673
1,2
085
0,8
972
0,7
546
0,6
391
EQ
M(b
)1,6
219
1,0
848
0,9
039
0,7
757
1,9
505
1,3
640
1,1
256
0,9
335
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
212
0,0
538
0,0
651
0,0
805
0,0
079
0,0
222
0,0
341
0,0
385
20,3
810
0,4
516
0,4
826
0,4
844
0,2
586
0,3
367
0,3
717
0,4
031
30,5
978
0,4
946
0,4
523
0,4
351
0,7
335
0,6
411
0,5
942
0,5
584
Vie
s(b)
1,5
766
1,4
408
1,3
872
1,3
546
1,7
256
1,6
189
1,5
601
1,5
199
EQ
M(b
)2,7
722
2,4
300
2,2
918
2,2
248
3,1
926
2,9
011
2,7
485
2,6
367
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
095
0,0
218
0,0
217
0,0
259
0,0
030
0,0
071
0,0
104
0,0
092
20,2
975
0,3
624
0,3
891
0,3
989
0,1
836
0,2
427
0,2
635
0,2
852
30,6
930
0,6
158
0,5
892
0,5
752
0,8
134
0,7
502
0,7
261
0,7
056
Vie
s(b)
1,6
835
1,5
940
1,5
675
1,5
493
1,8
104
1,7
431
1,7
157
1,6
964
EQ
M(b
)3,0
695
2,8
256
2,7
459
2,6
997
3,4
372
3,2
435
3,1
679
3,1
076
48
Tabela
4.1
3.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
2,k
=3,4
ep−
1=
2.
b=
2D
imen
sao:
3×2
Dim
ensa
o:
4×2
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,1
598
0,0
604
0,0
138
0,0
015
0,1
397
0,0
960
0,0
297
0,0
110
20,8
402
0,9
396
0,9
862
0,9
985
0,8
603
0,9
040
0,9
703
0,9
890
Vie
s(b)
-0,1
598
-0,0
604
-0,0
138
-0,0
015
-0,1
397
-0,0
960
-0,0
297
-0,0
110
EQ
M(b
)0,1
598
0,0
604
0,0
138
0,0
015
0,1
397
0,0
960
0,0
297
0,0
110
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
373
0,0
044
0,0
003
0,0
000
0,0
179
0,0
050
0,0
004
0,0
003
20,9
627
0,9
956
0,9
997
1,0
000
0,9
821
0,9
950
0,9
996
0,9
997
Vie
s(b)
-0,0
373
-0,0
044
-0,0
003
0,0
000
-0,0
179
-0,0
050
-0,0
004
-0,0
003
EQ
M(b
)0,0
373
0,0
044
0,0
003
0,0
000
0,0
179
0,0
050
0,0
004
0,0
003
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
213
0,0
009
0,0
001
0,0
000
0,0
094
0,0
018
0,0
001
0,0
000
20,9
787
0,9
991
0,9
999
1,0
000
0,9
906
0,9
982
0,9
999
1,0
000
Vie
s(b)
-0,0
213
-0,0
009
-0,0
001
0,0
000
-0,0
094
-0,0
018
-0,0
001
0,0
000
EQ
M(b
)0,0
213
0,0
009
0,0
001
0,0
000
0,0
094
0,0
018
0,0
001
0,0
000
49
Tabela
4.1
4.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
2,k
=5,6
ep−
1=
2.
b=
2D
imen
sao:
5×2
Dim
ensa
o:
6×2
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,1
258
0,0
703
0,0
284
0,0
080
0,1
368
0,0
984
0,0
502
0,0
183
20,8
742
0,9
297
0,9
716
0,9
920
0,8
632
0,9
016
0,9
498
0,9
817
Vie
s(b)
-0,1
258
-0,0
703
-0,0
284
-0,0
080
-0,1
368
-0,0
984
-0,0
502
-0,0
183
EQ
M(b
)0,1
258
0,0
703
0,0
284
0,0
080
0,1
368
0,0
984
0,0
502
0,0
183
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
100
0,0
007
0,0
000
0,0
000
0,0
057
0,0
013
0,0
002
0,0
000
20,9
900
0,9
993
1,0
000
1,0
000
0,9
943
0,9
987
0,9
998
1,0
000
Vie
s(b)
-0,0
100
-0,0
007
0,0
000
0,0
000
-0,0
057
-0,0
013
-0,0
002
0,0
000
EQ
M(b
)0,0
100
0,0
007
0,0
000
0,0
000
0,0
057
0,0
013
0,0
002
0,0
000
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
056
0,0
003
0,0
000
0,0
000
0,0
025
0,0
003
0,0
000
0,0
000
20,9
944
0,9
997
1,0
000
1,0
000
0,9
975
0,9
997
1,0
000
1,0
000
Vie
s(b)
-0,0
056
-0,0
003
0,0
000
0,0
000
-0,0
025
-0,0
003
0,0
000
0,0
000
EQ
M(b
)0,0
056
0,0
003
0,0
000
0,0
000
0,0
025
0,0
003
0,0
000
0,0
000
50
Tabela
4.1
5.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
2,k
=3,4
ep−
1=
3.
b=
2D
imen
sao:
3×3
Dim
ensa
o:
4×3
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
949
0,0
606
0,0
239
0,0
046
0,0
240
0,0
116
0,0
020
0,0
003
20,6
498
0,7
328
0,7
918
0,8
135
0,5
372
0,7
018
0,7
522
0,7
815
30,2
553
0,2
066
0,1
843
0,1
819
0,4
388
0,2
866
0,2
458
0,2
182
Vie
s(b)
0,1
604
0,1
460
0,1
604
0,1
773
0,4
148
0,2
750
0,2
438
0,2
179
EQ
M(b
)0,3
502
0,2
672
0,2
082
0,1
865
0,4
628
0,2
982
0,2
478
0,2
185
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
127
0,0
026
0,0
003
0,0
000
0,0
011
0,0
003
0,0
000
0,0
000
20,6
233
0,6
856
0,7
160
0,7
250
0,3
675
0,5
022
0,5
377
0,5
696
30,3
640
0,3
118
0,2
837
0,2
750
0,6
314
0,4
975
0,4
623
0,4
304
Vie
s(b)
0,3
513
0,3
092
0,2
834
0,2
750
0,6
303
0,4
972
0,4
623
0,4
304
EQ
M(b
)0,3
767
0,3
144
0,2
840
0,2
750
0,6
325
0,4
978
0,4
623
0,4
304
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
061
0,0
008
0,0
000
0,0
000
0,0
003
0,0
000
0,0
000
0,0
000
20,5
666
0,6
078
0,6
268
0,6
309
0,3
052
0,4
045
0,4
234
0,4
451
30,4
273
0,3
914
0,3
732
0,3
691
0,6
945
0,5
955
0,5
766
0,5
549
Vie
s(b)
0,4
212
0,3
906
0,3
732
0,3
691
0,6
942
0,5
955
0,5
766
0,5
549
EQ
M(b
)0,4
334
0,3
922
0,3
732
0,3
691
0,6
948
0,5
955
0,5
766
0,5
549
51
Tabela
4.1
6.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
2,k
=5,6
ep−
1=
3.
b=
2D
imen
sao:
5×3
Dim
ensa
o:
6×3
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
210
0,0
064
0,0
017
0,0
002
0,0
175
0,0
083
0,0
049
0,0
003
20,4
210
0,5
483
0,6
245
0,6
965
0,3
239
0,4
676
0,5
824
0,6
198
30,5
580
0,4
453
0,3
738
0,3
033
0,6
586
0,5
241
0,4
127
0,3
799
Vie
s(b)
0,5
370
0,4
389
0,3
721
0,3
031
0,6
411
0,5
158
0,4
078
0,3
796
EQ
M(b
)0,5
790
0,4
517
0,3
755
0,3
035
0,6
761
0,5
324
0,4
176
0,3
802
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
003
0,0
001
0,0
000
0,0
000
0,0
004
0,0
000
0,0
000
0,0
000
20,2
081
0,2
881
0,3
310
0,3
816
0,1
152
0,1
834
0,2
396
0,2
553
30,7
916
0,7
118
0,6
690
0,6
184
0,8
844
0,8
166
0,7
604
0,7
447
Vie
s(b)
0,7
913
0,7
117
0,6
690
0,6
184
0,8
840
0,8
166
0,7
604
0,7
447
EQ
M(b
)0,7
919
0,7
119
0,6
690
0,6
184
0,8
848
0,8
166
0,7
604
0,7
447
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
20,1
516
0,2
068
0,2
305
0,2
606
0,0
775
0,1
157
0,1
462
0,1
496
30,8
484
0,7
932
0,7
695
0,7
394
0,9
225
0,8
843
0,8
538
0,8
504
Vie
s(b)
0,8
484
0,7
932
0,7
695
0,7
394
0,9
225
0,8
843
0,8
538
0,8
504
EQ
M(b
)0,8
484
0,7
932
0,7
695
0,7
394
0,9
225
0,8
843
0,8
538
0,8
504
52
Tabela
4.1
7.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
3,k
=3,4
ep−
1=
3.
b=
3D
imen
sao:
3×3
Dim
ensa
o:
4×3
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
447
0,0
102
0,0
013
0,0
000
0,0
246
0,0
119
0,0
028
0,0
000
20,4
060
0,2
001
0,0
974
0,0
375
0,3
149
0,2
191
0,1
104
0,0
431
30,5
493
0,7
897
0,9
013
0,9
625
0,6
605
0,7
690
0,8
868
0,9
569
Vie
s(b)
-0,4
954
-0,2
205
-0,1
000
-0,0
375
-0,3
641
-0,2
429
-0,1
160
-0,0
431
EQ
M(b
)0,5
848
0,2
409
0,1
026
0,0
375
0,4
133
0,2
667
0,1
216
0,0
431
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
054
0,0
002
0,0
000
0,0
000
0,0
004
0,0
000
0,0
000
0,0
000
20,3
074
0,0
960
0,0
372
0,0
115
0,1
370
0,0
475
0,0
125
0,0
032
30,6
872
0,9
038
0,9
628
0,9
885
0,8
626
0,9
525
0,9
875
0,9
968
Vie
s(b)
-0,3
182
-0,0
964
-0,0
372
-0,0
115
-0,1
378
-0,0
475
-0,0
125
-0,0
032
EQ
M(b
)0,3
290
0,0
968
0,0
372
0,0
115
0,1
386
0,0
475
0,0
125
0,0
032
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
026
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
20,2
489
0,0
562
0,0
173
0,0
043
0,0
944
0,0
231
0,0
047
0,0
009
30,7
485
0,9
438
0,9
827
0,9
957
0,9
056
0,9
769
0,9
953
0,9
991
Vie
s(b)
-0,2
541
-0,0
562
-0,0
173
-0,0
043
-0,0
944
-0,0
231
-0,0
047
-0,0
009
EQ
M(b
)0,2
593
0,0
562
0,0
173
0,0
043
0,0
944
0,0
231
0,0
047
0,0
009
53
Tabela
4.1
8.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
3,k
=5,6
ep−
1=
3.
b=
3D
imen
sao:
5×3
Dim
ensa
o:
6×3
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0.0
000
0.0
000
10,0
246
0,0
095
0,0
027
0,0
004
0,0
153
0,0
124
0.0
044
0.0
017
20,2
876
0,2
046
0,1
264
0,0
726
0,2
508
0,2
041
0.1
446
0.0
803
30,6
878
0,7
859
0,8
709
0,9
270
0,7
339
0,7
835
0.8
510
0.9
180
Vie
s(b)
-0,3
368
-0,2
236
-0,1
318
-0,0
734
-0,2
814
-0,2
289
-0.1
534
-0.0
837
EQ
M(b
)0,3
860
0,2
426
0,1
372
0,0
742
0,3
120
0,2
537
0.1
622
0.0
871
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0.0
000
0.0
000
10,0
007
0,0
000
0,0
000
0,0
000
0,0
002
0,0
000
0.0
000
0.0
000
20,0
897
0,0
316
0,0
087
0,0
024
0,0
485
0,0
157
0.0
055
0.0
014
30,9
096
0,9
684
0,9
913
0,9
976
0,9
513
0,9
843
0.9
945
0.9
986
Vie
s(b)
-0,0
911
-0,0
316
-0,0
087
-0,0
024
-0,0
489
-0,0
157
-0.0
055
-0.0
014
EQ
M(b
)0,0
925
0,0
316
0,0
087
0,0
024
0,0
493
0,0
157
0.0
055
0.0
014
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0.0
000
0.0
000
10,0
001
0,0
000
0,0
000
0,0
000
0,0
001
0,0
000
0.0
000
0.0
000
20,0
565
0,0
151
0,0
045
0,0
008
0,0
263
0,0
078
0.0
019
0.0
002
30,9
434
0,9
849
0,9
955
0,9
992
0,9
736
0,9
922
0.9
981
0.9
998
Vie
s(b)
-0,0
567
-0,0
151
-0,0
045
-0,0
008
-0,0
265
-0,0
078
-0.0
019
-0.0
002
EQ
M(b
)0,0
569
0,0
151
0,0
045
0,0
008
0,0
267
0,0
078
0.0
019
0.0
002
54
4.2. Resultados Numericos para o Modelo 2
Apresentaremos a seguir os resultados da simulacao feita para a estimacao do posto damatriz B usando a segunda parametrizacao, definida na secao 2.2.3.
Assim como na secao anterior, para cada valor de k ∈ {3, 4, 5, 6} e p ∈ {2, 3, 4} calculamosa proporcao de vezes em que o teste sequencial e os criterios de informacao BIC e HQIC
acertam o verdadeiro posto de B, o vies e o EQM do estimador b.Os casos em que a matriz B nao possui valores singulares diferentes de zero, ou seja,
b = 0, estao expostos nas tabelas numeradas de 4.19 a 4.24. Nestes casos percebemos queos vieses e os EQM’s das estimativas de b sao proximos ou iguais a zero quando o testesequencial e usado para a estimacao de b. Por exemplo, se k = 6, p = 2 e N = 200 o vies e
o EQM de b sao iguais a 0.0002 como pode ser visto na tabela 4.20; quando k = 5, p = 3 e
N = 150, o vies e o EQM de b sao praticamente nulos, ver tabela 4.22.Como ja visto nos resultados da simulacao feita para a estimacao de b no modelo 1, na
maioria dos casos, b e assintoticamente nao viesado e consistente. O mesmo acontece paraos resultados referentes ao modelo 2. Ou seja, quando a segunda parametrizacao e usada naestimacao de b, na maior parte das vezes, os vieses e os EQM’s das estimativas de b diminuemquando o tamanho da amostra N cresce. Por exemplo, para N = 50, 100, 150 e 200, os EQM’sdas estimativas de b sao, respectivamente, 0.8838, 0.8559, 0.8385 e 0.8204, como se podeobservar na tabela 4.34, quando k = 5, p = 3, b = 2 e o criterio de informacao HQIC e usado.Outro exemplo pode ser visto na tabela 4.30, se k = 6, p = 4, b = 1, para N = 50, 100, 150e 200; os vieses das estimativas de b sao, respectivamente, 1.5825, 1.3515, 1.1852 e 1.0606,quando o teste usado na estimacao de b e o sequencial. Quando acrescentamos variaveisexplicativas no modelo, os resultados da estimacao de b, usando os tres testes ja mencionados,
ficam piores na maioria dos casos, ou seja, os vieses de b aumentam. Por exemplo, nas tabelas4.27 e 4.28 temos que se k = 3, 4, 5 e 6, os vieses das estimativas de b sao 0.4707, 0.6416, 0.7776e 0.8676, respectivamente, quando o teste usado e o sequencial, b = 1, p = 3 e N = 200.Quando, nas tabelas 4.25 e 4.26, b = 1, p = 2, N = 50 e o criterio usado para estimacaode b e o HQIC, se k = 3, 4, 5 e 6, os vieses das estimativas de b sao 0.8229, 0.9278, 0.9713 e0.9922, respectivamente.
Para todos os valores de k, p e b considerados, percebemos que quando aumentamos onumero de componentes p da matriz Y, os criterios de informacao BIC e HQIC acertam cadavez menos o verdadeiro posto da matriz B; o mesmo acontece para o teste sequencial, excetoquando b = 0. Nas tabelas 4.31 e 4.33 onde p = 2 e 3, respectivamente, e em ambos oscasos, b = 2 e k = 3, observamos para N = 150 que, se p = 2 o criterio de informacao HQICacerta em 99.91% das 10.000 replicas o posto da matriz B, e se p = 3 o mesmo criterio deinformacao acerta em 58.22%. Outro exemplo pode ser visto atraves das tabelas 4.32, 4.34e 4.36 onde p = 2, 3 e 4, respectivamente, e nesses casos, b = 2 e k = 6, observamos paraN = 100 que, se p = 2, o criterio de informacao BIC acerta em 99.62% das vezes o posto damatriz B; se p = 3 o acerto e de 14.26%, e se p = 4 o acerto e de 3.33%.
Nas tabelas 4.31, 4.32, 4.37, 4.38, 4.41 e 4.42 estao expostos os resultados de simulacaofeita para a estimacao de b quando a matriz B, de dimensao k × p, tem posto completo, ouseja, b = p.
55
Nos resultados de simulacao, observamos que os desempenhos do teste sequencial e doscriterios de informacao BIC e HQIC foram analogo ao visto na secao anterior. Se a matrizB tem posto completo, o criterio de informacao HQIC tem desempenho ligeiramente melhorque o BIC e o teste sequencial. Isso pode ser visto, por exemplo, na tabela 4.31 quando Btem dimensao 3× 2, b = 2 e N = 150; o criterio HQIC acerta em 99.91% das 10.000 replicaso posto da matriz B, enquanto o criterio BIC acerta em 99.82% e o teste sequencial em97.51%. Na tabela 4.42 temos que, se k = 6, p = 4, b = 4 e N = 100, o criterio HQIC acertaem 97.94% das vezes, o BIC acerta em 95.81% e o teste sequencial em 71.77%. Quando amatriz B nao tem posto completo, o teste sequencial tem um desempenho bem melhor queos criterios de informacao BIC e HQIC. Isto pode ser visto, por exemplo, nas tabelas 4.29,4.35, 4.39 e 4.40. Na tabela 4.29, se k = 4, p = 4, b = 1 e N = 200, o teste sequencial acertaem 41.79% das 10.000 replicas o posto da matriz B, enquanto o criterio BIC acerta em 3.18%e o HQIC em 0.81%. Quando k = 4, p = 4, b = 2 e N = 200; o teste sequencial acerta em67.17% das vezes o posto da matriz B, enquanto o criterio BIC acerta em 26.55% e o HQICem 15.37%, ver tabela 4.35. Outro exemplo pode ser visto na tabela 4.24, se k = 6, p = 4,b = 0 e N = 100, o teste sequencial acerta em 99.98% das vezes, o criterio BIC acerta em0.67% e o HQIC em 0.03%.
56
Tabela
4.1
9.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
0,k
=3,4
ep
=2.
b=
0D
imen
sao:
3×2
Dim
ensa
o:
4×2
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,9
893
0,9
981
0,9
994
0,9
996
0,9
840
0,9
986
0,9
992
0,9
998
10,0
077
0,0
015
0,0
003
0,0
004
0,0
120
0,0
012
0,0
006
0,0
002
20,0
030
0,0
004
0,0
003
0,0
000
0,0
040
0,0
002
0,0
002
0,0
000
Vie
s(b)
0,0
137
0,0
023
0,0
009
0,0
004
0,0
200
0,0
016
0,0
010
0,0
002
EQ
M(b
)0,0
197
0,0
031
0,0
015
0,0
004
0,0
280
0,0
020
0,0
014
0,0
002
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,4
407
0,5
659
0,6
381
0,6
773
0,2
358
0,3
733
0,4
471
0,5
064
10,4
220
0,3
640
0,3
160
0,2
870
0,4
516
0,4
474
0,4
299
0,3
925
20,1
373
0,0
701
0,0
459
0,0
357
0,3
126
0,1
793
0,1
230
0,1
011
Vie
s(b)
0,6
966
0,5
042
0,4
078
0,3
584
1,0
768
0,8
060
0,6
759
0,5
947
EQ
M(b
)0,9
712
0,6
444
0,4
996
0,4
298
1,7
020
1,1
646
0,9
219
0,7
969
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,2
661
0,3
365
0,3
828
0,4
146
0,1
083
0,1
702
0,2
050
0,2
260
10,4
856
0,4
894
0,4
673
0,4
535
0,4
176
0,4
731
0,4
938
0,4
895
20,2
483
0,1
741
0,1
499
0,1
319
0,4
741
0,3
567
0,3
012
0,2
845
Vie
s(b)
0,9
822
0,8
376
0,7
671
0,7
173
1,3
658
1,1
865
1,0
962
1,0
585
EQ
M(b
)1,4
788
1,1
858
1,0
669
0,9
811
2,3
140
1,8
999
1,6
986
1,6
275
57
Tabela
4.2
0.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
0,k
=5,6
ep
=2.
b=
0D
imen
sao:
5×2
Dim
ensa
o:
6×2
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,9
704
0,9
970
0,9
990
0,9
998
0,9
460
0,9
963
0,9
997
0,9
998
10,0
184
0,0
025
0,0
009
0,0
001
0,0
330
0,0
028
0,0
003
0,0
002
20,0
112
0,0
005
0,0
001
0,0
001
0,0
210
0,0
009
0,0
000
0,0
000
Vie
s(b)
0,0
408
0,0
035
0,0
011
0,0
003
0,0
750
0,0
046
0,0
003
0,0
002
EQ
M(b
)0,0
632
0,0
045
0,0
013
0,0
005
0,1
170
0,0
064
0,0
003
0,0
002
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,1
137
0,2
208
0,2
995
0,3
543
0,0
377
0,1
136
0,1
770
0,2
196
10,3
688
0,4
536
0,4
491
0,4
444
0,2
458
0,3
799
0,4
221
0,4
337
20,5
175
0,3
256
0,2
514
0,2
013
0,7
165
0,5
065
0,4
009
0,3
467
Vie
s(b)
1,4
038
1,1
048
0,9
519
0,8
470
1,6
788
1,3
929
1,2
239
1,1
271
EQ
M(b
)2,4
388
1,7
560
1,4
547
1,2
496
3,1
118
2,4
059
2,0
257
1,8
205
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
390
0,0
756
0,1
040
0,1
201
0,0
093
0,0
280
0,0
407
0,0
538
10,2
792
0,3
743
0,4
068
0,4
347
0,1
460
0,2
501
0,3
040
0,3
211
20,6
818
0,5
501
0,4
892
0,4
452
0,8
447
0,7
219
0,6
553
0,6
251
Vie
s(b)
1,6
428
1,4
745
1,3
852
1,3
251
1,8
354
1,6
939
1,6
146
1,5
713
EQ
M(b
)3,0
064
2,5
747
2,3
636
2,2
155
3,5
248
3,1
377
2,9
252
2,8
215
58
Tabela
4.2
1.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
0,k
=3,4
ep
=3.
b=
0D
imen
sao:
3×3
Dim
ensa
o:
4×3
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,9
967
0,9
997
0,9
999
0,9
999
0,9
950
0,9
999
1,0
000
0,9
998
10,0
027
0,0
002
0,0
000
0,0
001
0,0
031
0,0
000
0,0
000
0,0
002
20,0
005
0,0
001
0,0
000
0,0
000
0,0
013
0,0
001
0,0
000
0,0
000
30,0
001
0,0
000
0,0
001
0,0
000
0,0
006
0,0
000
0,0
000
0,0
000
Vie
s(b)
0,0
040
0,0
004
0,0
003
0,0
001
0,0
075
0,0
002
0,0
000
0,0
002
EQ
M(b
)0,0
056
0,0
006
0,0
009
0,0
001
0,0
137
0,0
004
0,0
000
0,0
002
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,2
484
0,3
846
0,4
547
0,4
989
0,1
083
0,1
947
0,2
616
0,3
146
10,4
999
0,4
699
0,4
368
0,4
099
0,3
915
0,4
626
0,4
875
0,4
727
20,2
190
0,1
345
0,1
017
0,0
862
0,3
997
0,3
043
0,2
245
0,1
935
30,0
327
0,0
110
0,0
068
0,0
050
0,1
005
0,0
384
0,0
264
0,0
192
Vie
s(b)
1,0
360
0,7
719
0,6
606
0,5
973
1,4
924
1,1
864
1,0
157
0,9
173
EQ
M(b
)1,6
702
1,1
069
0,9
048
0,7
997
2,8
948
2,0
254
1,6
231
1,4
195
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,1
112
0,1
701
0,2
014
0,2
237
0,0
339
0,0
587
0,0
763
0,0
879
10,4
623
0,5
072
0,5
093
0,5
078
0,2
736
0,3
583
0,4
019
0,4
140
20,3
501
0,2
792
0,2
538
0,2
378
0,5
050
0,4
668
0,4
268
0,4
150
30,0
764
0,0
435
0,0
355
0,0
307
0,1
875
0,1
162
0,0
950
0,0
831
Vie
s(b)
1,3
917
1,1
961
1,1
234
1,0
755
1,8
461
1,6
405
1,5
405
1,4
933
EQ
M(b
)2,5
503
2,0
155
1,8
440
1,7
353
3,9
811
3,2
713
2,9
641
2,8
219
59
Tabela
4.2
2.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
0,k
=5,6
ep
=3.
b=
0D
imen
sao:
5×3
Dim
ensa
o:
6×3
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,9
894
0,9
999
1,0
000
0,9
999
0,9
811
0,9
996
1.0
000
1.0
000
10,0
072
0,0
000
0,0
000
0,0
001
0,0
134
0,0
003
0.0
000
0.0
000
20,0
025
0,0
001
0,0
000
0,0
000
0,0
044
0,0
001
0.0
000
0.0
000
30,0
009
0,0
000
0,0
000
0,0
000
0,0
011
0,0
000
0.0
000
0.0
000
Vie
s(b)
0,0
149
0,0
002
0,0
000
0,0
001
0,0
255
0,0
005
0.0
000
0.0
000
EQ
M(b
)0,0
253
0,0
004
0,0
000
0,0
001
0,0
409
0,0
007
0.0
000
0.0
000
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
360
0,0
931
0,1
402
0,1
674
0,0
077
0,0
345
0.0
573
0.0
827
10,2
241
0,3
642
0,4
049
0,4
360
0,1
074
0,2
255
0.2
962
0.3
265
20,5
351
0,4
509
0,3
949
0,3
539
0,5
304
0,5
556
0.5
271
0.4
943
30,2
048
0,0
918
0,0
600
0,0
427
0,3
545
0,1
844
0.1
194
0.0
965
Vie
s(b)
1,9
087
1,5
414
1,3
747
1,2
719
2,2
317
1,8
899
1.7
086
1.6
046
EQ
M(b
)4,2
077
2,9
940
2,5
245
2,2
359
5,4
195
4,1
075
3.4
792
3.1
722
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
067
0,0
185
0,0
248
0,0
298
0,0
006
0,0
038
0.0
063
0.0
101
10,1
108
0,2
007
0,2
367
0,2
600
0,0
418
0,0
849
0.1
150
0.1
339
20,5
276
0,5
642
0,5
499
0,5
511
0,4
267
0,5
366
0.5
685
0.5
733
30,3
549
0,2
166
0,1
886
0,1
591
0,5
309
0,3
747
0.3
102
0.2
827
Vie
s(b)
2,2
307
1,9
789
1,9
023
1,8
395
2,4
879
2,2
822
2.1
826
2.1
286
EQ
M(b
)5,4
153
4,4
069
4,1
337
3,8
963
6,5
267
5,6
036
5.1
808
4.9
714
60
Tabela
4.2
3.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
0,k
=4,5
ep
=4.
b=
0D
imen
sao:
4×4
Dim
ensa
o:
5×4
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,9
962
0,9
996
1,0
000
1,0
000
0,9
947
0,9
999
1,0
000
1,0
000
10,0
026
0,0
003
0,0
000
0,0
000
0,0
038
0,0
001
0,0
000
0,0
000
20,0
007
0,0
001
0,0
000
0,0
000
0,0
011
0,0
000
0,0
000
0,0
000
30,0
002
0,0
000
0,0
000
0,0
000
0,0
002
0,0
000
0,0
000
0,0
000
40,0
003
0,0
000
0,0
000
0,0
000
0,0
002
0,0
000
0,0
000
0,0
000
Vie
s(b)
0,0
058
0,0
005
0,0
000
0,0
000
0,0
074
0,0
001
0,0
000
0,0
000
EQ
M(b
)0,0
120
0,0
007
0,0
000
0,0
000
0,0
132
0,0
001
0,0
000
0,0
000
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
384
0,0
923
0,1
346
0,1
650
0,0
116
0,0
282
0,0
477
0,0
684
10,2
815
0,3
974
0,4
517
0,4
700
0,1
171
0,2
357
0,3
054
0,3
384
20,4
712
0,4
060
0,3
437
0,3
107
0,4
717
0,5
157
0,4
976
0,4
790
30,1
812
0,0
954
0,0
645
0,0
516
0,3
237
0,1
916
0,1
332
0,1
047
40,0
277
0,0
089
0,0
055
0,0
027
0,0
759
0,0
288
0,0
161
0,0
095
Vie
s(b)
1,8
783
1,5
312
1,3
546
1,2
570
2,3
352
1,9
571
1,7
646
1,6
485
EQ
M(b
)4,2
403
3,0
224
2,4
950
2,2
204
6,1
316
4,4
837
3,7
522
3,3
487
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
070
0,0
186
0,0
221
0,0
320
0,0
012
0,0
027
0,0
046
0,0
069
10,1
427
0,2
159
0,2
611
0,2
756
0,0
386
0,0
827
0,1
106
0,1
226
20,4
837
0,5
064
0,5
029
0,4
910
0,3
539
0,4
608
0,4
942
0,5
231
30,3
013
0,2
238
0,1
868
0,1
775
0,4
556
0,3
647
0,3
192
0,2
905
40,0
653
0,0
353
0,0
271
0,0
239
0,1
507
0,0
891
0,0
714
0,0
569
Vie
s(b)
2,2
752
2,0
413
1,9
357
1,8
857
2,7
160
2,4
548
2,3
422
2,2
679
EQ
M(b
)5,8
340
4,8
205
4,3
875
4,2
195
7,9
658
6,6
338
6,1
026
5,7
399
61
Tabela 4.24. Proporcoes de valores assumidos por b em 10.000experimentos quando b = 0, k = 6 e p = 4.
b = 0 Dimensao: 6×4
Sequencial
b N = 50 N = 100 N = 150 N = 200
0 0,9908 0,9998 1,0000 1,0000
1 0,0060 0,0001 0,0000 0,0000
2 0,0024 0,0001 0,0000 0,0000
3 0,0003 0,0000 0,0000 0,0000
4 0,0005 0,0000 0,0000 0,0000
Vies(b) 0,0137 0,0003 0,0000 0,0000
EQM(b) 0,0263 0,0005 0,0000 0,0000
BIC
b N = 50 N = 100 N = 150 N = 200
0 0,0010 0,0067 0,0153 0,0236
1 0,0407 0,1089 0,1653 0,2033
2 0,3332 0,4941 0,5292 0,5409
3 0,4671 0,3291 0,2524 0,2075
4 0,1580 0,0612 0,0378 0,0247
Vies(b) 2,7404 2,3292 2,1321 2,0064
EQM(b) 8,1054 6,0264 5,1585 4,6296
HQIC
b N = 50 N = 100 N = 150 N = 200
0 0,0000 0,0003 0,0005 0,0013
1 0,0076 0,0236 0,0381 0,0468
2 0,1820 0,3049 0,3693 0,4056
3 0,5261 0,5035 0,4609 0,4356
4 0,2843 0,1677 0,1312 0,1107
Vies(b) 3,0871 2,8147 2,6842 2,6076
EQM(b) 10,0193 8,4579 7,7626 7,3608
62
Tabela
4.2
5.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
1,k
=3,4
ep
=2.
b=
1D
imen
sao:
3×2
Dim
ensa
o:
4×2
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
026
0,0
000
0,0
000
0,0
000
0,0
052
0,0
000
0,0
000
0,0
000
10,4
418
0,5
220
0,5
641
0,5
948
0,3
506
0,3
953
0,4
508
0,4
780
20,5
556
0,4
780
0,4
359
0,4
052
0,6
442
0,6
047
0,5
492
0,5
220
Vie
s(b)
0,5
530
0,4
780
0,4
359
0,4
052
0,6
390
0,6
047
0,5
492
0,5
220
EQ
M(b
)0,5
582
0,4
780
0,4
359
0,4
052
0,6
494
0,6
047
0,5
492
0,5
220
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,2
282
0,3
046
0,3
363
0,3
560
0,1
063
0,1
479
0,1
763
0,1
935
20,7
718
0,6
954
0,6
637
0,6
440
0,8
937
0,8
521
0,8
237
0,8
065
Vie
s(b)
0,7
718
0,6
954
0,6
637
0,6
440
0,8
937
0,8
521
0,8
237
0,8
065
EQ
M(b
)0,7
718
0,6
954
0,6
637
0,6
440
0,8
937
0,8
521
0,8
237
0,8
065
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,1
771
0,2
337
0,2
449
0,2
555
0,0
722
0,0
955
0,1
137
0,1
221
20,8
229
0,7
663
0,7
551
0,7
445
0,9
278
0,9
045
0,8
863
0,8
779
Vie
s(b)
0,8
229
0,7
663
0,7
551
0,7
445
0,9
278
0,9
045
0,8
863
0,8
779
EQ
M(b
)0,8
229
0,7
663
0,7
551
0,7
445
0,9
278
0,9
045
0,8
863
0,8
779
63
Tabela
4.2
6.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
1,k
=5,6
ep
=2.
b=
1D
imen
sao:
5×2
Dim
ensa
o:
6×2
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
093
0,0
000
0,0
000
0,0
000
0,0
117
0,0
000
0,0
000
0,0
000
10,2
988
0,3
361
0,3
662
0,3
997
0,2
584
0,2
804
0,3
120
0,3
426
20,6
919
0,6
639
0,6
338
0,6
003
0,7
299
0,7
196
0,6
880
0,6
574
Vie
s(b)
0,6
826
0,6
639
0,6
338
0,6
003
0,7
182
0,7
196
0,6
880
0,6
574
EQ
M(b
)0,7
012
0,6
639
0,6
338
0,6
003
0,7
416
0,7
196
0,6
880
0,6
574
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
521
0,0
773
0,1
001
0,1
090
0,0
171
0,0
345
0,0
433
0,0
538
20,9
479
0,9
227
0,8
999
0,8
910
0,9
829
0,9
655
0,9
567
0,9
462
Vie
s(b)
0,9
479
0,9
227
0,8
999
0,8
910
0,9
829
0,9
655
0,9
567
0,9
462
EQ
M(b
)0,9
479
0,9
227
0,8
999
0,8
910
0,9
829
0,9
655
0,9
567
0,9
462
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
287
0,0
465
0,0
533
0,0
551
0,0
078
0,0
164
0,0
173
0,0
235
20,9
713
0,9
535
0,9
467
0,9
449
0,9
922
0,9
836
0,9
827
0,9
765
Vie
s(b)
0,9
713
0,9
535
0,9
467
0,9
449
0,9
922
0,9
836
0,9
827
0,9
765
EQ
M(b
)0,9
713
0,9
535
0,9
467
0,9
449
0,9
922
0,9
836
0,9
827
0,9
765
64
Tabela
4.2
7.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
1,k
=3,4
ep
=3.
b=
1D
imen
sao:
3×3
Dim
ensa
o:
4×3
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
002
0,0
000
0,0
000
0,0
000
0,0
003
0,0
000
0,0
000
0,0
000
10,3
708
0,4
928
0,5
549
0,5
903
0,2
792
0,3
558
0,4
384
0,4
770
20,4
819
0,4
263
0,3
810
0,3
487
0,4
699
0,4
714
0,4
274
0,4
044
30,1
471
0,0
809
0,0
641
0,0
610
0,2
506
0,1
728
0,1
342
0,1
186
Vie
s(b)
0,7
759
0,5
881
0,5
092
0,4
707
0,9
708
0,8
170
0,6
958
0,6
416
EQ
M(b
)1,0
705
0,7
499
0,6
374
0,5
927
1,4
726
1,1
626
0,9
642
0,8
788
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,1
116
0,1
737
0,2
054
0,2
127
0,0
366
0,0
637
0,0
779
0,0
965
20,6
206
0,6
563
0,6
507
0,6
476
0,4
470
0,5
317
0,5
561
0,5
694
30,2
678
0,1
700
0,1
439
0,1
397
0,5
164
0,4
046
0,3
660
0,3
341
Vie
s(b)
1,1
562
0,9
963
0,9
385
0,9
270
1,4
798
1,3
409
1,2
881
1,2
376
EQ
M(b
)1,6
918
1,3
363
1,2
263
1,2
064
2,5
126
2,1
501
2,0
201
1,9
058
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
714
0,1
070
0,1
157
0,1
157
0,0
177
0,0
306
0,0
333
0,0
389
20,5
990
0,6
536
0,6
652
0,6
606
0,3
831
0,4
657
0,4
850
0,5
047
30,3
296
0,2
394
0,2
191
0,2
237
0,5
992
0,5
037
0,4
817
0,4
564
Vie
s(b)
1,2
582
1,1
324
1,1
034
1,1
080
1,5
815
1,4
731
1,4
484
1,4
175
EQ
M(b
)1,9
174
1,6
112
1,5
416
1,5
554
2,7
799
2,4
805
2,4
118
2,3
303
65
Tabela
4.2
8.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
1,k
=5,6
ep
=3.
b=
1D
imen
sao:
5×3
Dim
ensa
o:
6×3
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
015
0,0
000
0,0
000
0,0
000
0,0
032
0,0
000
0,0
000
0,0
000
10,2
297
0,2
985
0,3
444
0,3
946
0,2
038
0,2
485
0,3
049
0,3
527
20,4
488
0,4
673
0,4
513
0,4
332
0,4
051
0,4
507
0,4
549
0,4
270
30,3
200
0,2
342
0,2
043
0,1
722
0,3
879
0,3
008
0,2
402
0,2
203
Vie
s(b)
1,0
873
0,9
357
0,8
599
0,7
776
1,1
777
1,0
523
0,9
353
0,8
676
EQ
M(b
)1,7
303
1,4
041
1,2
685
1,1
220
1,9
599
1,6
539
1,4
157
1,3
082
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
116
0,0
230
0,0
291
0,0
394
0,0
028
0,0
072
0,0
117
0,0
157
20,3
080
0,3
917
0,4
270
0,4
564
0,1
933
0,2
725
0,3
262
0,3
386
30,6
804
0,5
853
0,5
439
0,5
042
0,8
039
0,7
203
0,6
621
0,6
457
Vie
s(b)
1,6
688
1,5
623
1,5
148
1,4
648
1,8
011
1,7
131
1,6
504
1,6
300
EQ
M(b
)3,0
296
2,7
329
2,6
026
2,4
732
3,4
089
3,1
537
2,9
746
2,9
214
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
045
0,0
065
0,0
095
0,0
123
0,0
004
0,0
014
0,0
028
0,0
028
20,2
319
0,3
011
0,3
207
0,3
407
0,1
299
0,1
807
0,2
159
0,2
209
30,7
636
0,6
924
0,6
698
0,6
470
0,8
697
0,8
179
0,7
813
0,7
763
Vie
s(b)
1,7
591
1,6
859
1,6
603
1,6
347
1,8
693
1,8
165
1,7
785
1,7
735
EQ
M(b
)3,2
863
3,0
707
2,9
999
2,9
287
3,6
087
3,4
523
3,3
411
3,3
261
66
Tabela
4.2
9.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
1,k
=4,5
ep
=4.
b=
1D
imen
sao:
4×4
Dim
ensa
o:
5×4
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
004
0,0
000
0,0
000
0,0
000
0,0
018
0,0
000
0,0
000
0,0
000
10,2
148
0,2
983
0,3
864
0,4
179
0,1
834
0,2
572
0,3
061
0,3
619
20,3
940
0,4
330
0,4
060
0,4
021
0,3
341
0,3
892
0,3
930
0,3
887
30,3
248
0,2
389
0,1
891
0,1
628
0,3
613
0,2
781
0,2
462
0,2
116
40,0
660
0,0
298
0,0
185
0,0
172
0,1
194
0,0
755
0,0
547
0,0
378
Vie
s(b)
1,2
412
1,0
002
0,8
397
0,7
793
1,4
131
1,1
719
1,0
495
0,9
253
EQ
M(b
)2,2
876
1,6
568
1,3
289
1,2
081
2,8
557
2,1
811
1,8
701
1,5
753
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
090
0,0
218
0,0
290
0,0
318
0,0
018
0,0
056
0,0
085
0,0
121
20,2
104
0,3
081
0,3
522
0,3
794
0,0
962
0,1
712
0,2
015
0,2
319
30,6
162
0,5
754
0,5
448
0,5
304
0,5
283
0,5
412
0,5
482
0,5
512
40,1
644
0,0
947
0,0
740
0,0
584
0,3
737
0,2
820
0,2
418
0,2
048
Vie
s(b)
1,9
360
1,7
430
1,6
638
1,6
154
2,2
739
2,0
996
2,0
233
1,9
487
EQ
M(b
)4,1
548
3,4
620
3,1
974
3,0
266
5,5
727
4,8
740
4,5
705
4,2
799
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
035
0,0
077
0,0
087
0,0
081
0,0
002
0,0
011
0,0
014
0,0
018
20,1
453
0,2
173
0,2
461
0,2
604
0,0
534
0,0
920
0,1
108
0,1
205
30,6
326
0,6
263
0,6
136
0,6
250
0,4
864
0,5
192
0,5
422
0,5
656
40,2
186
0,1
487
0,1
316
0,1
065
0,4
600
0,3
877
0,3
456
0,3
121
Vie
s(b)
2,0
663
1,9
160
1,8
681
1,8
299
2,4
062
2,2
935
2,2
320
2,1
880
EQ
M(b
)4,6
431
4,0
608
3,8
849
3,7
189
6,1
390
5,6
581
5,3
900
5,1
918
67
Tabela 4.30. Proporcoes de valores assumidos por b em 10.000experimentos quando b = 1, k = 6 e p = 4.
b = 1 Dimensao: 6×4
Sequencial
b N = 50 N = 100 N = 150 N = 200
0 0,0024 0,0000 0,0000 0,0000
1 0,1651 0,2114 0,2649 0,3265
2 0,2791 0,3513 0,3726 0,3585
3 0,3544 0,3117 0,2749 0,2429
4 0,1990 0,1256 0,0876 0,0721
Vies(b) 1,5825 1,3515 1,1852 1,0606
EQM(b) 3,4901 2,7285 2,2606 1,9790
BIC
b N = 50 N = 100 N = 150 N = 200
0 0,0000 0,0000 0,0000 0,0000
1 0,0006 0,0012 0,0027 0,0036
2 0,0397 0,0782 0,1113 0,1306
3 0,3875 0,4583 0,4856 0,4956
4 0,5722 0,4623 0,4004 0,3702
Vies(b) 2,5313 2,3817 2,2837 2,2324
EQM(b) 6,7395 6,0721 5,6573 5,4448
HQIC
b N = 50 N = 100 N = 150 N = 200
0 0,0000 0,0000 0,0000 0,0000
1 0,0001 0,0001 0,0002 0,0003
2 0,0160 0,0313 0,0420 0,0565
3 0,3145 0,3893 0,4269 0,4367
4 0,6694 0,5793 0,5309 0,5065
Vies(b) 2,6532 2,5478 2,4885 2,4494
EQM(b) 7,2986 6,8022 6,5277 6,3618
68
Tabela
4.3
1.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
2,k
=3,4
ep
=2.
b=
2D
imen
sao:
3×2
Dim
ensa
o:
4×2
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
515
0,0
000
0,0
000
0,0
000
0,0
658
0,0
005
0,0
000
0,0
000
10,2
264
0,0
830
0,0
249
0,0
041
0,2
431
0,1
524
0,0
515
0,0
246
20,7
221
0,9
170
0,9
751
0,9
959
0,6
911
0,8
471
0,9
485
0,9
754
Vie
s(b)
-0,3
294
-0,0
830
-0,0
249
-0,0
041
-0,3
747
-0,1
534
-0,0
515
-0,0
246
EQ
M(b
)0,4
324
0,0
830
0,0
249
0,0
041
0,5
063
0,1
544
0,0
515
0,0
246
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
002
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
665
0,0
105
0,0
018
0,0
001
0,0
391
0,0
137
0,0
014
0,0
002
20,9
333
0,9
895
0,9
982
0,9
999
0,9
609
0,9
863
0,9
986
0,9
998
Vie
s(b)
-0,0
669
-0,0
105
-0,0
018
-0,0
001
-0,0
391
-0,0
137
-0,0
014
-0,0
002
EQ
M(b
)0,0
673
0,0
105
0,0
018
0,0
001
0,0
391
0,0
137
0,0
014
0,0
002
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
432
0,0
063
0,0
009
0,0
000
0,0
203
0,0
067
0,0
007
0,0
001
20,9
568
0,9
937
0,9
991
1,0
000
0,9
797
0,9
933
0,9
993
0,9
999
Vie
s(b)
-0,0
432
-0,0
063
-0,0
009
0,0
000
-0,0
203
-0,0
067
-0,0
007
-0,0
001
EQ
M(b
)0,0
432
0,0
063
0,0
009
0,0
000
0,0
203
0,0
067
0,0
007
0,0
001
69
Tabela
4.3
2.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
2,k
=5,6
ep
=2.
b=
2D
imen
sao:
5×2
Dim
ensa
o:
6×2
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
757
0,0
004
0,0
000
0,0
000
0,1
010
0,0
040
0,0
000
0,0
000
10,2
398
0,1
523
0,0
737
0,0
250
0,2
691
0,2
070
0,1
046
0,0
429
20,6
845
0,8
473
0,9
263
0,9
750
0,6
299
0,7
890
0,8
954
0,9
571
Vie
s(b)
-0,3
912
-0,1
531
-0,0
737
-0,0
250
-0,4
711
-0,2
150
-0,1
046
-0,0
429
EQ
M(b
)0,5
426
0,1
539
0,0
737
0,0
250
0,6
731
0,2
230
0,1
046
0,0
429
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
193
0,0
031
0,0
005
0,0
002
0,0
124
0,0
038
0,0
008
0,0
001
20,9
807
0,9
969
0,9
995
0,9
998
0,9
876
0,9
962
0,9
992
0,9
999
Vie
s(b)
-0,0
193
-0,0
031
-0,0
005
-0,0
002
-0,0
124
-0,0
038
-0,0
008
-0,0
001
EQ
M(b
)0,0
193
0,0
031
0,0
005
0,0
002
0,0
124
0,0
038
0,0
008
0,0
001
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
089
0,0
009
0,0
003
0,0
001
0,0
059
0,0
006
0,0
001
0,0
000
20,9
911
0,9
991
0,9
997
0,9
999
0,9
941
0,9
994
0,9
999
1,0
000
Vie
s(b)
-0,0
089
-0,0
009
-0,0
003
-0,0
001
-0,0
059
-0,0
006
-0,0
001
0,0
000
EQ
M(b
)0,0
089
0,0
009
0,0
003
0,0
001
0,0
059
0,0
006
0,0
001
0,0
000
70
Tabela
4.3
3.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
2,k
=3,4
ep
=3.
b=
2D
imen
sao:
3×3
Dim
ensa
o:
4×3
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
007
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,1
355
0,0
595
0,0
260
0,0
066
0,0
561
0,0
127
0,0
027
0,0
005
20,5
690
0,6
911
0,7
413
0,7
628
0,4
849
0,6
336
0,6
808
0,7
207
30,2
948
0,2
494
0,2
327
0,2
306
0,4
590
0,3
537
0,3
165
0,2
788
Vie
s(b)
0,1
579
0,1
899
0,2
067
0,2
240
0,4
029
0,3
410
0,3
138
0,2
783
EQ
M(b
)0,4
331
0,3
089
0,2
587
0,2
372
0,5
151
0,3
664
0,3
192
0,2
783
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
135
0,0
021
0,0
003
0,0
000
0,0
004
0,0
000
0,0
000
0,0
000
20,5
617
0,6
396
0,6
715
0,6
752
0,2
894
0,3
999
0,4
460
0,4
704
30,4
248
0,3
583
0,3
282
0,3
248
0,7
102
0,6
001
0,5
540
0,5
296
Vie
s(b)
0,4
113
0,3
562
0,3
279
0,3
248
0,7
098
0,6
001
0,5
540
0,5
296
EQ
M(b
)0,4
383
0,3
604
0,3
285
0,3
248
0,7
106
0,6
001
0,5
540
0,5
296
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
059
0,0
006
0,0
000
0,0
000
0,0
002
0,0
000
0,0
000
0,0
000
20,5
065
0,5
610
0,5
822
0,5
775
0,2
298
0,3
060
0,3
384
0,3
555
30,4
876
0,4
384
0,4
178
0,4
225
0,7
700
0,6
940
0,6
616
0,6
445
Vie
s(b)
0,4
817
0,4
378
0,4
178
0,4
225
0,7
698
0,6
940
0,6
616
0,6
445
EQ
M(b
)0,4
935
0,4
390
0,4
178
0,4
225
0,7
702
0,6
940
0,6
616
0,6
445
71
Tabela
4.3
4.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
2,k
=5,6
ep
=3.
b=
2D
imen
sao:
5×3
Dim
ensa
o:
6×3
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
003
0,0
000
0,0
000
0,0
000
0,0
070
0,0
000
0,0
000
0,0
000
10,0
725
0,0
123
0,0
026
0,0
005
0,1
800
0,1
067
0,0
599
0,0
335
20,4
072
0,5
034
0,5
673
0,6
267
0,3
484
0,4
272
0,4
795
0,5
298
30,5
200
0,4
843
0,4
301
0,3
728
0,4
646
0,4
661
0,4
606
0,4
367
Vie
s(b)
0,4
469
0,4
720
0,4
275
0,3
723
0,2
706
0,3
594
0,4
007
0,4
032
EQ
M(b
)0,5
937
0,4
966
0,4
327
0,3
733
0,6
726
0,5
728
0,5
205
0,4
702
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
002
0,0
000
0,0
000
0,0
000
0,0
008
0,0
002
0,0
001
0,0
000
20,1
636
0,2
126
0,2
424
0,2
897
0,1
162
0,1
426
0,1
642
0,1
736
30,8
362
0,7
874
0,7
576
0,7
103
0,8
830
0,8
572
0,8
357
0,8
264
Vie
s(b)
0,8
360
0,7
874
0,7
576
0,7
103
0,8
822
0,8
570
0,8
356
0,8
264
EQ
M(b
)0,8
364
0,7
874
0,7
576
0,7
103
0,8
838
0,8
574
0,8
358
0,8
264
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
002
0,0
000
0,0
000
0,0
000
0,0
002
0,0
000
0,0
000
0,0
000
20,1
162
0,1
441
0,1
615
0,1
796
0,0
677
0,0
811
0,0
929
0,0
974
30,8
836
0,8
559
0,8
385
0,8
204
0,9
321
0,9
189
0,9
071
0,9
026
Vie
s(b)
0,8
834
0,8
559
0,8
385
0,8
204
0,9
319
0,9
189
0,9
071
0,9
026
EQ
M(b
)0,8
838
0,8
559
0,8
385
0,8
204
0,9
323
0,9
189
0,9
071
0,9
026
72
Tabela
4.3
5.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
2,k
=4,5
ep
=4.
b=
2D
imen
sao:
4×4
Dim
ensa
o:
5×4
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
008
0,0
000
0,0
000
0,0
000
10,0
373
0,0
149
0,0
032
0,0
009
0,1
160
0,0
588
0,0
426
0,0
236
20,3
805
0,5
462
0,6
190
0,6
717
0,2
768
0,3
623
0,4
179
0,4
845
30,4
705
0,3
848
0,3
364
0,2
948
0,4
166
0,4
249
0,4
147
0,3
844
40,1
117
0,0
541
0,0
414
0,0
326
0,1
898
0,1
540
0,1
248
0,1
075
Vie
s(b)
0,6
566
0,4
781
0,4
160
0,3
591
0,6
786
0,6
741
0,6
217
0,5
758
EQ
M(b
)0,9
546
0,6
161
0,5
052
0,4
261
1,2
950
1,0
997
0,9
565
0,8
380
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
002
0,0
000
0,0
000
0,0
000
0,0
001
0,0
000
0,0
000
0,0
000
20,1
201
0,1
976
0,2
347
0,2
655
0,0
531
0,0
707
0,0
908
0,1
044
30,6
591
0,6
766
0,6
633
0,6
486
0,4
846
0,5
366
0,5
664
0,5
746
40,2
206
0,1
258
0,1
020
0,0
859
0,4
622
0,3
927
0,3
428
0,3
210
Vie
s(b)
1,1
001
0,9
282
0,8
673
0,8
204
1,4
089
1,3
220
1,2
520
1,2
166
EQ
M(b
)1,5
417
1,1
798
1,0
713
0,9
922
2,3
335
2,1
074
1,9
376
1,8
586
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
000
0,0
000
0,0
000
0,0
000
0,0
001
0,0
000
0,0
000
0,0
000
20,0
751
0,1
175
0,1
387
0,1
537
0,0
238
0,0
349
0,0
417
0,0
405
30,6
447
0,6
964
0,6
978
0,6
966
0,4
261
0,4
704
0,5
061
0,5
144
40,2
802
0,1
861
0,1
635
0,1
497
0,5
500
0,4
947
0,4
522
0,4
451
Vie
s(b)
1,2
051
1,0
686
1,0
248
0,9
960
1,5
260
1,4
598
1,4
105
1,4
046
EQ
M(b
)1,7
655
1,4
408
1,3
518
1,2
954
2,6
262
2,4
492
2,3
149
2,2
948
73
Tabela 4.36. Proporcoes de valores assumidos por b em 10.000experimentos quando b = 2, k = 6 e p = 4.
b = 2 Dimensao: 6×4
Sequencial
b N = 50 N = 100 N = 150 N = 200
0 0,0017 0,0000 0,0000 0,0000
1 0,1289 0,0819 0,0514 0,0354
2 0,2606 0,3293 0,4017 0,4402
3 0,3673 0,3933 0,3893 0,3706
4 0,2415 0,1955 0,1576 0,1538
Vies(b) 0,7180 0,7024 0,6531 0,6428
EQM(b) 1,4690 1,2572 1,0711 1,0212
BIC
b N = 50 N = 100 N = 150 N = 200
0 0,0000 0,0000 0,0000 0,0000
1 0,0000 0,0000 0,0000 0,0000
2 0,0185 0,0333 0,0411 0,0455
3 0,3371 0,4145 0,4566 0,4677
4 0,6444 0,5522 0,5023 0,4868
Vies(b) 1,6259 1,5189 1,4612 1,4413
EQM(b) 2,9147 2,6233 2,4658 2,4149
HQIC
b N = 50 N = 100 N = 150 N = 200
0 0,0000 0,0000 0,0000 0,0000
1 0,0000 0,0000 0,0000 0,0000
2 0,0066 0,0111 0,0139 0,0127
3 0,2597 0,3261 0,3553 0,3588
4 0,7337 0,6628 0,6308 0,6285
Vies(b) 1,7271 1,6517 1,6169 1,6158
EQM(b) 3,1945 2,9773 2,8785 2,8728
74
Tabela
4.3
7.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
3,k
=3,4
ep
=3.
b=
3D
imen
sao:
3×3
Dim
ensa
o:
4×3
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
047
0,0
000
0,0
000
0,0
000
0,0
063
0,0
000
0,0
000
0,0
000
10,0
582
0,0
034
0,0
001
0,0
000
0,0
843
0,0
119
0,0
013
0,0
001
20,2
293
0,0
743
0,0
183
0,0
018
0,2
583
0,1
379
0,0
495
0,0
175
30,7
078
0,9
223
0,9
816
0,9
982
0,6
511
0,8
502
0,9
492
0,9
824
Vie
s(b)
-0,3
598
-0,0
811
-0,0
185
-0,0
018
-0,4
458
-0,1
617
-0,0
521
-0,0
177
EQ
M(b
)0,5
044
0,0
879
0,0
187
0,0
018
0,6
522
0,1
855
0,0
547
0,0
179
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
026
0,0
001
0,0
000
0,0
000
0,0
003
0,0
000
0,0
000
0,0
000
20,1
770
0,0
343
0,0
058
0,0
003
0,1
102
0,0
308
0,0
056
0,0
011
30,8
204
0,9
656
0,9
942
0,9
997
0,8
895
0,9
692
0,9
944
0,9
989
Vie
s(b)
-0,1
822
-0,0
345
-0,0
058
-0,0
003
-0,1
108
-0,0
308
-0,0
056
-0,0
011
EQ
M(b
)0,1
874
0,0
347
0,0
058
0,0
003
0,1
114
0,0
308
0,0
056
0,0
011
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
009
0,0
000
0,0
000
0,0
000
0,0
001
0,0
000
0,0
000
0,0
000
20,1
349
0,0
176
0,0
020
0,0
002
0,0
713
0,0
168
0,0
022
0,0
001
30,8
642
0,9
824
0,9
980
0,9
998
0,9
286
0,9
832
0,9
978
0,9
999
Vie
s(b)
-0,1
367
-0,0
176
-0,0
020
-0,0
002
-0,0
715
-0,0
168
-0,0
022
-0,0
001
EQ
M(b
)0,1
385
0,0
176
0,0
020
0,0
002
0,0
717
0,0
168
0,0
022
0,0
001
75
Tabela
4.3
8.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
3,k
=5,6
ep
=3.
b=
3D
imen
sao:
5×3
Dim
ensa
o:
6×3
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
159
0,0
000
0,0
000
0,0
000
0,0
199
0,0
000
0,0
000
0,0
000
10,1
226
0,0
260
0,0
032
0,0
003
0,1
507
0,0
424
0,0
072
0,0
008
20,2
821
0,1
802
0,0
870
0,0
341
0,2
854
0,2
155
0,1
317
0,0
612
30,5
794
0,7
938
0,9
098
0,9
656
0,5
440
0,7
421
0,8
611
0,9
380
Vie
s(b)
-0,5
750
-0,2
322
-0,0
934
-0,0
347
-0,6
465
-0,3
003
-0,1
461
-0,0
628
EQ
M(b
)0,9
156
0,2
842
0,0
998
0,0
353
1,0
673
0,3
851
0,1
605
0,0
644
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
004
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
20,0
865
0,0
163
0,0
026
0,0
008
0,0
524
0,0
136
0,0
036
0,0
003
30,9
131
0,9
837
0,9
974
0,9
992
0,9
476
0,9
864
0,9
964
0,9
997
Vie
s(b)
-0,0
873
-0,0
163
-0,0
026
-0,0
008
-0,0
524
-0,0
136
-0,0
036
-0,0
003
EQ
M(b
)0,0
881
0,0
163
0,0
026
0,0
008
0,0
524
0,0
136
0,0
036
0,0
003
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
001
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
20,0
537
0,0
073
0,0
009
0,0
002
0,0
268
0,0
052
0,0
012
0,0
000
30,9
462
0,9
927
0,9
991
0,9
998
0,9
732
0,9
948
0,9
988
1,0
000
Vie
s(b)
-0,0
539
-0,0
073
-0,0
009
-0,0
002
-0,0
268
-0,0
052
-0,0
012
0,0
000
EQ
M(b
)0,0
541
0,0
073
0,0
009
0,0
002
0,0
268
0,0
052
0,0
012
0,0
000
76
Tabela
4.3
9.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
3,k
=4,5
ep
=4.
b=
3D
imen
sao:
4×4
Dim
ensa
o:
5×4
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
005
0,0
000
0,0
000
0,0
000
0,0
017
0,0
000
0,0
000
0,0
000
10,0
451
0,0
059
0,0
011
0,0
000
0,0
715
0,0
154
0,0
026
0,0
002
20,1
834
0,1
122
0,0
547
0,0
268
0,1
996
0,1
302
0,0
743
0,0
402
30,5
103
0,6
560
0,7
177
0,7
570
0,4
338
0,5
335
0,6
172
0,6
689
40,2
607
0,2
259
0,2
265
0,2
162
0,2
934
0,3
209
0,3
059
0,2
907
Vie
s(b)
-0,0
144
0,1
019
0,1
696
0,1
894
-0,0
543
0,1
599
0,2
264
0,2
501
EQ
M(b
)0,6
290
0,3
617
0,2
856
0,2
430
0,7
943
0,5
127
0,3
906
0,3
317
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
20,0
310
0,0
090
0,0
012
0,0
008
0,0
160
0,0
037
0,0
004
0,0
000
30,5
696
0,6
500
0,6
696
0,6
863
0,4
009
0,4
136
0,4
455
0,4
687
40,3
994
0,3
410
0,3
292
0,3
129
0,5
831
0,5
827
0,5
541
0,5
313
Vie
s(b)
0,3
684
0,3
320
0,3
280
0,3
121
0,5
671
0,5
790
0,5
537
0,5
313
EQ
M(b
)0,4
304
0,3
500
0,3
304
0,3
137
0,5
991
0,5
864
0,5
545
0,5
313
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
20,0
158
0,0
037
0,0
002
0,0
000
0,0
068
0,0
010
0,0
000
0,0
000
30,5
204
0,5
784
0,5
848
0,5
907
0,3
309
0,3
221
0,3
356
0,3
465
40,4
638
0,4
179
0,4
150
0,4
093
0,6
623
0,6
769
0,6
644
0,6
535
Vie
s(b)
0,4
480
0,4
142
0,4
148
0,4
093
0,6
555
0,6
759
0,6
644
0,6
535
EQ
M(b
)0,4
796
0,4
216
0,4
152
0,4
093
0,6
691
0,6
779
0,6
644
0,6
535
77
Tabela 4.40. Proporcoes de valores assumidos por b em 10.000experimentos quando b = 3, k = 6 e p = 4.
b = 3 Dimensao: 6×4
Sequencial
b N = 50 N = 100 N = 150 N = 200
0 0,0027 0,0000 0,0000 0,0000
1 0,0935 0,0239 0,0050 0,0010
2 0,1940 0,1408 0,0938 0,0570
3 0,3625 0,4654 0,5617 0,5926
4 0,3473 0,3699 0,3395 0,3494
Vies(b) -0,0418 0,1813 0,2357 0,2904
EQM(b) 0,9396 0,6063 0,4533 0,4104
BIC
b N = 50 N = 100 N = 150 N = 200
0 0,0000 0,0000 0,0000 0,0000
1 0,0001 0,0000 0,0000 0,0000
2 0,0063 0,0017 0,0005 0,0000
3 0,2535 0,2736 0,3117 0,3156
4 0,7401 0,7247 0,6878 0,6844
Vies(b) 0,7336 0,7230 0,6873 0,6844
EQM(b) 0,7468 0,7264 0,6883 0,6844
HQIC
b N = 50 N = 100 N = 150 N = 200
0 0,0000 0,0000 0,0000 0,0000
1 0,0000 0,0000 0,0000 0,0000
2 0,0015 0,0004 0,0000 0,0000
3 0,1792 0,1866 0,2094 0,2092
4 0,8193 0,8130 0,7906 0,7908
Vies(b) 0,8178 0,8126 0,7906 0,7908
EQM(b) 0,8208 0,8134 0,7906 0,7908
78
Tabela
4.4
1.
Pro
porc
oes
de
valo
res
ass
um
idos
por
bem
10.0
00
exper
imen
tos
quando
b=
4,k
=4,5
ep
=4.
b=
4D
imen
sao:
4×4
Dim
ensa
o:
5×4
Sequencia
lSequencia
l
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
018
0,0
000
0,0
000
0,0
000
0,0
046
0,0
000
0,0
000
0,0
000
10,0
266
0,0
013
0,0
000
0,0
000
0,0
482
0,0
023
0,0
002
0,0
000
20,0
949
0,0
153
0,0
009
0,0
001
0,1
248
0,0
251
0,0
042
0,0
003
30,2
952
0,1
352
0,0
387
0,0
104
0,3
046
0,1
731
0,0
909
0,0
289
40,5
815
0,8
482
0,9
604
0,9
895
0,5
178
0,7
995
0,9
047
0,9
708
Vie
s(b)
-0,5
720
-0,1
697
-0,0
405
-0,0
106
-0,7
172
-0,2
302
-0,0
999
-0,0
295
EQ
M(b
)0,9
430
0,2
081
0,0
423
0,0
108
1,3
112
0,2
942
0,1
095
0,0
301
BIC
BIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
20,0
089
0,0
004
0,0
000
0,0
000
0,0
035
0,0
000
0,0
000
0,0
000
30,2
708
0,0
825
0,0
144
0,0
033
0,2
111
0,0
431
0,0
117
0,0
019
40,7
203
0,9
171
0,9
856
0,9
967
0,7
854
0,9
569
0,9
883
0,9
981
Vie
s(b)
-0,2
886
-0,0
833
-0,0
144
-0,0
033
-0,2
181
-0,0
431
-0,0
117
-0,0
019
EQ
M(b
)0,3
064
0,0
841
0,0
144
0,0
033
0,2
251
0,0
431
0,0
117
0,0
019
HQ
ICH
QIC
bN
=50
N=
100
N=
150
N=
200
N=
50
N=
100
N=
150
N=
200
00,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
10,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
0,0
000
20,0
034
0,0
001
0,0
000
0,0
000
0,0
007
0,0
000
0,0
000
0,0
000
30,2
206
0,0
552
0,0
072
0,0
011
0,1
536
0,0
235
0,0
039
0,0
004
40,7
760
0,9
447
0,9
928
0,9
989
0,8
457
0,9
765
0,9
961
0,9
996
Vie
s(b)
-0,2
274
-0,0
554
-0,0
072
-0,0
011
-0,1
550
-0,0
235
-0,0
039
-0,0
004
EQ
M(b
)0,2
342
0,0
556
0,0
072
0,0
011
0,1
564
0,0
235
0,0
039
0,0
004
79
Tabela 4.42. Proporcoes de valores assumidos por b em 10.000experimentos quando b = 4, k = 6 e p = 4.
b = 4 Dimensao: 6×4
Sequencial
b N = 50 N = 100 N = 150 N = 200
0 0,0063 0,0000 0,0000 0,0000
1 0,0730 0,0069 0,0003 0,0000
2 0,1633 0,0506 0,0099 0,0021
3 0,2983 0,2248 0,1372 0,0663
4 0,4591 0,7177 0,8526 0,9316
Vies(b) -0,8691 -0,3467 -0,1579 -0,0705
EQM(b) 1,7093 0,4893 0,1795 0,0747
BIC
b N = 50 N = 100 N = 150 N = 200
0 0,0000 0,0000 0,0000 0,0000
1 0,0000 0,0000 0,0000 0,0000
2 0,0026 0,0001 0,0000 0,0000
3 0,1534 0,0418 0,0103 0,0023
4 0,8440 0,9581 0,9897 0,9977
Vies(b) -0,1586 -0,0420 -0,0103 -0,0023
EQM(b) 0,1638 0,0422 0,0103 0,0023
HQIC
b N = 50 N = 100 N = 150 N = 200
0 0,0000 0,0000 0,0000 0,0000
1 0,0000 0,0000 0,0000 0,0000
2 0,0007 0,0000 0,0000 0,0000
3 0,0976 0,0206 0,0037 0,0005
4 0,9017 0,9794 0,9963 0,9995
Vies(b) -0,0990 -0,0206 -0,0037 -0,0005
EQM(b) 0,1004 0,0206 0,0037 0,0005
80
Capıtulo 5
Aplicacao
Ao longo deste capıtulo, apresentaremos duas aplicacoes onde nosso interesse e estimaro posto da matriz de parametros do modelo de regressao Dirichlet, utilizando dados reais.Para isso usamos a segunda parametrizacao definida na secao 2.2.3, devido a sua maiorsimplicidade, o teste sequencial e os criterios de informacao BIC e HQIC descritos no capıtulo3.
Consideramos dois conjuntos de dados apresentados por Aitchison (2003), os quais de-notaremos por Dados 1 e Dados 2, que estao disponıveis no apendice 4.
5.1. Dados do polen fossilizado em flores
Nesta secao consideramos um conjunto de dados que contem 30 observacoes. A variaveldependente Y deste estudo e o vetor de proporcoes de polen fossilizado de tres tipos deflores: Pinus, Abies e Quercus. As variaveis explicativas binarias (dummy) X que modelamas proporcoes correspondem a tres locais onde o polen fossilizado das flores e colhido. Logo,temos que k = p = 3.
Os parametros do modelo de regressao sao estimados atraves da maximizacao da funcaode log-verossimilhanca utilizando o metodo quasi-Newton BFGS com primeiras derivadasnumericas; no esquema iterativo usamos como valor inicial para B a matriz nula. Na tabela5.1 apresentamos as estimativas de maxima verossimilhanca (EMV) desses parametros.
Tabela 5.1. EMV dos parametros da matriz B para os Dados 1.
β11 1,87141 β12 2,58843 β13 1,53982β21 2,30180 β22 2,83115 β23 2,32410β31 2,75677 β32 2,48318 β33 1,07470
Apos a estimacao da matriz B usamos a decomposicao em valores singulares de B eobtemos a matriz de informacao observada de Fisher para calcular a estatıstica de testeL(b), descrita na secao 3.1.2, que converge em distribuicao para uma qui-quadrado com(3 − b)2 graus de liberdade; o nıvel de significancia foi o mesmo usado na simulacao, de5%. Como ja visto no capıtulo 3, o valor crıtico da estatıstica de teste L(b) e γb C30, ondeγb representa o quantil da distribuicao χ2
(3−b)(3−b) e C30 =√
log 30. Na tabela 5.2 temos
os valores da estatıstica de teste L(b) para b = 0, 1 e 2 e seus respectivos valores crıticos.Observamos que para todos os valores de b a estatıstica L(b) e maior que γb C30, entao,
81
usando o teste sequencial, temos b = 3.
Tabela 5.2. Estatısticas de teste L(b) e seusrespectivos valores crıticos γb C30.
b L(b) γb C30
0 291,9588 31,20251 83,8572 17,49762 9,5065 7,0845
Na tabela 5.3 temos, para cada criterio de informacao considerado na secao 3.3, os valoresda funcao criterio, em cada ponto b = 0, 1, 2 e 3, lembrando que L(3) = 0. Percebemos queos menores valores que as funcoes criterio BIC e HQIC assumem sao 10.2036 e 7.3815,
respectivamente, para b = 3, isto implica que b = 3.
Tabela 5.3. Funcao criterio para BIC e HQIC.
b BIC(b, C30) HQIC(b, C30)
0 291,9588 291,95881 87,2584 86,31772 16,3089 14,42753 10,2036 7,3815
Pelo teste sequencial e pelos criterios de informacao BIC e HQIC temos que b = 3; istosignifica que aceitamos que a matriz B tem posto completo. Baseado nisso nao ha comoreduzir a quantidade de parametros da matriz B para estimacao.
5.2. Dados da composicao de leucocitos no sangue
O segundo conjunto de dados contem 40 observacoes, mas duas foram desconsideradaspor problemas de arredondamento. Entao, para nosso estudo, consideramos apenas 38 obser-vacoes. A variavel dependente Y e o vetor de proporcoes de tres tipos de leucocitos em amos-tras de sangue de dez pacientes. Os tres tipos de leucocitos sao: leucocitos polimorfonucle-ares, linfocitos pequenos e mononucleares grandes. As variaveis explicativas (dummy) corres-pondem a quatro metodos diferentes que avaliam a composicao de leucocitos nas amostrasde sangue. Entao agora temos que k = 4 e p = 3.
Para calcular as estimativas de maxima verossimilhanca (EMV) de B utilizamos o mesmoprocedimento de estimacao descrito na secao anterior. Estas estimativas estao apresentadasna tabela 5.4.
82
Tabela 5.4. EMV dos parametros da matriz B para os Dados 2.
β11 2,58136 β12 1,17376 β13 1,35387β21 1,61533 β22 1,99360 β23 0,27110β31 1,71084 β32 1,39066 β33 0,38854β41 2,05352 β42 1,62212 β43 0,66549
Apos a estimacao da matriz B calculamos a estatıstica de teste L(b), que converge emdistribuicao para uma qui-quadrado com (4 − b)(3 − b) graus de liberdade, e um nıvel designificancia de 5%. Para b = 0, 1 e 2 apresentamos os valores da estatıstica de teste L(b) eseus respectivos valores crıticos, ver tabela 5.5. Notamos que L(2) ≤ γ2 C38, entao, usando
o teste sequencial, consideramos que b = 2.
Tabela 5.5. Estatısticas de teste L(b) e seus
respectivos valores crıticos γb C38.
b L(b) γb C38
0 237,4092 40,10191 52,7538 24,01532 0,8070 11,4272
Na tabela 5.6 temos para cada criterio de informacao considerado os valores das funcoescriterio em cada ponto b = 0, 1, 2 e 3. Percebemos que os menores valores que as funcoes
criterio assumem sao BIC(2, C38) = 8.0821 e HQIC(2, C38) = 5.9981; isto implica que b = 2.
Tabela 5.6. Funcao criterio para BIC e HQIC.
b BIC(b, C38) HQIC(b, C38)
0 237,4092 237,40921 56,3913 55,34932 8,0821 5,99813 10,9128 7,7867
Usando o teste sequencial e os criterios de informacao BIC e HQIC aceitamos que b = 2,ou seja, que B nao tem posto completo com isso nao precisamos estimar os doze parametrosda matriz B, mas apenas dez. Entao temos uma nova matriz de parametros onde podemosescrever, por exemplo, a terceira coluna como combinacao linear das duas primeiras usandodois novos parametros, k1 e k2, ou seja,
83
B∗ =
β∗11 β∗12 k1β∗11 + k2β
∗12
β∗21 β∗22 k1β∗21 + k2β
∗22
β∗31 β∗32 k1β∗31 + k2β
∗32
β∗41 β∗42 k1β∗41 + k2β
∗42
.
Depois de estimar os dez parametros da matriz B∗ obtemos
k1 = 0.742178
k2 = −0.525821
onde k1 e k2 sao os estimadores de maxima verossimilhanca de k1 e k2, respectivamente.
As estimativas da matriz B∗ nao diferem muito das estimativas de B. Por exemplo, β∗13 =
1, 29432 enquanto β13 = 1, 35387; β∗43 = 0, 67124 e β43 = 0, 66549; isso pode ser visto nastabelas 5.4 e 5.7.
Tabela 5.7. EMV dos parametros da matriz B∗.
β∗11 2,53893 β∗12 1,12208 β∗13 1,29432β∗21 1,56760 β∗22 1,91829 β∗23 0,15476β∗31 1,77440 β∗32 1,49148 β∗33 0,53267β∗41 2,05667 β∗42 1,62638 β∗43 0,67124
Denotaremos os modelos em que as matrizes de parametros B e B∗ sao usadas porMod e Mod∗, respectivamente. Os valores dos coeficientes de correlacao amostral ρ, com
−1 ≤ ρ ≤ 1, entre as colunas de η = XB e as de g(Y ), bem como entre as colunas de
η∗ = XB∗ e as de g(Y ) podem ser vistos na tabela 5.8, onde X e a matriz de variaveisexplicativas e g(·) e a inversa da funcao de ligacao usada no modelo 2. Observamos que osvalores de ρ(η, g(Y )) e ρ(η∗, g(Y )) sao parecidos, o que indica que o poder explicativo dosmodelos Mod e Mod∗ sao semelhantes. Porem, o modelo Mod∗ apresenta a vantagem de sermais parcimonioso.
Tabela 5.8. Coeficientes de correlacao entre η e g(Y )e entre η∗ e g(Y ).
0,48700 -0,71965 0,42718ρ(η, g(Y )) -0,50937 0,72380 -0,36196
0,48780 -0,71882 0,43394
0,51108 -0,75104 0,42908ρ(η∗, g(Y )) -0,52414 0,75235 -0,40720
0,53001 -0,77229 0,43293
84
Uma medida muito utilizada na selecao de modelos e o criterio de informacao BIC(Bayesian Information Criteria), proposto por Schwarz (1978), dado pela expressao
BIC = −2 log(L) + npar log(N),
onde L e a verossimilhanca estimada e npar e o numero de parametros do modelo. A escolhado melhor modelo para a variavel resposta e dada pelo menor BIC.
Para o modelo Mod obtemos BIC = −108.404 com log(L) = 76.0273 enquanto que para
o modelo Mod∗ obtemos BIC = −115.244, onde log(L) = 75.8101. Portanto, o modelo quemelhor se ajusta a variavel resposta de acordo com o criterio BIC e Mod∗.
A matriz B∗ contem dois parametros a menos que a matriz B, alem disso o modeloem que usamos B∗ parece estar melhor ajustado que o modelo em que usamos a matriz B.Significa que Mod∗ parece ser preferıvel.
85
Capıtulo 6
Conclusoes
Ao longo deste trabalho consideramos dois modelos de regressao Dirichlet e apresentamosalgumas de suas propriedades. Obtemos as expressoes da matriz de informacao de Fisherreferentes aos dois modelos, como pode ser visto nos apendices 1 e 2. Apresentamos umteste proposto por Ratsimalahelo (2003) que permite determinar quantos valores singularesde uma matriz sao significantemente diferentes de zero. Estimamos o posto b da matriz Bde coeficientes destes modelos de regressao atraves da estatıstica de teste proposta por Rat-simalahelo (2003), utilizando o procedimento de teste sequencial e os criterios de informacaoBIC e HQIC.
Atraves das simulacoes de Monte Carlo, observamos na maioria das vezes que o vies e oerro quadratico medio do estimador de b parecem decrescer quando N aumenta. Notamosque na maioria dos casos, as estimativas de b tornam-se mais viesadas quando acrescentamosvariaveis explicativas nos modelos e/ou quando aumentamos o numero de componentes decada vetor de observacoes. Observamos ainda que, se a matriz B nao tem posto completo,o procedimento de teste sequencial tem um desempenho bem melhor, em termos de vies eerro quadratico medio, do que os criterios de informacao BIC e HQIC; se a matriz B temposto completo, o criterio de informacao HQIC tem desempenho ligeiramente melhor que ocriterio de informacao BIC e o procedimento de teste sequencial, nos modelos 1 e 2. Entao,em geral, recomendamos o procedimento de teste sequencial, para estimacao do posto damatriz dos parametros dos modelos de regressao Dirichlet.
Como trabalhos futuros, que poderiam estender essa pesquisa, podemos sugerir a corre-cao da estimativa do teste, o estudo do desempenho do estimador na presenca de pontosde alavanca, a proposta de modelos alternativos para dados de proporcoes baseados nadistribuicao Dirichlet, o desenvolvimento de medidas de diagnostico para estes modelos e aidentificacao da melhor combinacao linear no caso do posto incompleto.
86
Apendice 1
Apresentamos neste apendice os calculos das derivadas, de primeira e segunda ordem,da funcao de log-verossimilhanca com relacao aos parametros desconhecidos referentes aomodelo 1.
A funcao de log-verossimilhanca para o modelo de regressao Dirichlet definido nestetrabalho e da forma
`(B; φ) =N∑
i=1
`i(µi; φ),
onde
`i(µi; φ) = log Γ(φ)−p−1∑
j=1
log Γ(φµij)− log Γ[φ(1−
p−1∑
j=1
µij
)]
+
p−1∑
j=1
(φµij − 1) log yij +[φ(1−
p−1∑
j=1
µij
)− 1
]log
(1−
p−1∑
j=1
yij
).
A derivada de primeira ordem da funcao de log-verossimilhanca com relacao aos para-metros desconhecidos βvu’s, com v = 1, . . . , k e u = 1, . . . , p− 1, e
∂` (B; φ)
∂βvu=
N∑
i=1
∂`i(µi; φ)
∂βvu
=N∑
i=1
∂
∂βvu
{log Γ(φ)−
p−1∑
j=1
log Γ(φµij)− log Γ[φ(1−
p−1∑
j=1
µij
)]
+
p−1∑
j=1
(φµij − 1) log yij +[φ(1−
p−1∑
j=1
µij
)− 1
]log
(1−
p−1∑
j=1
yij
)}
=N∑
i=1
{(−
p−1∑
j=1
∂
∂βvulog Γ(φµij)
)−
(∂
∂βvulog Γ
[φ(1−
p−1∑
j=1
µij
)])
+
p−1∑
j=1
∂
∂βvu
((φµij − 1) log yij
)+
∂
∂βvu
([φ(1−
p−1∑
j=1
µij
)− 1
]
log[1−
p−1∑
j=1
yij
])}
87
=N∑
i=1
{−
p−1∑
j=1
φψ(φµij)∂µij
∂ηiu
∂ηiu
∂βvu+ φψ
[φ(1−
p−1∑
j=1
µij
)] p−1∑
j=1
∂µij
∂ηiu
∂ηiu
∂βvu
+
p−1∑
j=1
φ log yij∂µij
∂ηiu
∂ηiu
∂βvu− φ log
[1−
p−1∑
j=1
yij
] p−1∑
j=1
∂µij
∂ηiu
∂ηiu
∂βvu
}
mas
ηij = Xi1β1j + Xi2β2j + Xi3β3j + . . . + Xikβkj ,
logo
∂ηij
∂βvu=
{Xiv se j = u0 se j 6= u,
(A1.1)
entao
∂` (B; φ)
∂βvu=
N∑
i=1
{−
p−1∑
j=1
φψ(φµij)∂µij
∂ηiuXiv + φψ
[φ(1−
p−1∑
j=1
µij
)] p−1∑
j=1
∂µij
∂ηiuXiv
+
p−1∑
j=1
φ log yij∂µij
∂ηiuXiv − φ log
[1−
p−1∑
j=1
yij
] p−1∑
j=1
∂µij
∂ηiuXiv
=N∑
i=1
φXiv
{−
p−1∑
j=1
ψ(φµij)∂µij
∂ηiu+ ψ
[φ(1−
p−1∑
j=1
µij
)] p−1∑
j=1
∂µij
∂ηiu
+
p−1∑
j=1
log yij∂µij
∂ηiu− log
[1−
p−1∑
j=1
yij
] p−1∑
j=1
∂µij
∂ηiu
=N∑
i=1
φXiv
p−1∑
j=1
{−ψ(φµij) + ψ
[φ(1−
p−1∑
j=1
µij
)]+ log yij
− log[1−
p−1∑
j=1
yij
]}∂µij
∂ηiu
=N∑
i=1
φXiv
p−1∑
j=1
Aij∂µij
∂ηiu
onde
Aij = −ψ(φµij) + ψ[φ(1−
p−1∑
j=1
µij
)]+ log yij − log
[1−
p−1∑
j=1
yij
].
88
Temos que
µij =
g(ηij) se j = 1,
g(ηij)[1−j−1∑
t=1
µit] se j = 2, 3, . . . , p− 1,(A1.2)
entao
∂µij
∂ηiu=
0 se j < u,
g′(ηiu) se j = u = 1,
g′(ηiu)[1−u−1∑
t=1
µit] se j = u 6= 1,
− g′(ηiu)g(ηij)[1−u−1∑
t=1
µit] se j = u + 1,
− g′(ηiu)g(ηij)[1−u−1∑
t=1
µit]
j−1∏
t=u+1
[1− g(ηit)] se j ≥ u + 2.
(A1.3)
Usando (A1.3) temos que
∂` (B; φ)
∂βvu=
N∑
i=1
φXiv
{p−1∑
j=1
Aij∂µij
∂ηiu
}
=N∑
i=1
φXiv
{u−1∑
j=1
Aij∂µij
∂ηiu+ Aiu
∂µiu
∂ηiu+ Ai(u+1)
∂µi(u+1)
∂ηiu+
p−1∑
j=u+2
Aij∂µij
∂ηiu
}
=N∑
i=1
φXiv
{0 + Aiu
∂µiu
∂ηiu+ Ai(u+1)
∂µi(u+1)
∂ηiu+
p−1∑
j=u+2
Aij∂µij
∂ηiu
}
=N∑
i=1
φXiv
{Aiu g′(ηiu)[1−
u−1∑
t=1
µit]− Ai(u+1) g′(ηiu)g(ηij)[1−u−1∑
t=1
µit]
−p−1∑
j=u+2
Aij g′(ηiu)g(ηij)[1−u−1∑
t=1
µit]
j−1∏
t=u+1
[1− g(ηit)]
}
89
=N∑
i=1
φXiv g′(ηiu)[1−u−1∑
t=1
µit]
{Aiu − Ai(u+1) g(ηi(u+1))
−p−1∑
j=u+2
Aij g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
}.
Portanto,
∂` (B; φ)
∂βvu=
N∑
i=1
φXiv g′(ηiu) [1−u−1∑
t=1
µit]
{Aiu − Ai(u+1)g(ηi(u+1))
−p−1∑
j=u+2
[Aij g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
]}.
Adicionalmente, a derivada de primeira ordem da funcao de log-verossimilhanca comrelacao ao parametro desconhecido φ e
∂` (B; φ)
∂φ=
N∑
i=1
{ψ(φ) +
p∑
j=1
[−ψ(φµij)µij + log yijµij ]
}. (A1.4)
Para o calculo da matriz de informacao de Fisher precisamos da derivada de segundaordem da funcao de log-verossimilhanca com relacao aos parametros desconhecidos, entao,para v, n ∈ (1, 2, . . . , k) e u, m ∈ (1, 2, . . . , p− 1), temos
∂
∂βnm
{∂` (B; φ)
∂βvu
}=
∂
∂βnm
{ N∑
i=1
φXivg′(ηiu)[1−
u−1∑
t=1
µit]
[Aiu − Ai(u+1)g(ηi(u+1))
−p−1∑
j=u+2
(Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]}
=N∑
i=1
φXiv∂
∂βnm
{g′(ηiu)[1−
u−1∑
t=1
µit]
[Aiu − Ai(u+1)g(ηi(u+1))
−p−1∑
j=u+2
(Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]}
=N∑
i=1
φXiv Der1,
90
onde
Der1 =∂
∂βnm
{g′(ηiu)[1−
u−1∑
t=1
µit]
[Aiu − Ai(u+1)g(ηi(u+1))
−p−1∑
j=u+2
Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
]}
=∂
∂βnm
(g′(ηiu)[1−
u−1∑
t=1
µit]
)(Aiu − Ai(u+1)g(ηi(u+1))−
p−1∑
j=u+2
(Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
))+ g′(ηiu)[1−
u−1∑
t=1
µit]
{∂Aiu
∂βnm− ∂Ai(u+1)
∂βnmg(ηi(u+1))
− Ai(u+1)g′(ηi(u+1))
∂ηi(u+1)
∂βnm−
p−1∑
j=u+2
[∂Aij
∂βnmg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
+ Aijg′(ηij)
∂ηij
∂βnm
j−1∏
t=u+1
[1− g(ηit)] + Aijg(ηij)∂
∂βnm
( j−1∏
t=u+1
[1− g(ηit)]
)]}
=
(g′′(ηiu)
∂ηiu
∂βnm[1−
u−1∑
t=1
µit]− g′(ηiu)u−1∑
t=1
∂µit
∂βnm
)(Aiu − Ai(u+1)g(ηi(u+1))
−p−1∑
j=u+2
Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)+ g′(ηiu)[1−
u−1∑
t=1
µit]
{∂Aiu
∂βnm− ∂Ai(u+1)
∂βnmg(ηi(u+1))− Ai(u+1)g
′(ηi(u+1))∂ηi(u+1)
∂βnm
−p−1∑
j=u+2
[(∂Aij
∂βnmg(ηij) + Aijg
′(ηij)∂ηij
∂βnm
) j−1∏
t=u+1
[1− g(ηit)]
+ Aijg(ηij)∂
∂βnm
( j−1∏
t=u+1
[1− g(ηit)]
)]}
=
(g′′(ηiu)
∂ηiu
∂βnm[1−
u−1∑
t=1
µit]− g′(ηiu)u−1∑
t=1
∂µit
∂βnm
)(Aiu − Ai(u+1)g(ηi(u+1))
−p−1∑
j=u+2
Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)+ g′(ηiu)[1−
u−1∑
t=1
µit]
91
{∂Aiu
∂βnm− ∂Ai(u+1)
∂βnmg(ηi(u+1))−
p−1∑
j=u+2
∂Aij
∂βnmg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
− Ai(u+1)g′(ηi(u+1))
∂ηi(u+1)
∂βnm−
p−1∑
j=u+2
Aijg′(ηij)
∂ηij
∂βnm
j−1∏
t=u+1
[1− g(ηit)]
−p−1∑
j=u+2
Aijg(ηij)∂
∂βnm
( j−1∏
t=u+1
[1− g(ηit)]
)}.
Tem-se
∂Aij
∂βnm=
∂
∂βnm
{− ψ(φµij) + ψ
[φ(1−
p−1∑
j=1
µij
)]+ log yij − log
[1−
p−1∑
j=1
yij
]}
= −φψ′(φµij)∂µij
∂ηimXin − φψ′
[φ(1−
p−1∑
j=1
µij
)] p−1∑
j=1
∂µij
∂ηimXin,
mas
p−1∑
j=1
∂µij
∂ηim=
m−1∑
j=1
∂µij
∂ηim+
∂µim
∂ηim+
p−1∑
j=m+1
∂µij
∂ηim
= 0 +∂µim
∂ηim+
∂µi(m+1)
∂ηim
p−1∑
j=m+2
∂µij
∂ηim
= g′(ηim) [1−m−1∑
t=1
µit]− g′(ηim) [1−m−1∑
t=1
µit] g(ηi(m+1))
−p−1∑
j=m+2
g′(ηim) [1−m−1∑
t=1
µit] g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
= g′(ηim) [1−m−1∑
t=1
µit]
(1− g(ηi(m+1))−
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
).
Logo
92
∂Aij
∂βnm= −φψ′(φµij)
∂µij
∂ηimXin − φψ′
[φ(1−
p−1∑
j=1
µij
)]Xin g′(ηim) [1−
m−1∑
t=1
µit]
(1− g(ηi(m+1)) −
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)
= −φXin
[ψ′(φµij)
∂µij
∂ηim+ ψ′
[φ(1−
p−1∑
j=1
µij
)]g′(ηim) [1−
m−1∑
t=1
µit]
(1− g(ηi(m+1)) −
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)].
(A1.5)
Daı,
Der1 =
(g′′(ηiu)
∂ηiu
∂βnm[1−
u−1∑
t=1
µit]− g′(ηiu)u−1∑
t=1
∂µit
∂βnm
)(Aiu − Ai(u+1)g(ηi(u+1))
−p−1∑
j=u+2
Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)+ g′(ηiu)[1−
u−1∑
t=1
µit]
{−φXin
[ψ′(φµiu)
∂µiu
∂ηim+ ψ′
[φ(1−
p−1∑
j=1
µij
)]g′(ηim) [1−
m−1∑
t=1
µit]
(1− g(ηi(m+1)) −
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)]
+ φXin
[ψ′(φµi(u+1))
∂µi(u+1)
∂ηim+ ψ′
[φ(1−
p−1∑
j=1
µij
)]g′(ηim) [1−
m−1∑
t=1
µit]
(1− g(ηi(m+1)) −
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)]g(ηi(u+1))
+
p−1∑
j=u+2
φXin
[ψ′(φµij)
∂µij
∂ηim+ ψ′
[φ(1−
p−1∑
j=1
µij
)]g′(ηim) [1−
m−1∑
t=1
µit]
(1− g(ηi(m+1)) −
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)]g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
93
− Ai(u+1)g′(ηi(u+1))
∂ηi(u+1)
∂βnm−
p−1∑
j=u+2
Aijg′(ηij)
∂ηij
∂βnm
j−1∏
t=u+1
[1− g(ηit)]
−p−1∑
j=u+2
Aijg(ηij)∂
∂βnm
( j−1∏
t=u+1
[1− g(ηit)]
)}
=
(g′′(ηiu)
∂ηiu
∂βnm[1−
u−1∑
t=1
µit]− g′(ηiu)u−1∑
t=1
∂µit
∂βnm
)(Aiu − Ai(u+1)g(ηi(u+1))
−p−1∑
j=u+2
Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)+ g′(ηiu)[1−
u−1∑
t=1
µit]
{φXin
[− ψ′(φµiu)
∂µiu
∂ηim− ψ′
[φ(1−
p−1∑
j=1
µij
)]g′(ηim) [1−
m−1∑
t=1
µit]
(1− g(ηi(m+1)) −
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)
+ ψ′(φµi(u+1))∂µi(u+1)
∂ηimg(ηi(u+1)) + ψ′
[φ(1−
p−1∑
j=1
µij
)]g′(ηim) [1−
m−1∑
t=1
µit]
(1− g(ηi(m+1)) −
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)g(ηi(u+1))
+
p−1∑
j=u+2
ψ′(φµij)∂µij
∂ηimg(ηij)
j−1∏
t=u+1
[1− g(ηit)] + ψ′[φ(1−
p−1∑
j=1
µij
)]g′(ηim)
[1−m−1∑
t=1
µit]
(1− g(ηi(m+1)) −
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
) p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
]− Ai(u+1)g
′(ηi(u+1))∂ηi(u+1)
∂βnm−
p−1∑
j=u+2
Aijg′(ηij)
∂ηij
∂βnm
j−1∏
t=u+1
[1− g(ηit)]−p−1∑
j=u+2
Aijg(ηij)∂
∂βnm
( j−1∏
t=u+1
[1− g(ηit)]
)}
=
(g′′(ηiu)
∂ηiu
∂βnm[1−
u−1∑
t=1
µit]− g′(ηiu)u−1∑
t=1
∂µit
∂βnm
)(Aiu − Ai(u+1)g(ηi(u+1))
−p−1∑
j=u+2
Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)+ g′(ηiu)[1−
u−1∑
t=1
µit]
94
{φ Xin
[− ψ′(φµiu)
∂µiu
∂ηim+ ψ′(φµi(u+1))
∂µi(u+1)
∂ηimg(ηi(u+1)) +
p−1∑
j=u+2
ψ′(φµij)∂µij
∂ηim
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]− g′(ηim) [1−m−1∑
t=1
µit] ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1))
−p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]
− Ai(u+1)g′(ηi(u+1))
∂ηi(u+1)
∂βnm−
p−1∑
j=u+2
Aijg′(ηij)
∂ηij
∂βnm
j−1∏
t=u+1
[1− g(ηit)]−p−1∑
j=u+2
Aij
g(ηij)∂
∂βnm
( j−1∏
t=u+1
[1− g(ηit)]
)}.
Para simplificarmos a equacao acima devemos considerar tres casos, a saber: u = m,u > m e u < m.
Caso 1: Se u = m
Neste caso temos que
m−1∑
t=1
∂µit
∂βnm= 0
p−1∑
j=u+2
Aijg′(ηij)
∂ηij
∂βnm
j−1∏
t=u+1
[1− g(ηit)] = 0
e
∂
∂βnm
( j−1∏
t=u+1
[1− g(ηit)]
)= 0
pois u + 1 > u = m, u + 2 > u = m, . . . , j − 1 > u = m, ou seja,
∂ηi(u+1)
∂βnu=
∂ηi(u+2)
∂βnu= . . . =
∂ηi(j−1)
∂βnu= 0,
entao
95
Der1 = g′′(ηiu)Xin[1−u−1∑
t=1
µit]
(Aiu − Ai(u+1)g(ηi(u+1))−
p−1∑
j=u+2
Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)+ φXing′(ηiu)[1−
u−1∑
t=1
µit]
{−ψ′(φµiu)
∂µiu
∂ηiu
+ ψ′(φµi(u+1))∂µi(u+1)
∂ηiug(ηi(u+1)) +
p−1∑
j=u+2
ψ′(φµij)∂µij
∂ηiug(ηij)
j−1∏
t=u+1
[1− g(ηit)]− g′(ηiu) [1−u−1∑
t=1
µit] ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(u+1))
−p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)2}
= g′′(ηiu)Xin[1−u−1∑
t=1
µit]
(Aiu − Ai(u+1)g(ηi(u+1))−
p−1∑
j=u+2
Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)+ φXing′(ηiu)[1−
u−1∑
t=1
µit]
{−ψ′(φµiu) g′(ηiu)[1−
u−1∑
t=1
µit]
− ψ′(φµi(u+1)) g′(ηiu)[1−u−1∑
t=1
µit] g(ηi(u+1))2 −
p−1∑
j=u+2
ψ′(φµij)g′(ηiu)[1−
u−1∑
t=1
µit]
g(ηij)2
j−1∏
t=u+1
[1− g(ηit)]2 − g′(ηiu) [1−
u−1∑
t=1
µit] ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(u+1))
−p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)2}
= g′′(ηiu)Xin[1−u−1∑
t=1
µit]
(Aiu − Ai(u+1)g(ηi(u+1))−
p−1∑
j=u+2
Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)+ φXing′(ηiu)2[1−
u−1∑
t=1
µit]2
{−ψ′(φµiu)− ψ′(φµi(u+1))
g(ηi(u+1))2 −
p−1∑
j=u+2
ψ′(φµij)g(ηij)2
j−1∏
t=u+1
[1− g(ηit)]2 − ψ′
[φ(1−
p−1∑
j=1
µij
)]
96
(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)2}.
Portanto
Der1 = g′′(ηiu)Xin[1−u−1∑
t=1
µit]
(Aiu − Ai(u+1)g(ηi(u+1))−
p−1∑
j=u+2
Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)+ φXing′(ηiu)2[1−
u−1∑
t=1
µit]2
{−ψ′(φµiu)− ψ′(φµi(u+1))
g(ηi(u+1))2 −
p−1∑
j=u+2
ψ′(φµij)g(ηij)2
j−1∏
t=u+1
[1− g(ηit)]2 − ψ′
[φ(1−
p−1∑
j=1
µij
)]
(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)2},
entao,
∂2` (B; φ)
∂βnm∂βvu=
N∑
i=1
φXiv Xin
{g′′(ηiu)[1−
u−1∑
t=1
µit]
(Aiu − Ai(u+1)g(ηi(u+1))−
p−1∑
j=u+2
Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)+ φ g′(ηiu)2[1−
u−1∑
t=1
µit]2
[−ψ′(φµiu)− ψ′(φµi(u+1))
g(ηi(u+1))2 −
p−1∑
j=u+2
ψ′(φµij)g(ηij)2
j−1∏
t=u+1
[1− g(ηit)]2 − ψ′
[φ(1−
p−1∑
j=1
µij
)]
(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)2]}.
Por (2.2.1.5) sabemos que E[log yij ] = ψ(φµij)− ψ(φ), entao,
E[Aij ] = E
{− ψ(φµij) + ψ
[φ(1−
p−1∑
j=1
µij
)]+ log yij − log
[1−
p−1∑
j=1
yij
]}
= −ψ(φµij) + ψ[φ(1−
p−1∑
j=1
µij
)]+ E[log yij ]− E
{log
[1−
p−1∑
j=1
yij
]}
97
= −ψ(φµij) + ψ[φ(1−
p−1∑
j=1
µij
)]+ ψ(φµij)− ψ(φ)− ψ
[φ(1−
p−1∑
j=1
µij
)]+ ψ(φ)
= 0.
(A1.6)
Daı,
−E
[∂2` (B; φ)
∂βnm∂βvu
]=
N∑
i=1
Xiv Xin φ2 g′(ηiu)2 [1−u−1∑
t=1
µit]2
{ψ′(φµiu) + ψ′(φµi(u+1)) g(ηi(u+1))
2 +
p−1∑
j=u+2
ψ′(φµij)g(ηij)2
j−1∏
t=u+1
[1− g(ηit)]2 + ψ′
[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)2}.
Entao,
−E
[∂2` (B; φ)
∂βnu∂βvu
]=
N∑
i=1
Xiv Xin U(1)uu,i,
onde
U(1)uu,i = φ2 g′(ηiu)2 [1−
u−1∑
t=1
µit]2
{ψ′(φµiu) + ψ′(φµi(u+1)) g(ηi(u+1))
2
+
p−1∑
j=u+2
ψ′(φµij)g(ηij)2
j−1∏
t=u+1
[1− g(ηit)]2 + ψ′
[φ(1−
p−1∑
j=1
µij
)]
(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)2}.
Caso 2: Se u > m
Neste caso tambem temos que
∂
∂βnm
( j−1∏
t=u+1
[1− g(ηit)]
)= 0,
pois u + 1 > u > m, u + 2 > u > m, . . . , j − 1 > u > m, ou seja,
∂ηi(u+1)
∂βnm=
∂ηi(u+2)
∂βnm= . . . =
∂ηi(j−1)
∂βnm= 0,
98
entao,
Der1 = −g′(ηiu)u−1∑
t=1
∂µit
∂βnm
(Aiu − Ai(u+1)g(ηi(u+1))−
p−1∑
j=u+2
Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)
+ φXing′(ηiu)[1−u−1∑
t=1
µit]
{−ψ′(φµiu)
∂µiu
∂ηim+ ψ′(φµi(u+1))
∂µi(u+1)
∂ηimg(ηi(u+1))
+
p−1∑
j=u+2
ψ′(φµij)∂µij
∂ηimg(ηij)
j−1∏
t=u+1
[1− g(ηit)]− g′(ηim) [1−m−1∑
t=1
µit]
ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1) −
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)
(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)},
mas
u−1∑
t=1
∂µit
∂βnm=
u−1∑
t=1
∂µit
∂ηim
∂ηim
∂βnm
= Xin
{m−1∑
t=1
∂µit
∂ηim+
∂µim
∂ηim+
∂µi(m+1)
∂ηim+
u−1∑
t=m+2
∂µit
∂ηim
}
= Xin
{0 +
∂µim
∂ηim+
∂µi(m+1)
∂ηim+
u−1∑
t=m+2
∂µit
∂ηim
}
= Xin
{g′(ηim)[1−
m−1∑
l=1
µil]− g′(ηim)g(ηi(m+1))[1−m−1∑
l=1
µil]
−u−1∑
t=m+2
g′(ηim)g(ηit)[1−m−1∑
l=1
µil]t−1∏
l=m+1
[1− g(ηil)]
}
99
= Xing′(ηim)[1−m−1∑
l=1
µil]
{1− g(ηi(m+1))−
u−1∑
t=m+2
g(ηit)t−1∏
l=m+1
[1− g(ηil)]
}
= Xing′(ηim)[1−m−1∑
l=1
µil]u−1∏
t=m+1
[1− g(ηit)],
logo
Der1 = −g′(ηiu) g′(ηim) [1−m−1∑
l=1
µil]u−1∏
t=m+1
[1− g(ηit)] Xin
(Aiu − Ai(u+1)g(ηi(u+1))
−p−1∑
j=u+2
Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)+ φXing′(ηiu)[1−
u−1∑
t=1
µit]
{−ψ′(φµiu)
∂µiu
∂ηim
+ ψ′(φµi(u+1))∂µi(u+1)
∂ηimg(ηi(u+1)) +
p−1∑
j=u+2
ψ′(φµij)∂µij
∂ηimg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
− g′(ηim) [1−m−1∑
t=1
µit]ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1) −
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)}
= −g′(ηiu) g′(ηim) [1−m−1∑
l=1
µil]u−1∏
t=m+1
[1− g(ηit)] Xin
(Aiu − Ai(u+1)g(ηi(u+1))
−p−1∑
j=u+2
Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)+ φXing′(ηiu)[1−
u−1∑
t=1
µit]
{ψ′(φµiu)
g′(ηim)g(ηiu)[1−m−1∑
t=1
µit]u−1∏
t=m+1
[1− g(ηit)]− ψ′(φµi(u+1))g′(ηim) g(ηi(u+1))
2
[1−m−1∑
t=1
µit]u∏
t=m+1
[1− g(ηit)]−p−1∑
j=u+2
ψ′(φµij)g′(ηim) g(ηij)
2 [1−m−1∑
t=1
µit]
j−1∏
t=m+1
[1− g(ηit)]
j−1∏
t=u+1
[1− g(ηit)]− g′(ηim) [1−m−1∑
t=1
µit]ψ′[φ(1−
p−1∑
j=1
µij
)]
100
(1− g(ηi(m+1) −
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)}
= −g′(ηiu) g′(ηim) [1−m−1∑
l=1
µil]u−1∏
t=m+1
[1− g(ηit)] Xin
(Aiu − Ai(u+1)g(ηi(u+1))
−p−1∑
j=u+2
Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)+ φXing′(ηiu) g′(ηim) [1−
u−1∑
t=1
µit] [1−m−1∑
t=1
µit]
{ψ′(φµiu) g(ηiu)
u−1∏
t=m+1
[1− g(ηit)]− ψ′(φµi(u+1)) g(ηi(u+1))2
u∏
t=m+1
[1− g(ηit)]
−p−1∑
j=u+2
ψ′(φµij) g(ηij)2
j−1∏
t=m+1
[1− g(ηit)]
j−1∏
t=u+1
[1− g(ηit)]− ψ′[φ(1−
p−1∑
j=1
µij
)]
(1− g(ηi(m+1) −
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)}.
Daı,
∂2`
∂βnu∂βvu=
N∑
i=1
φXiv Xin
{− g′(ηiu) g′(ηim) [1−
m−1∑
l=1
µil]u−1∏
t=m+1
[1− g(ηit)]
(Aiu
− Ai(u+1)g(ηi(u+1))−p−1∑
j=u+2
Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)+ φ g′(ηiu)
g′(ηim) [1−u−1∑
t=1
µit] [1−m−1∑
t=1
µit]
[ψ′(φµiu) g(ηiu)
u−1∏
t=m+1
[1− g(ηit)]
− ψ′(φµi(u+1)) g(ηi(u+1))2
u∏
t=m+1
[1− g(ηit)]−p−1∑
j=u+2
ψ′(φµij) g(ηij)2
j−1∏
t=m+1
[1− g(ηit)]
j−1∏
t=u+1
[1− g(ηit)]− ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1)
101
−p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]}.
Usando (A1.6) temos
−E
[∂2` (B; φ)
∂βnm∂βvu
]=
N∑
i=1
Xiv Xin
{φ2 g′(ηiu)g′(ηim) [1−
u−1∑
t=1
µit] [1−m−1∑
t=1
µit]
[−ψ′(φµiu)
g(ηiu)u−1∏
t=m+1
[1− g(ηit)] + ψ′(φµi(u+1)) g(ηi(u+1))2
u∏
t=m+1
[1− g(ηit)]
+
p−1∑
j=u+2
ψ′(φµij) g(ηij)2
j−1∏
t=m+1
[1− g(ηit)]
j−1∏
t=u+1
[1− g(ηit)]
+ ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1) −
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]}.
Portanto
−E
[∂2` (B; φ)
∂βnm∂βvu
]=
N∑
i=1
Xiv Xin U(1)mu,i,
102
onde
U(1)mu,i = φ2 g′(ηiu)g′(ηim) [1−
u−1∑
t=1
µit] [1−m−1∑
t=1
µit]
[−ψ′(φµiu)g(ηiu)
u−1∏
t=m+1
[1− g(ηit)] + ψ′(φµi(u+1)) g(ηi(u+1))2
u∏
t=m+1
[1− g(ηit)]
+
p−1∑
j=u+2
ψ′(φµij) g(ηij)2
j−1∏
t=m+1
[1− g(ηit)]
j−1∏
t=u+1
[1− g(ηit)]
+ ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1) −
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)].
Caso 3: Se u < m
Aqui temos que
Der1 = −g′(ηiu)u−1∑
t=1
∂µit
∂βnm
(Aiu − Ai(u+1)g(ηi(u+1))−
p−1∑
j=u+2
Aijg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)
+ g′(ηiu)[1−u−1∑
t=1
µit]
{φXin
[− ψ′(φµiu)
∂µiu
∂ηim+ ψ′(φµi(u+1))
∂µi(u+1)
∂ηimg(ηi(u+1))
+
p−1∑
j=u+2
ψ′(φµij)∂µij
∂ηimg(ηij)
j−1∏
t=u+1
[1− g(ηit)]− g′(ηim) [1−m−1∑
t=1
µit]
ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1))−
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)
(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]− Ai(u+1)g
′(ηi(u+1))∂ηi(u+1)
∂βnm
−p−1∑
j=u+2
Aijg′(ηij)
∂ηij
∂βnm
j−1∏
t=u+1
[1− g(ηit)]−p−1∑
j=u+2
Aijg(ηij)
∂
∂βnm
( j−1∏
t=u+1
[1− g(ηit)]
)}
103
Como u < m, entao, u− 1 < m, logo
u−1∑
t=1
∂µit
∂βnm= 0.
Temos ainda que∂µiu
∂βnm= 0.
Daı,
Der1 = g′(ηiu)[1−u−1∑
t=1
µit]
{φ Xin
[ψ′(φµi(u+1))
∂µi(u+1)
∂ηimg(ηi(u+1))
+
p−1∑
j=u+2
ψ′(φµij)∂µij
∂ηimg(ηij)
j−1∏
t=u+1
[1− g(ηit)]− g′(ηim) [1−m−1∑
t=1
µit]
ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1))−
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)
(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]− Ai(u+1)g
′(ηi(u+1))∂ηi(u+1)
∂βnm
−p−1∑
j=u+2
Aijg′(ηij)
∂ηij
∂βnm
j−1∏
t=u+1
[1− g(ηit)]−p−1∑
j=u+2
Aijg(ηij)
∂
∂βnm
( j−1∏
t=u+1
[1− g(ηit)]
)}.
Se m = u + 1, entao,
Der1 = g′(ηiu) [1−u−1∑
t=1
µit]
{φ Xin
[ψ′(φµim)
∂µim
∂ηimg(ηim) +
p−1∑
j=m+1
ψ′(φµij)∂µij
∂ηimg(ηij)
j−1∏
t=u+1
[1− g(ηit)]− g′(ηim) [1−m−1∑
t=1
µit]ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1))
−p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]
− Aimg′(ηim) Xin −p−1∑
j=m+1
Aijg(ηij)∂
∂βnm
( j−1∏
t=m
[1− g(ηit)]
)}.
104
Mas
p−1∑
j=m+1
Aijg(ηij)∂
∂βnm
( j−1∏
t=m
[1− g(ηit)]
)= Ai(m+1) g(ηi(m+1))
∂
∂βnm
( m∏
t=m
[1− g(ηit)]
)
+
p−1∑
j=m+2
Aijg(ηij)∂
∂βnm
( j−1∏
t=m
[1− g(ηit)]
)
= Ai(m+1) g(ηi(m+1))∂
∂βnm
( m∏
t=m
[1− g(ηit)]
)+ 0
= −g′(ηim) Ai(m+1) g(ηi(m+1)) Xin.
Portanto
p−1∑
j=m+1
Aijg(ηij)∂
∂βnm
( j−1∏
t=m
[1− g(ηit)]
)= −Ai(m+1) g′(ηim) g(ηi(m+1)) Xin,
logo
Der1 = g′(ηiu) [1−u−1∑
t=1
µit] Xin
{φ
[ψ′(φµim)
∂µim
∂ηimg(ηim) +
p−1∑
j=m+1
ψ′(φµij)∂µij
∂ηimg(ηij)
j−1∏
t=u+1
[1− g(ηit)]− g′(ηim) [1−m−1∑
t=1
µit] ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1))
−p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]
− Aimg′(ηim) + Ai(m+1) g′(ηim) g(ηi(m+1))
}
= g′(ηiu) [1−u−1∑
t=1
µit] Xin
{φ
[ψ′(φµim)
∂µim
∂ηimg(ηim) + ψ′(φµi(m+1))
∂µi(m+1)
∂ηim
g(ηi(m+1))m∏
t=u+1
[1− g(ηit)] +
p−1∑
j=m+2
ψ′(φµij)∂µij
∂ηimg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
− g′(ηim) [1−m−1∑
t=1
µit]ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1))−
p−1∑
j=m+2
g(ηij))
105
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]− Aimg′(ηim)
+ Ai(m+1) g′(ηim)g(ηi(m+1))
}
= g′(ηiu) [1−u−1∑
t=1
µit] Xin
{φ
[ψ′(φµim)g′(ηim) [1−
m−1∑
t=1
µit] g(ηim)− ψ′(φµi(m+1))
g′(ηim) [1−m−1∑
t=1
µit]g(ηi(m+1))2
m∏
t=u+1
[1− g(ηit)]−p−1∑
j=m+2
ψ′(φµij)g′(ηim) [1−
m−1∑
t=1
µit]
g(ηij)2
j−1∏
t=m+1
[1− g(ηit)]
j−1∏
t=u+1
[1− g(ηit)]− g′(ηim) [1−m−1∑
t=1
µit]ψ′[φ(1−
p−1∑
j=1
µij
)]
(1− g(ηi(m+1))−
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]− Aimg′(ηim) + Ai(m+1) g′(ηim)g(ηi(m+1))
}
= g′(ηiu) g′(ηim) [1−u−1∑
t=1
µit] Xin
{φ [1−
m−1∑
t=1
µit]
[ψ′(φµim) g(ηim)− ψ′(φµi(m+1))
g(ηi(m+1))2
m∏
t=u+1
[1− g(ηit)]−p−1∑
j=m+2
ψ′(φµij)g(ηij)2
j−1∏
t=m+1
[1− g(ηit)]
j−1∏
t=u+1
[1− g(ηit)]
− ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1))−
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)
(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]− Aim + Ai(m+1) g(ηi(m+1))
}.
Logo, usando (A1.6), temos que, se m = u + 1,
−E
[∂2` (B; φ)
∂βnm∂βvu
]=
N∑
i=1
Xiv Xin
{φ2 g′(ηiu) g′(ηim) [1−
u−1∑
t=1
µit] [1−m−1∑
t=1
µit]
[− ψ′(φµim) g(ηim) + ψ′(φµi(m+1))g(ηi(m+1))
2m∏
t=u+1
[1− g(ηit)]
106
+
p−1∑
j=m+2
ψ′(φµij)g(ηij)2
j−1∏
t=m+1
[1− g(ηit)]
j−1∏
t=u+1
[1− g(ηit)] + ψ′[φ(1−
p−1∑
j=1
µij
)]
(1− g(ηi(m+1))−
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]}.
Mas se m ≥ u + 2 temos
Der1 = g′(ηiu)[1−u−1∑
t=1
µit]
{ p−1∑
j=u+2
[φ Xinψ′(φµij)
∂µij
∂ηimg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
− Aij g′(ηij)∂ηij
∂βnm
j−1∏
t=u+1
[1− g(ηit)]− Aij g(ηij)∂
∂βnm
( j−1∏
t=u+1
[1− g(ηit)]
)]
− φ Xin g′(ηim) [1−m−1∑
t=1
µit] ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1))−
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)}
= g′(ηiu)[1−u−1∑
t=1
µit]
{ m−1∑
j=u+2
[φ Xinψ′(φµij)
∂µij
∂ηimg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
− Aij g′(ηij)∂ηij
∂βnm
j−1∏
t=u+1
[1− g(ηit)]− Aij g(ηij)∂
∂βnm
( j−1∏
t=u+1
[1− g(ηit)]
)]
+m∑
j=m
[φ Xinψ′(φµij)
∂µij
∂ηimg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
− Aij g′(ηij)∂ηij
∂βnm
j−1∏
t=u+1
[1− g(ηit)]− Aij g(ηij)∂
∂βnm
( j−1∏
t=u+1
[1− g(ηit)]
)]
+
p−1∑
j=m+1
[φ Xinψ′(φµij)
∂µij
∂ηimg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
− Aij g′(ηij)∂ηij
∂βnm
j−1∏
t=u+1
[1− g(ηit)]− Aij g(ηij)∂
∂βnm
( j−1∏
t=u+1
[1− g(ηit)]
)]
107
− φ Xin g′(ηim) [1−m−1∑
t=1
µit] ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1))−
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)},
mas
m−1∑
j=u+2
[φψ′(φµij)
∂µij
∂ηimXing(ηij)
j−1∏
t=u+1
[1− g(ηit)]− Aij g′(ηij)∂ηij
∂βnm
j−1∏
t=u+1
[1− g(ηit)]
− Aij g(ηij)∂
∂βnm
( j−1∏
t=m
[1− g(ηit)]
)]= 0,
logo
Der1 = g′(ηiu)[1−u−1∑
t=1
µit]
{[φ Xinψ′(φµim)
∂µim
∂ηimg(ηim)
m−1∏
t=u+1
[1− g(ηit)]
− Aim g′(ηim)∂ηim
∂βnm
m−1∏
t=u+1
[1− g(ηit)]− Aim g(ηim)∂
∂βnm
( m−1∏
t=u+1
[1− g(ηit)]
)]
+
p−1∑
j=m+1
[φ Xinψ′(φµij)
∂µij
∂ηimg(ηij)
j−1∏
t=u+1
[1− g(ηit)]− Aij g(ηij)
∂
∂βnm
( j−1∏
t=u+1
[1− g(ηit)]
)]− φ Xin g′(ηim) [1−
m−1∑
t=1
µit] ψ′[φ(1−
p−1∑
j=1
µij
)]
(1− g(ηi(m+1))−
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)}
= g′(ηiu)[1−u−1∑
t=1
µit]
{[φ Xinψ′(φµim)
∂µim
∂ηimg(ηim)
m−1∏
t=u+1
[1− g(ηit)]− Aim g′(ηim)Xin
m−1∏
t=u+1
[1− g(ηit)]− Aim g(ηim)∂
∂βnm
( m−1∏
t=u+1
[1− g(ηit)]
)]+ φ Xinψ′(φµi(m+1))
∂µi(m+1)
∂ηimg(ηi(m+1))
m∏
t=u+1
[1− g(ηit)]− Ai(m+1) g(ηi(m+1))∂
∂βnm
( m∏
t=u+1
[1− g(ηit)]
)
108
+ φ Xin
p−1∑
j=m+2
ψ′(φµij)∂µij
∂ηimg(ηij)
j−1∏
t=u+1
[1− g(ηit)]− φ Xin g′(ηim) [1−m−1∑
t=1
µit]
ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1))−
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)
(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)},
mas
∂
∂βnm
( m−1∏
t=u+1
[1− g(ηit)]
)= 0
e
∂
∂βnm
( m∏
t=u+1
[1− g(ηit)]
)= −g′(ηim) Xin
m−1∏
t=u+1
[1− g(ηit)].
Entao
Der1 = g′(ηiu)[1−u−1∑
t=1
µit]
{[φ Xinψ′(φµim)
∂µim
∂ηimg(ηim)
m−1∏
t=u+1
[1− g(ηit)]− Aim g′(ηim)Xin
m−1∏
t=u+1
[1− g(ηit)] + φ Xinψ′(φµi(m+1))∂µi(m+1)
∂ηimg(ηi(m+1))
m∏
t=u+1
[1− g(ηit)]
+ Ai(m+1) g(ηi(m+1))g′(ηim) Xin
m−1∏
t=u+1
[1− g(ηit)] + φ Xin
p−1∑
j=m+2
ψ′(φµij)∂µij
∂ηim
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]− φ Xin g′(ηim) [1−m−1∑
t=1
µit] ψ′[φ(1−
p−1∑
j=1
µij
)]
(1− g(ηi(m+1))−
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)}.
Daı,
109
Der1 = Xin g′(ηiu)[1−u−1∑
t=1
µit]
{φ g′(ηim) [1−
m−1∑
t=1
µit]
[ψ′(φµim) g(ηim)
m−1∏
t=u+1
[1− g(ηit)]
− ψ′(φµi(m+1)) g(ηi(m+1))2
m∏
t=u+1
[1− g(ηit)]−p−1∑
j=m+2
ψ′(φµij) g(ηij)2
j−1∏
t=m+1
[1− g(ηit)]
j−1∏
t=u+1
[1− g(ηit)] − ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1))
−p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]
− Aim g′(ηim)m−1∏
t=u+1
[1− g(ηit)] + Ai(m+1) g(ηi(m+1)) g′(ηim)m−1∏
t=u+1
[1− g(ηit)]
}.
Logo
∂2` (B; φ)
∂βnu∂βvu=
N∑
i=1
φ2 Xiv Xin g′(ηiu)[1−u−1∑
t=1
µit]
{g′(ηim) [1−
m−1∑
t=1
µit]
[ψ′(φµim) g(ηim)
m−1∏
t=u+1
[1− g(ηit)]− ψ′(φµi(m+1)) g(ηi(m+1))2
m∏
t=u+1
[1− g(ηit)]
−p−1∑
j=m+2
ψ′(φµij)g(ηij)2
j−1∏
t=m+1
[1− g(ηit)]
j−1∏
t=u+1
[1− g(ηit)]
− ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1))−
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)
(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]− Aim g′(ηim)
m−1∏
t=u+1
[1− g(ηit)] + Ai(m+1) g(ηi(m+1))g′(ηim)
m−1∏
t=u+1
[1− g(ηit)]
}.
Usando (A1.6) temos
110
−E
[∂2` (B; φ)
∂βnm∂βvu
]=
N∑
i=1
Xiv Xin
{φ2 g′(ηiu) g′(ηim) [1−
u−1∑
t=1
µit] [1−m−1∑
t=1
µit]
[− ψ′(φµim) g(ηim)
m−1∏
t=u+1
[1− g(ηit)] + ψ′(φµi(m+1)) g(ηi(m+1))2
m∏
t=u+1
[1− g(ηit)] +
p−1∑
j=m+2
ψ′(φµij)g(ηij)2
j−1∏
t=m+1
[1− g(ηit)]
j−1∏
t=u+1
[1− g(ηit)] + ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1))−
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]}
Portanto
−E
[∂2` (B; φ)
∂βnm∂βvu
]=
N∑
i=1
Xiv Xin U(1)mu,i,
onde
U(1)mu,i = φ2 g′(ηiu) g′(ηim) [1−
u−1∑
t=1
µit] [1−m−1∑
t=1
µit]
[− ψ′(φµim) g(ηim)
m−1∏
t=u+1
[1− g(ηit)] + ψ′(φµi(m+1)) g(ηi(m+1))2
m∏
t=u+1
[1− g(ηit)] +
p−1∑
j=m+2
ψ′(φµij)g(ηij)2
j−1∏
t=m+1
[1− g(ηit)]
j−1∏
t=u+1
[1− g(ηit)] + ψ′[φ(1−
p−1∑
j=1
µij
)](1− g(ηi(m+1))−
p−1∑
j=m+2
g(ηij)
j−1∏
t=m+1
[1− g(ηit)]
)(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)].
Usando (A1.4) temos que
∂
∂φ
{∂` (B; φ)
∂φ
}=
N∑
i=1
∂
∂φ
{ψ(φ) +
p∑
j=1
[−ψ(φµij)µij + log yijµij ]
}
=N∑
i=1
{ψ′(φ)−
p∑
j=1
ψ′(φµij) µ2ij
},
111
logo
−E
[∂2`(β, φ)
∂φ2
]=
N∑
i=1
{−ψ′(φ) +
p∑
j=1
ψ′(φµij) µ2ij
}.
Sabemos que
∂` (B; φ)
∂βvu=
N∑
i=1
φXiv g′(ηiu) [1−u−1∑
t=1
µit]
{Aiu − Ai(u+1)g(ηi(u+1))
−p−1∑
j=u+2
[Aij g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
]},
entao
∂
∂φ
{∂` (B; φ)
∂βvu
}=
∂
∂φ
{ N∑
i=1
φXiv g′(ηiu) [1−u−1∑
t=1
µit]
[Aiu − Ai(u+1)g(ηi(u+1))
−p−1∑
j=u+2
(Aij g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]}
=N∑
i=1
Xiv
{∂
∂φ
[φ g′(ηiu) [1−
u−1∑
t=1
µit]
][Aiu − Ai(u+1)g(ηi(u+1))
−p−1∑
j=u+2
(Aij g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]+ φ g′(ηiu) [1−
u−1∑
t=1
µit]
[∂Aiu
∂φ− ∂Ai(u+1)
∂φg(ηi(u+1))−
p−1∑
j=u+2
(∂Aij
∂φg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]}
=N∑
i=1
Xiv
{g′(ηiu) [1−
u−1∑
t=1
µit]
[Aiu − Ai(u+1)g(ηi(u+1))−
p−1∑
j=u+2
(Aij g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]+ φ g′(ηiu) [1−
u−1∑
t=1
µit]
[∂Aiu
∂φ− ∂Ai(u+1)
∂φg(ηi(u+1))
−p−1∑
j=u+2
(∂Aij
∂φg(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]},
mas
112
∂Aij
∂φ=
∂
∂φ
{− ψ(φµij) + ψ
[φ(1−
p−1∑
j=1
µij
)]+ log yij − log
[1−
p−1∑
j=1
yij
]}
= −ψ′(φµij) µij + ψ′[φ(1−
p−1∑
j=1
µij
)] (1−
p−1∑
j=1
µij
),
logo
∂
∂φ
{∂` (B; φ)
∂βvu
}=
N∑
i=1
Xiv
{g′(ηiu) [1−
u−1∑
t=1
µit]
[Aiu − Ai(u+1)g(ηi(u+1))−
p−1∑
j=u+2
(Aij g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]+ φ g′(ηiu) [1−
u−1∑
t=1
µit]
[−ψ′(φµiu) µiu
+ ψ′[φ(1−
p−1∑
j=1
µij
)] (1−
p−1∑
j=1
µij
)+ ψ′(φµi(u+1)) µi(u+1) g(ηi(u+1))
− ψ′[φ(1−
p−1∑
j=1
µij
)] (1−
p−1∑
j=1
µij
)g(ηi(u+1))−
p−1∑
j=u+2
−ψ′(φµij) µij
g(ηij)
j−1∏
t=u+1
[1− g(ηit)] + ψ′[φ(1−
p−1∑
j=1
µij
)] (1−
p−1∑
j=1
µij
) p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
]}
=N∑
i=1
Xiv
{g′(ηiu) [1−
u−1∑
t=1
µit]
[Aiu − Ai(u+1)g(ηi(u+1))−
p−1∑
j=u+2
(Aij g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]+ φ g′(ηiu) [1−
u−1∑
t=1
µit]
[−ψ′(φµiu) µiu
+ ψ′(φµi(u+1)) µi(u+1) g(ηi(u+1)) +
p−1∑
j=u+2
ψ′(φµij) µij g(ηij)
j−1∏
t=u+1
[1− g(ηit)] + ψ′[φ(1−
p−1∑
j=1
µij
)] (1−
p−1∑
j=1
µij
)
(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]}
113
Entao
−E
[∂2` (B; φ)
∂φ ∂βvu
]=
N∑
i=1
Xiv
{φ g′(ηiu) [1−
u−1∑
t=1
µit]
[ψ′(φµiu) µiu
− ψ′(φµi(u+1)) µi(u+1) g(ηi(u+1))−p−1∑
j=u+2
ψ′(φµij) µij g(ηij)
j−1∏
t=u+1
[1− g(ηit)]− ψ′[φ(1−
p−1∑
j=1
µij
)] (1−
p−1∑
j=1
µij
)
(1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)]}.
Portanto
−E
[∂2` (B; φ)
∂φ ∂βvu
]=
N∑
i=1
Xiv V(1)iu ,
onde
V(1)iu = φ g′(ηiu) [1−
u−1∑
t=1
µit]
[ψ′(φµiu) µiu − ψ′(φµi(u+1)) µi(u+1) g(ηi(u+1))
−p−1∑
j=u+2
ψ′(φµij) µij g(ηij)
j−1∏
t=u+1
[1− g(ηit)]− ψ′[φ(1−
p−1∑
j=1
µij
)]
(1−
p−1∑
j=1
µij
) (1− g(ηi(u+1))−
p−1∑
j=u+2
g(ηij)
j−1∏
t=u+1
[1− g(ηit)]
)].
114
Apendice 2
Neste Apendice encontra-se os calculos das derivadas, de primeira e segunda ordem,da funcao de log-verossimilhanca com relacao aos parametros desconhecidos referentes aomodelo 2. A funcao de log-verossimilhanca e
`(B) =N∑
i=1
`i(µi),
onde
`i(µi) = log Γ(φi)−p∑
j=1
log Γ(φiµij) +
p∑
j=1
(φiµij − 1) log yij ,
entao a derivada de primeira ordem com relacao aos parametros βvu’s, com v = 1, . . . , k eu = 1, . . . , p, e
∂` (B)
∂βvu=
N∑
i=1
∂
∂βvu
[log Γ(φi)−
p∑
j=1
log Γ(φiµij) +
p∑
j=1
(φiµij − 1) log yij
]
=N∑
i=1
{∂
∂βvu[ log Γ(φi)] +
p∑
j=1
[∂
∂βvu
(− log Γ(φiµij)
)
+∂
∂βvu
((φiµij − 1) log yij
)]}
=N∑
i=1
{ψ(φi)
∂φi
∂βvu+
p∑
j=1
[− ψ(φiµij)
∂
∂βvu[φiµij ] + log yij
∂
∂βvu[φiµij ]
]}
=N∑
i=1
{ψ(φi)
∂φi
∂βvu+
p∑
j=1
[(log yij − ψ(φiµij))
∂
∂βvu[φiµij ]
]}
=N∑
i=1
{ψ(φi)
∂φi
∂βvu+
p∑
j=1
[A∗ij
∂
∂βvu[φiµij ]
]}
onde
A∗ij = log yij − ψ(φiµij)
e
115
∂
∂βvu[φiµij ] =
∂φi
∂βvuµij + φi
∂µij
∂βvu
=∂φi
∂βvuµij + φi
∂µij
∂ηiuXiv.
Sabemos que
µij =g(ηij)
g(ηi1) + g(ηi2) + . . . + g(ηip)=
g(ηij)
φi(A2.2)
e
∂φi
∂βvu=
∂
∂βvu
p∑
j=1
g(ηij) =
p∑
j=1
∂
∂βvug(ηij)
=
p∑
j=1
g′(ηij)∂ηij
∂βvu
=
p∑j=1j 6=u
g′(ηij)∂ηij
∂βvu+ g′(ηiu)
∂ηiu
∂βvu
= 0 + g′(ηiu)∂ηiu
∂βvu= g′(ηiu) Xiv,
(A2.3)
entao,
∂
∂βvu[φiµij ] = g′(ηiu) Xiv
g(ηij)
φi+ φi
∂µij
∂ηiuXiv.
Logo
∂` (B)
∂βvu=
N∑
i=1
{ψ(φi) g′(ηiu) Xiv +
p∑
j=1
A∗ij
[g′(ηiu)
g(ηij)
φi+ φi
∂µij
∂ηiu
]Xiv
}
=N∑
i=1
Xiv
{ψ(φi) g′(ηiu) +
g′(ηiu)
φi
p∑
j=1
A∗ij g(ηij) + φi
p∑
j=1
A∗ij∂µij
∂ηiu
}
=N∑
i=1
Xiv
{ψ(φi) g′(ηiu) +
g′(ηiu)
φi
p∑
j=1
A∗ij g(ηij) + φi
[ p∑j=1j 6=u
A∗ij∂µij
∂ηiu+ A∗iu
∂µiu
∂ηiu
]}.
Por (A2.2) temos que
116
∂µij
∂ηiu=
g′(ηiu)[φi − g(ηiu)]
φ2i
se j = u,
−g′(ηiu)g(ηij)
φ2i
se j 6= u,
(A2.4)
entao,
∂` (B)
∂βvu=
N∑
i=1
Xiv
{ψ(φi) g′(ηiu) +
g′(ηiu)
φi
p∑
j=1
A∗ij g(ηij) + φi
[ p∑j=1j 6=u
−A∗ijg′(ηiu)g(ηij)
φ2i
+ A∗iug′(ηiu)[φi − g(ηiu)]
φ2i
]}
=N∑
i=1
Xivg′(ηiu)
φi
{φi ψ(φi) +
p∑
j=1
A∗ij g(ηij)−p∑
j=1j 6=u
A∗ij g(ηij) + A∗iu[φi − g(ηiu)]
}
=N∑
i=1
Xivg′(ηiu)
φi
{φi ψ(φi) +
p∑
j=1
A∗ij g(ηij)−p∑
j=1j 6=u
A∗ij g(ηij)− A∗iu g(ηiu)
+ A∗iu φi
}
=N∑
i=1
Xivg′(ηiu)
φi
{φi ψ(φi) +
p∑
j=1
A∗ij g(ηij)−p∑
j=1
A∗ij g(ηij) + A∗iu φi
}
=N∑
i=1
Xivg′(ηiu)
φi
{φi ψ(φi) + A∗iu φi
}
=N∑
i=1
Xiv
{g′(ηiu)
[ψ(φi) + A∗iu
]}.
Portanto
∂` (B)
∂βvu=
N∑
i=1
Xiv
{g′(ηiu)
[ψ(φi) + A∗iu
]}.
117
A derivada de segunda ordem da funcao de log-verossimilhanca com relacao aos para-metros desconhecidos βnm’s foi calculada para que se obtenha a matriz de informacao deFisher; entao, para v, n ∈ (1, 2, . . . , k) e u, m ∈ (1, 2, . . . , p) temos
∂
∂βnm
{∂` (B)
∂βvu
}=
∂
∂βnm
{ N∑
i=1
Xiv
[g′(ηiu)
(ψ(φi) + A∗iu
)]}
=N∑
i=1
Xiv
{∂
∂βnm
[g′(ηiu)
(ψ(φi) + A∗iu
)]}
=N∑
i=1
Xiv Der2,
onde
Der2 =∂
∂βnm
[g′(ηiu)
(ψ(φi) + A∗iu
)],
ou ainda,
Der2 =∂
∂βnm[g′(ηiu)]
(ψ(φi) + A∗iu
)+ g′(ηiu)
∂
∂βnm
(ψ(φi) + A∗iu
)
= g′′(ηiu)∂ηiu
∂βnm
(ψ(φi) + A∗iu
)+ g′(ηiu)
(∂
∂βnmψ(φi) +
∂A∗iu∂βnm
)
= g′′(ηiu)∂ηiu
∂βnm
(ψ(φi) + A∗iu
)+ g′(ηiu)
(ψ′(φi)
∂φi
∂βnm+
∂A∗iu∂βnm
).
(A2.5)
Sabemos que
∂A∗ij∂βnm
=∂
∂βnm[log yij − ψ(φiµij)]
= −ψ′(φiµij)∂
∂βnm[φiµij ]
= −ψ′(φiµij) Xin
[g′(ηim)
g(ηij)
φi+ φi
∂µij
∂ηim
].
(A2.6)
Substituindo (A2.3) e (A2.6) em (A2.5), temos
118
Der2 = g′′(ηiu)∂ηiu
∂βnm
(ψ(φi) + A∗iu
)+ g′(ηiu)
(ψ′(φi)g
′(ηim)Xin − ψ′(φiµiu) Xin
[g′(ηim)
g(ηiu)
φi+ φi
∂µiu
∂ηim
])
= g′′(ηiu)∂ηiu
∂βnm
(ψ(φi) + A∗iu
)+ g′(ηiu) g′(ηim)ψ′(φi) Xin − g′(ηiu)g′(ηim)ψ′(φiµiu)
Xing(ηiu)
φi− g′(ηiu) ψ′(φiµiu) Xin φi
∂µiu
∂ηim
= g′′(ηiu)∂ηiu
∂βnm
(ψ(φi) + A∗iu
)+
g′(ηiu) g′(ηim) Xin
φi
[φi ψ′(φi)− ψ′(φiµiu) g(ηiu)
]
− φi g′(ηiu) Xin ψ′(φiµiu)∂µiu
∂ηim.
(A2.7)
Para simplificarmos a equacao acima devemos considerar dois casos, a saber: u = m eu 6= m
Caso 1: Se u = m
Neste caso temos que
Der2 = g′′(ηiu)∂ηiu
∂βnu
(ψ(φi) + A∗iu
)+
g′(ηiu) g′(ηiu) Xin
φi
[φi ψ′(φi)− ψ′(φiµiu) g(ηiu)
]
− φi g′(ηiu) Xin ψ′(φiµiu)∂µiu
∂ηiu
= g′′(ηiu) Xin
(ψ(φi) + A∗iu
)+
g′(ηiu)2 Xin
φi
[φi ψ′(φi)− ψ′(φiµiu) g(ηiu)
]
− φi g′(ηiu) Xin ψ′(φiµiu)g′(ηiu)[φi − g(ηiu)]
φ2i
= g′′(ηiu) Xin
(ψ(φi) + A∗iu
)+
g′(ηiu)2 Xin
φi
[φi ψ′(φi)− ψ′(φiµiu) g(ηiu)
− ψ′(φiµiu) [φi − g(ηiu)]]
119
= g′′(ηiu) Xin
(ψ(φi) + A∗iu
)+
g′(ηiu)2 Xin
φi
[φi ψ′(φi)− ψ′(φiµiu) g(ηiu)
− ψ′(φiµiu) φi + ψ′(φiµiu) g(ηiu)]
= g′′(ηiu) Xin
(ψ(φi) + A∗iu
)+
g′(ηiu)2 Xin
φi
[φi ψ′(φi)− ψ′(φiµiu) φi
]
= g′′(ηiu) Xin
(ψ(φi) + A∗iu
)+ g′(ηiu)2 Xin
[ψ′(φi)− ψ′(φiµiu)
],
logo,
∂2` (B)
∂βnm∂βvu=
N∑
i=1
Xiv Xin
{g′′(ηiu)
(ψ(φi) + A∗iu
)+ g′(ηiu)2
[ψ′(φi)− ψ′(φiµiu)
]}.
Por (2.2.1.5) sabemos que E[log yij ] = ψ(φiµij)− ψ(φi), entao
E[A∗ij ] = E[log yij − ψ(φiµij)]
= E[log yij ]− ψ(φiµij)
= ψ(φiµij)− ψ(φi)− ψ(φiµij)
= −ψ(φi).
(A2.8)
Usando (A2.8) temos
−E
[∂2` (B)
∂βnm∂βvu
]=
N∑
i=1
Xiv Xin
{g′′(ηiu)
(− ψ(φi)− E[A∗iu]
)− g′(ηiu)2
[ψ′(φi)
− ψ′(φiµiu)]}
=N∑
i=1
Xiv Xin
{g′′(ηiu)
(− ψ(φi) + ψ(φi)
)− g′(ηiu)2
[ψ′(φi)
− ψ′(φiµiu)]}
=N∑
i=1
Xiv Xin
{− g′(ηiu)2
[ψ′(φi)− ψ′(φiµiu)
]}.
120
Portanto
−E
[∂2` (B)
∂βnu∂βvu
]=
N∑
i=1
Xiv Xin U(2)uu,i,
onde
U(2)uu,i = −g′(ηiu)2
[ψ′(φi)− ψ′(φiµiu)
].
Caso 2: Se u 6= m
Neste caso temos que (A2.7) se reduz a
Der2 =g′(ηiu) g′(ηim) Xin
φi
[φi ψ′(φi)− ψ′(φiµiu) g(ηiu)
]
− φi g′(ηiu) Xin ψ′(φiµiu)∂µiu
∂ηim
=g′(ηiu) g′(ηim) Xin
φi
[φi ψ′(φi)− ψ′(φiµiu) g(ηiu)
]
+ φi g′(ηiu) Xin ψ′(φiµiu)g′(ηim)g(ηiu)
φ2i
=g′(ηiu) g′(ηim) Xin
φi
[φi ψ′(φi)− ψ′(φiµiu) g(ηiu) + ψ′(φiµiu) g(ηiu)
]
= g′(ηiu) g′(ηim) Xin ψ′(φi),
logo
∂2` (B)
∂βnm∂βvu=
N∑
i=1
Xiv Xin
{g′(ηiu) g′(ηim) ψ′(φi)
}.
Usando (A2.8) temos
−E
[∂2` (B)
∂βnm∂βvu
]=
N∑
i=1
Xiv Xin
{−g′(ηiu) g′(ηim) ψ′(φi)
}.
121
Portanto
−E
[∂2` (B)
∂βnm∂βvu
]=
N∑
i=1
Xiv Xin U(2)mu,i,
onde
U(2)mu,i = −g′(ηiu) g′(ηim) ψ′(φi).
122
Apendice 3
Algoritmo BFGS
Um dos problemas mais frequentes na inferencia estatıstica e encontrar o estimador de
maxima verossimilhanca θ de θ, que em geral nao apresenta uma forma analıtica fechada
para seu calculo. Para encontrar θ devemos maximizar a log-verossimilhanca e para issoprecisamos usar tecnicas de maximizacao. A literatura divide as tecnicas de maximizacaoem classes; por exemplo, existem tecnicas que nao fazem uso de derivadas e outras querequerem derivadas da funcao objetivo. Dentre os algoritmos que utilizam derivadas podemosencontrar duas classes: gradientes conjugados, que fazem uso da matriz hessiana, e variaveismetricas, quando uma aproximacao da matriz hessiana e empregada. Na primeira classeos metodos mais conhecidos sao Newton-Raphson, escore e steepest ascent. Ja dentre osalgoritmos que empregam uma aproximacao para a matriz hessiana, tambem chamados demetodos quasi-Newton, ha duas tecnicas principais: BFGS e DFP. No decorrer deste trabalhousamos a tecnica de maximizacao BFGS.
O algoritmo de Newton–Raphson utiliza aproximacoes por serie de Taylor ate segundaordem. Ou seja, numa vizinhanca de um ponto θ(t), uma funcao pode ser aproximada como
w(θ) = w(θ(t)) + (θ − θ(t))>∇w(θ(t)) +1
2(θ − θ(t))>H(θ(t))(θ − θ(t)),
onde ∇w(θ(t)) e o gradiente de w avaliado em θ(t), H(θ(t)) sendo a matriz hessiana avaliadaem θ(t) e θ pertencente a uma vizinhanca de θ(t). Desta expressao obtem-se
∇w(θ) = ∇w(θ(t)) + H(θ(t))(θ − θ(t)).
Entao faz-se ∇w(θ(t)) = 0 para determinar o proximo ponto da iteracao :
0 = ∇w(θ(t)) + H(θ(t))(θ − θ(t)) ⇒ θ = θ(t)−H(θ(t))−1∇w(θ(t)),
onde θ e uma aproximacao para o ponto de maximo da funcao w.Assim, aproximacoes para o ponto de maximo desta funcao sao obtidos atraves da lei de
recorrencia
θ(t + 1) = θ(t)−H(θ(t))−1∇w(θ(t)),
que podemos generalizar por
θ(t + 1) = θ(t)− s(t)H(θ(t))−1∇w(θ(t)),
onde s(t) e um escalar determinado por algum procedimento de busca linear a partir de θ(t)na direcao −H(θ(t))−1∇w(θ(t)) de forma que w(θ(t)) cresca nesta direcao. A velocidade decrescimento de w e caracterizada por
∇>w(θ(t))(θ − θ(t)) > 0 ⇒ −(θ − θ(t))>H(θ(t))(θ − θ(t)).
123
Assim, H deve ser negativa-definida para todo t. Se θ esta longe do maximo, H podenao ser negativa-definida e o incremento −s(t)H(θ(t))−1∇w(θ(t)) pode mover o ponto θ(t)para um ponto θ(t + 1) onde o valor da funcao e menor, provocando a nao-convergencia doalgoritmo. Uma opcao e utilizar o algortimo BFGS que nao apresenta este problema.
O metodo BFGS tem esse nome por ter sido desenvolvido por Broyden, Fletcher, Gold-farb e Shano. E o algoritmo deste metodo esta implementado na plataforma Ox atraves dafuncao MaxBFGS, maiores detalhes, ver Doornik (2001). O metodo segue o mesmo princıpiodo metodo Newton–Rapson, so que, ao inves de trabalhar com a matriz −H−1, e utilizadauma matriz simetrica e positiva-definida Q(t) tal que
limt→∞Q(t) = −H−1.
Comumente, toma-se como matriz inicial a identidade da mesma ordem, pois ela epositiva-definida e simetrica, assim conduzindo a aproximacoes Q(t) positivas-definidas esimetricas.
A forma recursiva para obter tais matrizes e dada pela expressao
Q(t + 1) = Q(t) +(θ(t + 1)− θ(t))(θ(t + 1)− θ(t))>
(θ(t + 1)− θ(t))>(∇w(θ(t + 1))−∇w(θ(t)))
− [Q(t)(∇w(θ(t + 1))−∇w(θ(t)))][Q(t)(∇w(θ(t + 1))−∇w(θ(t)))]>
(∇w(θ(t + 1))−∇w(θ(t)))>Q(t)(∇w(θ(t + 1))−∇w(θ(t)))
+ (∇w(θ(t + 1))−∇w(θ(t)))>Q(t)(∇w(θ(t + 1))−∇w(θ(t)))U U>,
onde U e o vetor coluna definido por
U =θ(t + 1)− θ(t)
(θ(t + 1)− θ(t))>(∇w(θ(t + 1))−∇w(θ(t)))
− Q(t)(∇w(θ(t + 1))−∇w(θ(t)))
(∇w(θ(t + 1))−∇w(θ(t)))>Q(t)(∇w(θ(t + 1))−∇w(θ(t))).
Assim, mesmo que θ esteja longe do ponto maximo, as matrizes Q(t) garantem que ospontos se moverao na direcao crescente. De forma analoga ao metodo de Newton–Raphson,o maximo e obtido pela recorrencia
θ(t + 1) = θ(t)− s(t)Q(θ(t))∇w(θ(t)).
124
Apendice 4
Neste apendice apresentamos os dois conjuntos de dados reais que utilizamos no capıtulo5. O primeiro conjunto de dados, que denotamos por Dados 1, e referente a proporcaode polen fossilizado de tres tipos de flores colhidos em tres locais diferentes que chamare-mos de A, B e C. O segundo conjunto de dados, Dados 2, e referente a proporcao de trestipos de leucocitos em diferentes amostras de sangue de dez pacientes determinadas porquatro metodos diferentes que denotaremos por A, B e C. Os tres tipos de leucocitos sao:P: leucocitos polimorfonucleares, S: linfocitos pequenos e L: mononucleares grandes.
Dados 1
Proporcao
Observacao Pinus Abies Quercus
A1 0,297 0,583 0,120
A2 0,184 0,484 0,331
A3 0,478 0,436 0,086
A4 0,392 0,542 0,065
A5 0,201 0,506 0,293
A6 0,308 0,527 0,164
A7 0,239 0,603 0,158
A8 0,204 0,586 0,210
A9 0,185 0,581 0,234
A10 0,170 0,521 0,309
B1 0,240 0,363 0,397
B2 0,356 0,449 0,195
B3 0,183 0,444 0,373
B4 0,347 0,504 0,149
B5 0,365 0,458 0,177
B6 0,219 0,484 0,297
B7 0,221 0,448 0,332
B8 0,338 0,475 0,187
B9 0,246 0,446 0,308
B10 0,170 0,434 0,396
C1 0,416 0,440 0,144
C2 0,341 0,479 0,180
C3 0,440 0,416 0,143
C4 0,607 0,366 0,027
C5 0,667 0,299 0,034
C6 0,545 0,362 0,094
C7 0,486 0,408 0,107
C8 0,468 0,451 0,081
C9 0,707 0,253 0,040
C10 0,494 0,396 0,111
125
Dados 2
No de pacientes Metodos P S L
A 0,750 0,160 0,090
1 B 0,350 0,620 0,030
C 0,740 0,210 0,050
D 0,690 0,270 0,040
A 0,660 0,240 0,100
2 B 0,330 0,660 0,010
C 0,440 0,530 0,030
D 0,540 0,410 0,050
A 0,830 0,100 0,070
3 C 0,730 0,220 0,050
D 0,820 0,150 0,030
A 0,570 0,110 0,320
4 B 0,230 0,570 0,200
C 0,320 0,460 0,220
D 0,350 0,400 0,250
A 0,610 0,110 0,280
5 B 0,240 0,600 0,160
C 0,325 0,495 0,180
D 0,370 0,420 0,210
A 0,510 0,140 0,350
6 B 0,380 0,480 0,140
C 0,395 0,440 0,165
D 0,420 0,400 0,180
A 0,560 0,180 0,260
7 B 0,710 0,230 0,060
C 0,700 0,140 0,160
D 0,560 0,230 0,210
A 0,610 0,090 0,300
8 B 0,280 0,540 0,180
C 0,260 0,560 0,180
D 0,440 0,360 0,200
B 0,320 0,610 0,070
9 C 0,540 0,300 0,160
D 0,430 0,430 0,140
A 0,740 0,180 0,080
10 B 0,440 0,540 0,020
C 0,660 0,310 0,030
D 0,680 0,280 0,040
126
Apendice 5
Programa de simulacao
Neste apendice apresentamos os programas de simulacao utilizados nesta dissertacao; osprogramas foram desenvolvidos na linguagem de programacao Ox. Temos dois programas,um referente ao modelo 1 e o outro ao modelo 2; dividimos cada um desses programasem tres partes. Na primeira parte, que esta apresentada na secao A5.1, encontram-se osprogramas da simulacao de Monte Carlo para os modelos 1 e 2; a segunda parte, secao A5.2.contem as funcoes que permitem o calculo das estimativas de maxima verossimilhanca deB, o preenchimento da matriz de informacao de Fisher e a estimacao do posto b usandoo teste sequencial e os criterios de informacao BIC e HQIC; na terceira parte, secao A5.3,encontram-se as diretrizes de ligacao das partes modelo1.ox com funcoes1.ox e modelo2.oxcom funcoes2.ox.
A5.1. Programas principais
• Modelo 1
/******************************************************************* PROGRAMA: modelo1.ox* AUTORA: Tatiane Ferreira do Nascimento Melo* DATA: 27 de fevereiro de 2004* ULTIMA MODIFICACAO: 30 de agosto de 2004 Hora: 19:00******************************************************************/
/* Arquivos principais */#include <oxstd.h>#include <oxfloat.h>#include <oxprob.h>#import <maximize>#import <solvenle>#include <funcoes1.h>#include <funcoes1.ox>
// Variaveis Globaisstatic decl soma_est;
/* Parametros da simulacao */const decl REP = 10000; // numero de replicas Monte Carloconst decl MIN = 50; // tamanho minimo da amostraconst decl MAX = 200; // tamanho maximo da amostra
/* Corpo Principal */main(){
// Declaracao de variaveisdecl dExecTime, i, j, mc, a, b, ir, n, cont_falhas, m_aux,
m_inv, somm, parametro, v_parametro_ini, vX, Y, mZ,m_alpha, m_emv, Sigma_inv, mZ_Estim, m_resid_trans,teste, m_sigma2_trans, mB_verd, m_B_ini, phi_verd,phi, phi_ini, phi_est, vec_mB_verd, vp1, vp2, vp4,vp5, vp6, vp7, dfunc1, dfunc4, dfunc5, dfunc6, dfunc7,// Variveis com relao ao teste sequencialcont_aceitar_seq, aux_seq, posto_estimado_seq, Prop_seq,E_posto_estimado_seq, EQM_posto_estimado_seq,E_posto2_estimado_seq, Vies_posto_estimado_seq,
127
// Variveis com relao ao critrio de informao BICcont_aceitar_BIC, aux_BIC, posto_estimado_BIC, Prop_BIC,E_posto_estimado_BIC, EQM_posto_estimado_BIC,E_posto2_estimado_BIC, Vies_posto_estimado_BIC,// Variveis com relao ao critrio de informao HQICcont_aceitar_HQIC, aux_HQIC, posto_estimado_HQIC, Prop_HQIC,E_posto_estimado_HQIC, EQM_posto_estimado_HQIC,E_posto2_estimado_HQIC, Vies_posto_estimado_HQIC;
// Inicio do relogio para o calculo do tempo de execucaodExecTime = timer();
oxwarning(0);
// Gerador de numeros uniformes pseudo-aleatorios( George Marsaglia )ranseed("GM");
// Numero de colunas da matriz X (matriz de regressores)k = 3; // k = 3; k = 4; k = 5; k = 6;// Numero de colunas da matriz Y (num. de componentes)p = 3; // p-1 = 1; p-1 = 2; p-1 = 3;
//Parametros verdadeiros do modelo//Matriz B verdadeira
mB_verd = zeros(k,p-1); //posto=0
//Matriz 3x1//mB_verd = <1;0;0>; //posto=1
//Matrizes 3x2//mB_verd = <1,0;0,0;0,0>; //posto=1//mB_verd = <1,0;0,1;0,0>; //posto=2
//Matrizes 3x3//mB_verd = <1,0,0;0,0,0;0,0,0>; //posto=1//mB_verd = <1,0,0;0,1,0;0,0,0>; //posto=2//mB_verd = <1,0,0;0,1,0;0,0,1>; //posto=3
//Matriz 4x1//mB_verd = <1;0;0;0>; //posto=1
//Matrizes 4x2//mB_verd = <1,0;0,0;0,0;0,0>; //posto=1//mB_verd = <1,0;0,1;0,0;0,0>; //posto=2
//Matrizes 4x3//mB_verd = <1,0,0;0,0,0;0,0,0;0,0,0>; //posto=1//mB_verd = <1,0,0;0,1,0;0,0,0;0,0,0>; //posto=2//mB_verd = <1,0,0;0,1,0;0,0,1;0,0,0>; //posto=3
//Matriz 5x1//mB_verd = <1;0;0;0;0>; //posto=1
//Matrizes 5x2//mB_verd = <1,0;0,0;0,0;0,0;0,0>; //posto=1//mB_verd = <1,0;0,1;0,0;0,0;0,0>; //posto=2
//Matrizes 5x3//mB_verd = <1,0,0;0,0,0;0,0,0;0,0,0;0,0,0>; //posto=1//mB_verd = <1,0,0;0,1,0;0,0,0;0,0,0;0,0,0>; //posto=2//mB_verd = <1,0,0;0,1,0;0,0,1;0,0,0;0,0,0>; //posto=3
//Matriz 6x1//mB_verd = <1;0;0;0;0;0>; //posto=1
//Matrizes 6x2//mB_verd = <1,0;0,0;0,0;0,0;0,0;0,0>; //posto=1//mB_verd = <1,0;0,1;0,0;0,0;0,0;0,0>; //posto=2
//Matrizes 6x3//mB_verd = <1,0,0;0,0,0;0,0,0;0,0,0;0,0,0;0,0,0>; //posto=1//mB_verd = <1,0,0;0,1,0;0,0,0;0,0,0;0,0,0;0,0,0>; //posto=2//mB_verd = <1,0,0;0,1,0;0,0,1;0,0,0;0,0,0;0,0,0>; //posto=3
parametro = vec(mB_verd); // vetorizacao da matriz B verdadeira
128
// Impressao de resultados da simulacaoprint("\n\t\t DATA: ", date());print("\n\t\t HORA: ", time());print("\n\t\t PROGRAMA OX: ", oxfilename(0));print("\n\t\t VERSAO OX: ", oxversion());print("\n\t\t NUM. MIN. DE OBS.: ", MIN);print("\n\t\t NUM. MAX. DE OBS.: ", MAX);print("\n\t\t NUM. REP. DE MONTE CARLO: ", REP);print("\n\t\t NUM. REGRESSORES DA MATRIZ X: k = ", k);print("\n\t\t NUM. COMPONENTES DE Y: p = ", p);print("\n\n\tMatriz B verdadeira ");println("%10.1f",mB_verd);println("\n\t\tPosto Verdadeiro = ", rank(mB_verd),"\n");
// Parametro phi verdadeirophi_verd = 30;
parametro = vec(mB_verd) phi_verd;
// Loop para os diferentes tamanhos de amostrafor (ta = MIN; ta <= MAX; ta+= 50){
ranseed({1965, 2001});
//Inicializao das matrizesm_mi = zeros(ta,p);m_mi_est = zeros(ta,p);m_mi_trans = zeros(ta,p-1);eta_trans = zeros(ta,p-1);m_resid_trans = zeros(ta,p-1);m_sigma2_trans = zeros(ta,p-1);teste = zeros(ta,p-1);m_emv = zeros(k*(p-1)+1,REP);mZ = zeros(ta,p-1);m_aux = zeros(ta,p);mY = zeros(ta,p);m_alpha = zeros(ta,p);somm = zeros(ta,1);Y = zeros(ta,p-1);cont_aceitar_seq = zeros(p,1);aux_seq = zeros(p,1);cont_aceitar_BIC = zeros(p,1);aux_HQIC = zeros(p,1);cont_aceitar_HQIC = zeros(p,1);aux_BIC = zeros(p,1);
// Matriz de dados explicativos gerador dos regressores XvX = ranu(ta,k-1);
// Matriz das variaveis regressorasmX = ones(ta,1)~vX;
// Matriz etam_eta = mX*mB_verd;
// Loop para preencher a matriz das mediasfor (i = 0; i < ta; i++){ soma = 0.0;m_mi[i][0] = exp(m_eta[i][0])/(1.0 + exp(m_eta[i][0]));for (j = 1; j < p-1; j++){ soma = soma + m_mi[i][j-1];
m_mi[i][j] = (exp(m_eta[i][j])/(1.0 + exp(m_eta[i][j])))*(1.0 - soma);}m_mi[i][p-1] = 1.0 - sumr(m_mi[i][0:(p-2)]);
} // Fim do loop para preencher a matriz das medias
// Inversao auxiliar: ((X’X)^-1)X’m_inv = (invertsym(mX’*mX))*mX’;
// Inicializacao do contador de falhas de convergenciacont_falhas = 0;
ranseed( -1 );
// Matriz alpha
129
m_alpha = phi_verd*m_mi;
// Loop de Monte Carlofor (mc = 0; mc < REP; ++mc){
// Loop para gerar a variavel resposta Yfor (i = 0; i < ta; i++){
Y[i][] = randirichlet(1, m_alpha[i][]);} // Fim do loop para gerar a variavel resposta Y
// Matriz YmY = Y~(1.0 - sumr(Y[][0:p-2]));
// Loop para preencher a matriz resposta transformada Zfor (i = 0; i < ta; i++){
soma3 = 0.0;mZ[][0] = log(mY[][0]) - log(1.0 - mY[][0]);for (j = 1; j < p-1; j++){ soma3 = soma3 + mY[i][j-1];m_aux[i][j] = mY[i][j] / (1 - soma3);mZ[i][j] = log(m_aux[i][j]) - log(1.0 - m_aux[i][j]);
}}// Fim do loop para preencher a matriz resposta transformada Z
// Estimacao inicial da matriz Bm_B_ini = m_inv*mZ;
// Estimacao inicial de phi// Loop para preencher a matriz mi transformadafor (i = 0; i < ta; i++){ soma1 = 0.0;
eta_trans[i][0] = mX[i][]*m_inv*mZ[][0];m_mi_trans[i][0] = (exp(eta_trans[i][0])/(1.0 + exp(eta_trans[i][0])));m_resid_trans[][0] = mZ[][0] - (mX*m_inv*mZ[][0]);teste[i][0] = (m_resid_trans[][0]’*m_resid_trans [][0])*
(m_mi_trans[i][0] .* (1.0 - m_mi_trans[i][0]));for (j = 1; j < p-1; j++){soma1 = soma1 + m_mi_trans[i][j-1];eta_trans[i][j] = mX[i][]*m_inv*mZ[][j];m_mi_trans[i][j] = (exp(eta_trans[i][j])/(1.0 + exp(eta_trans[i][j])))
*(1 - soma1);m_resid_trans[][j] = mZ[][j] - (mX*m_inv*mZ[][j]);teste[i][j] = (m_resid_trans[][j]’*m_resid_trans [][j])*
(m_mi_trans[i][j] .* (1.0 - m_mi_trans[i][j]));}
} // Fim do loop para preencher a matriz mi transformada
a = (ta - k)/(ta*(p-1));b = sumc(sumr(1.0 ./teste));
// Valor inicial para o phiphi_ini = (a*b) - 1.0;
// Vetor dos parametros iniciais (valores iniciais)v_parametro_ini = vec(m_B_ini) phi_ini;
// Valores iniciais dos parametrosvp1 = v_parametro_ini;
// Maximizacao da funcao de log-verossimilhanca pelo Metodo BFGS// Parametros da maximizacao por BFGSMaxControl(50, -1);
// Estimacao por Maxima verossimilhancair = MaxBFGS(floglik1, &vp1, &dfunc1, 0, TRUE);
// Checar a convergenciaif(ir == MAX_CONV | ir == MAX_WEAK_CONV){ // Vetor de parametros estimado por maxima verossimilhanca
m_emv[][mc] = vp1;} // Fim do if da convergenciaelse{++cont_falhas;}
// Matriz B estimada e phi estimadoB_est1 = shape(vp1[0:((k*(p-1))-1)], k, p-1);
130
phi_est = vp1[k*(p-1)];
// Matriz eta estimadam_eta_est = mX*B_est1;
// Loop para preencher a matriz das medias estimadasfor (i = 0; i < ta; i++){ soma_est = 0.0;
m_mi_est[i][0] = exp(m_eta_est[i][0])/(1.0 + exp(m_eta_est[i][0]));for (j = 1; j < p-1; j++){ soma_est = soma_est + m_mi_est[i][j-1];m_mi_est[i][j] = (exp(m_eta_est[i][j])/(1.0 + exp(m_eta_est[i][j])))*
(1.0 - soma_est);}m_mi_est[i][p-1] = 1.0 - (sumr(m_mi_est[i][0:(p-2)]))’;
} // Fim do loop para preencher a matriz das medias estimadas
// funcao de ligacaogg = (exp(m_eta_est)./(1.0 + exp(m_eta_est)));
// primeira derivada da funcao de ligacaogg1 = exp(m_eta_est)./((1.0 + exp(m_eta_est)).^2);
// segunda derivada da funcao de ligacaogg2 = (exp(m_eta_est) - exp(2 .* m_eta_est))./((1.0 + exp(m_eta_est)).^3);
// matriz mi estimadami1 = m_mi_est;
// Preenche a matriz inversa de informacao de Fishervp5 = phi_est;finfFishermodelo1(vp5, &dfunc5);Sigma_inv = dfunc5;
// Inicio do teste sequencialvp4 = Sigma_inv;ftestemodelo1(vp4, &dfunc4);posto_estimado_seq = dfunc4;for (i = 0; i <= p-1; i++){
if( posto_estimado_seq == i){cont_aceitar_seq[i][0]++;}aux_seq[i][0] = i;
}// Fim do teste sequencial
// Inicio do criterio de informacao BICvp6 = Sigma_inv;ftesteBIC1(vp6, &dfunc6);posto_estimado_BIC = dfunc6;for (i = 0; i <= p-1; i++){
if( posto_estimado_BIC == i){cont_aceitar_BIC[i][0]++;}aux_BIC[i][0] = i;
}// Fim do criterio de informacao BIC
// Inicio do criterio de informacao HQICvp7 = Sigma_inv;ftesteHQIC1(vp7, &dfunc7);posto_estimado_HQIC = dfunc7;for (i = 0; i <= p-1; i++){
if( posto_estimado_HQIC == i){cont_aceitar_HQIC[i][0]++;}aux_HQIC[i][0] = i;
}// Fim do criterio de informacao HQIC
} // Fim do loop de Monte Carlo
Prop_seq = (cont_aceitar_seq/REP);Prop_BIC = (cont_aceitar_BIC/REP);Prop_HQIC = (cont_aceitar_HQIC/REP);
//************** Vieses e EQM para o posto estimado usando o teste sequencial****************
E_posto_estimado_seq = 0.0;for (i = 0; i < p; i++)
131
{E_posto_estimado_seq = E_posto_estimado_seq + i*Prop_seq[i][0];}
Vies_posto_estimado_seq = E_posto_estimado_seq - rank(mB_verd);
E_posto2_estimado_seq = 0.0;for (i = 0; i < p; i++){E_posto2_estimado_seq = E_posto2_estimado_seq + ((i^2)*Prop_seq[i][0]);} // E(^k^2)
EQM_posto_estimado_seq = E_posto2_estimado_seq - 2*rank(mB_verd)*E_posto_estimado_seq +(rank(mB_verd)^2);
//************** Vieses e EQM para o posto estimado usando o crit. BIC ****************
E_posto_estimado_BIC = 0.0;for (i = 0; i < p; i++){E_posto_estimado_BIC = E_posto_estimado_BIC + i*Prop_BIC[i][0];}
Vies_posto_estimado_BIC = E_posto_estimado_BIC - rank(mB_verd);
E_posto2_estimado_BIC = 0.0;for (i = 0; i < p; i++){E_posto2_estimado_BIC = E_posto2_estimado_BIC + ((i^2)*Prop_BIC[i][0]);} // E(^k^2)
EQM_posto_estimado_BIC = E_posto2_estimado_BIC - 2*rank(mB_verd)*E_posto_estimado_BIC +(rank(mB_verd)^2);
//************** Vieses e EQM para o posto estimado usando o crit. HQIC ****************
E_posto_estimado_HQIC = 0.0;for (i = 0; i < p; i++){E_posto_estimado_HQIC = E_posto_estimado_HQIC + i*Prop_HQIC[i][0];}
Vies_posto_estimado_HQIC = E_posto_estimado_HQIC - rank(mB_verd);
E_posto2_estimado_HQIC = 0.0;for (i = 0; i < p; i++){E_posto2_estimado_HQIC = E_posto2_estimado_HQIC + ((i^2)*Prop_HQIC[i][0]);} // E(^k^2)
EQM_posto_estimado_HQIC = E_posto2_estimado_HQIC - 2*rank(mB_verd)*E_posto_estimado_HQIC +(rank(mB_verd)^2);
//##################### IMPRESSAO DOS RESULTDADOS ###############################
println("\n\n\n\n******************** MODELO 1 ***************************");println("\n\t\t\t\tTamanho amostral: ", ta);println("\n----------------Teste Sequencial----------------------------------");println("\nPosto \t\t", "Num. de replicas \t\t ", "Probabilidade ");for (i = 0; i <= p-1; i++){
println(" ",aux_seq[i][0], " \t\t\t ",cont_aceitar_seq[i][0] ," \t\t ", "%15.4f",Prop_seq[i][0]);
}println("\n Vies_posto_estimado_seq: ","%10.4f",Vies_posto_estimado_seq);println("\n EQM_posto_estimado_seq: ","%10.4f",EQM_posto_estimado_seq);
println("\n------------------- Criterio: BIC----------------------------------");println("\nPosto \t\t", "Num. de replicas \t\t ", "Probabilidade ");for (i = 0; i <= p-1; i++){
println(" ",aux_BIC[i][0], " \t\t\t ",cont_aceitar_BIC[i][0] ," \t\t ", "%15.4f",Prop_BIC[i][0]);
}println("\n Vies_posto_estimado_BIC: ","%10.4f",Vies_posto_estimado_BIC);println("\n EQM_posto_estimado_BIC: ","%10.4f",EQM_posto_estimado_BIC);
println("\n------------------- Criterio: HQIC----------------------------------");println("\nPosto \t\t", "Num. de replicas \t\t ", "Probabilidade ");for (i = 0; i <= p-1; i++){
println(" ",aux_HQIC[i][0], " \t\t\t ",cont_aceitar_HQIC[i][0] ," \t\t ", "%15.4f",Prop_HQIC[i][0]);
}println("\n Vies_posto_estimado_HQIC: ","%10.4f",Vies_posto_estimado_HQIC);println("\n EQM_posto_estimado_HQIC: ","%10.4f",EQM_posto_estimado_HQIC);
} // Fim do loop do tamanho de amostras
print("\n\n\t\t Data: ", date());
132
print("\n\n\t\t Hora: ", time());print("\n\n\t\t Tempo total de execucao: ", timespan(dExecTime), "\tminutos");print("\n");
} // Fim do corpo principal
• Modelo 2
/******************************************************************* PROGRAMA: modelo2.ox* AUTORA: Tatiane Ferreira do Nascimento MeloDATA: 27 de fevereiro de 2004ULTIMA MODIFICACAO: 30 de agosto de 2004 Hora: 19:00******************************************************************/
/* Arquivos principais */#include <oxstd.h>#include <oxfloat.h>#include <oxprob.h>#import <maximize>#import <solvenle>#include <funcoes2.h>#include <funcoes2.ox>
/* Parametros da simulacao */const decl REP = 10000; // numero de replicas Monte Carloconst decl MIN = 50; // tamanho minimo da amostraconst decl MAX = 200; // tamanho maximo da amostra
/* Corpo Principal */main(){
// Declaracao de variaveisdecl dExecTime, phi_verd, vX, cont_falhas, mc, m_alpha, i, j, m_g_eta, mY1,
Matriz_inf_Fisher, ir, m_emv, somm, Y, mB_verd, m_B_ini, phi, posto,dfunc, dfunc1, dfunc2, dfunc3, dfunc4, vp1, vp3, vp4, vp5, vp7,B_est_rep, B_est_barra,// Variveis com relao ao seqposto_estimado_seq, Prop_seq, aux_seq, cont_aceitar_seq,E_posto_estimado_seq, Vies_posto_estimado_seq, E_posto2_estimado_seq,EQM_posto_estimado_seq,// Variveis com relao ao BICposto_estimado_BIC, Prop_BIC, aux_BIC, cont_aceitar_BIC,E_posto_estimado_BIC, Vies_posto_estimado_BIC, E_posto2_estimado_BIC,EQM_posto_estimado_BIC,// Variveis com relao ao HQICposto_estimado_HQIC, Prop_HQIC, aux_HQIC, cont_aceitar_HQIC,E_posto_estimado_HQIC, Vies_posto_estimado_HQIC, E_posto2_estimado_HQIC,EQM_posto_estimado_HQIC;
// Inicio do relogio para o calculo do tempo de execucaodExecTime = timer();
// turn off warningsoxwarning(0);
// Gerador de numeros uniformes pseudo-aleatorios (George Marsaglia)ranseed("GM");
// Numero de colunas da matriz X (matriz de regressores)k = 3; //k = 3; k = 4; k = 5; k = 6;// Numero de colunas da matriz Y (num. de componentes)p = 3; // p = 2; p = 3; p = 4;
// Parametros verdadeiros do modelo// Matriz B verdadeira
mB_verd = zeros(k,p); //posto=0
// Matrizes 3x2// mB_verd = <1,0;0,0;0,0>; //posto=1
133
// mB_verd = <1,0;0,1;0,0>; //posto=2
// Matrizes 3x3// mB_verd = <1,0,0;0,0,0;0,0,0>; //posto=1// mB_verd = <1,0,0;0,1,0;0,0,0>; //posto=2// mB_verd = <1,0,0;0,1,0;0,0,1>; //posto=3
// Matrizes 4x2// mB_verd = <1,0;0,0;0,0;0,0>; //posto=1// mB_verd = <1,0;0,1;0,0;0,0>; //posto=2
// Matrizes 4x3// mB_verd = <1,0,0;0,0,0;0,0,0;0,0,0>; //posto=1// mB_verd = <1,0,0;0,1,0;0,0,0;0,0,0>; //posto=2// mB_verd = <1,0,0;0,1,0;0,0,1;0,0,0>; //posto=3
// Matrizes 4x4// mB_verd = <1,0,0,0;0,0,0,0;0,0,0,0;0,0,0,0>; //posto=1// mB_verd = <1,0,0,0;0,1,0,0;0,0,0,0;0,0,0,0>; //posto=2// mB_verd = <1,0,0,0;0,1,0,0;0,0,1,0;0,0,0,0>; //posto=3// mB_verd = <1,0,0,0;0,1,0,0;0,0,1,0;0,0,0,1>; //posto=4
// Matrizes 5x2// mB_verd = <1,0;0,0;0,0;0,0;0,0>; //posto=1// mB_verd = <1,0;0,1;0,0;0,0;0,0>; //posto=2
// Matrizes 5x3// mB_verd = <1,0,0;0,0,0;0,0,0;0,0,0;0,0,0>; //posto=1// mB_verd = <1,0,0;0,1,0;0,0,0;0,0,0;0,0,0>; //posto=2// mB_verd = <1,0,0;0,1,0;0,0,1;0,0,0;0,0,0>; //posto=3
// Matrizes 5x4// mB_verd = <1,0,0,0;0,0,0,0;0,0,0,0;0,0,0,0;0,0,0,0>; //posto=1// mB_verd = <1,0,0,0;0,1,0,0;0,0,0,0;0,0,0,0;0,0,0,0>; //posto=2// mB_verd = <1,0,0,0;0,1,0,0;0,0,1,0;0,0,0,0;0,0,0,0>; //posto=3// mB_verd = <1,0,0,0;0,1,0,0;0,0,1,0;0,0,0,1;0,0,0,0>; //posto=4
// Matrizes 6x2// mB_verd = <1,0;0,0;0,0;0,0;0,0;0,0>; //posto=1// mB_verd = <1,0;0,1;0,0;0,0;0,0;0,0>; //posto=2
// Matrizes 6x3// mB_verd = <1,0,0;0,0,0;0,0,0;0,0,0;0,0,0;0,0,0>; //posto=1// mB_verd = <1,0,0;0,1,0;0,0,0;0,0,0;0,0,0;0,0,0>; //posto=2// mB_verd = <1,0,0;0,1,0;0,0,1;0,0,0;0,0,0;0,0,0>; //posto=3
// Matrizes 6x4// mB_verd = <1,0,0,0;0,0,0,0;0,0,0,0;0,0,0,0;0,0,0,0;0,0,0,0>; //posto=1// mB_verd = <1,0,0,0;0,1,0,0;0,0,0,0;0,0,0,0;0,0,0,0;0,0,0,0>; //posto=2// mB_verd = <1,0,0,0;0,1,0,0;0,0,1,0;0,0,0,0;0,0,0,0;0,0,0,0>; //posto=3// mB_verd = <1,0,0,0;0,1,0,0;0,0,1,0;0,0,0,1;0,0,0,0;0,0,0,0>; //posto=4
// Impressao de resultados da simulacaoprint("\n\t\t DATA: ", date());print("\n\t\t HORA: ", time());print("\n\n\t\t PROGRAMA OX: ", oxfilename(0));print("\n\t\t VERSAO OX: ", oxversion());print("\n\t\t NUM. MIN. DE OBS.: ", MIN);print("\n\t\t NUM. MAX. DE OBS.: ", MAX);print("\n\t\t NUM. REP. DE MONTE CARLO: ", REP);print("\n\t\t NUM. REGRESSORES DA MATRIZ X: k = ", k);print("\n\t\t NUM. COMPONENTES DE Y: p = ", p);print("\n\n\tMatriz B verdadeira ");println("%10.1f",mB_verd);println("\n\t\tPosto Verdadeiro = ", rank(mB_verd),"\n");
// Loop para os diferentes tamanhos de amostrafor (ta = MIN; ta <= MAX; ta+= 50){
ranseed({1965, 2001});
//Inicializacao das matrizesm_mi = zeros(ta,p);m_emv = zeros(k*p,REP);mY = zeros(ta,p);somm = zeros(ta,1);Y = zeros(ta,p-1);B_est_rep = zeros(k*p,REP);
134
cont_aceitar_seq = zeros(p+1,1);aux_seq = zeros(p+1,1);cont_aceitar_BIC = zeros(p+1,1);aux_BIC = zeros(p+1,1);cont_aceitar_HQIC = zeros(p+1,1);aux_HQIC = zeros(p+1,1);
// Matriz de dados explicativos gerador dos regressores XvX = ranu(ta,k-1);
// Matriz das variaveis regressorasmX = ones(ta,1)~vX;
// Inicializacao do contador de falhas de convergenciacont_falhas = 0;
ranseed(-1);
// Matrizes eta, g(eta), mi e alpham_eta = mX*mB_verd;m_g_eta = exp(m_eta);m_mi = m_g_eta ./ sumr(m_g_eta);m_alpha = m_g_eta;
// Loop de Monte Carlofor (mc = 0; mc < REP; ++mc){
// Loop para gerar a variavel resposta Yfor (i = 0; i < ta; i++){
Y[i][] = randirichlet(1, m_alpha[i][]);somm[i][] = sumr(Y[i][]);
} // Fim do loop para gerar a variavel resposta Y
// Matriz YmY = Y~(1.0 - somm);
// Estimacao inicial da matriz Bm_B_ini = zeros(k,p);
// Vetor dos parametros iniciais (chute inicial)vp1 = vec(m_B_ini);
// Maximizacao da funcao de log-verossimilhanca pelo Metodo BFGS// Parametros da maximizacao por BFGSMaxControl(50, -1);
// Estimacao por Maxima verossimilhancair = MaxBFGS(floglik2, &vp1, &dfunc1, 0, TRUE);
// Checar a convergenciaif(ir == MAX_CONV | ir == MAX_WEAK_CONV){
// Vetor de parametros estimado por maxima verossimilhancam_emv[][mc] = vp1;
} // Fim do if da convergencia
else{++cont_falhas;}
// Matriz B estimadaB_est = shape(vp1[0:((k*p)-1)], k, p);
m_eta_est = mX*B_est;m_g_eta_est = exp(m_eta_est);m_mi_est = m_g_eta_est ./ sumr(m_g_eta_est);g_est = m_g_eta_est;g1_est = m_g_eta_est;
// Preenche a matriz inversa de informacao de Fisherphi = sumr(m_g_eta_est); //phifinfFishermodelo2(phi, &dfunc);Matriz_inf_Fisher = dfunc;
// Inicio do teste sequencialvp4 = Matriz_inf_Fisher;ftestemodelo2(vp4, &dfunc2);posto_estimado_seq = dfunc2;for (i = 0; i <= p; i++){
135
if(posto_estimado_seq == i){cont_aceitar_seq[i][0]++;}aux_seq[i][0] = i;
}// Fim do teste sequencial
// Inicio do criterio BICvp5 = Matriz_inf_Fisher;ftesteBIC2(vp5, &dfunc3);posto_estimado_BIC = dfunc3;for (i = 0; i <= p; i++){
if( posto_estimado_BIC == i){cont_aceitar_BIC[i][0]++;}aux_BIC[i][0] = i;
}// Fim do criterio BIC
// Inicio do criterio HQICvp7 = Matriz_inf_Fisher;ftesteHQIC2(vp7, &dfunc4);posto_estimado_HQIC = dfunc4;for (i = 0; i <= p; i++){
if( posto_estimado_HQIC == i){cont_aceitar_HQIC[i][0]++;}aux_HQIC[i][0] = i;
}// Fim do criterio HQIC
B_est_rep[][mc] = vec(B_est);
} // Fim do loop de Monte Carlo
Prop_BIC = cont_aceitar_BIC/REP;Prop_seq = cont_aceitar_seq/REP;Prop_HQIC = cont_aceitar_HQIC/REP;
//************** Vieses e EQM para o posto estimado usando o teste sequencial***********
E_posto_estimado_seq = 0.0;for (i = 0; i < p+1; i++){E_posto_estimado_seq = E_posto_estimado_seq + i*Prop_seq[i][0];}
Vies_posto_estimado_seq = E_posto_estimado_seq - rank(mB_verd);
E_posto2_estimado_seq = 0.0;for (i = 0; i < p+1; i++){E_posto2_estimado_seq = E_posto2_estimado_seq + ((i^2)*Prop_seq[i][0]);} // E(^k^2)
EQM_posto_estimado_seq = E_posto2_estimado_seq - 2*rank(mB_verd)*E_posto_estimado_seq + (rank(mB_verd)^2);
//************** Vieses e EQM para o posto estimado usando o teste BIC ****************
E_posto_estimado_BIC = 0.0;for (i = 0; i < p+1; i++){E_posto_estimado_BIC = E_posto_estimado_BIC + i*Prop_BIC[i][0];}
Vies_posto_estimado_BIC = E_posto_estimado_BIC - rank(mB_verd);
E_posto2_estimado_BIC = 0.0;for (i = 0; i < p+1; i++){E_posto2_estimado_BIC = E_posto2_estimado_BIC + ((i^2)*Prop_BIC[i][0]);} // E(^k^2)
EQM_posto_estimado_BIC = E_posto2_estimado_BIC - 2*rank(mB_verd)*E_posto_estimado_BIC + (rank(mB_verd)^2);
//************** Vieses e EQM para o posto estimado usando o teste HQIC *************
E_posto_estimado_HQIC = 0.0;for (i = 0; i < p+1; i++){E_posto_estimado_HQIC = E_posto_estimado_HQIC + i*Prop_HQIC[i][0];}
Vies_posto_estimado_HQIC = E_posto_estimado_HQIC - rank(mB_verd);
E_posto2_estimado_HQIC = 0.0;for (i = 0; i < p+1; i++){E_posto2_estimado_HQIC = E_posto2_estimado_HQIC + ((i^2)*Prop_HQIC[i][0]);} // E(^k^2)
136
EQM_posto_estimado_HQIC = E_posto2_estimado_HQIC - 2*rank(mB_verd)*E_posto_estimado_HQIC + (rank(mB_verd)^2);
//######################## IMPRESSAO DOS RESULTADOS ################################
println("\n\n**************** Modelo 2 ***************************");println("\n\t\t\t\tTamanho amostral: ", ta);println("\n----------------Teste Sequencial----------------------------------");println("\nPosto \t\t", "Num. de replicas \t\t ", "Probabilidade ");for (i = 0; i <= p; i++){
println(" ",aux_seq[i][0], " \t\t\t ",cont_aceitar_seq[i][0] ," \t\t ", "%15.4f",Prop_seq[i][0]);
}println("\n Vies_posto_estimado_seq: ","%10.4f",Vies_posto_estimado_seq);println("\n EQM_posto_estimado_seq: ","%10.4f",EQM_posto_estimado_seq);println("\n------------------- Criterio: BIC----------------------------------");println("\nPosto \t\t", "Num. de replicas \t\t ", "Probabilidade ");for (i = 0; i <= p; i++){
println(" ",aux_BIC[i][0], " \t\t\t ",cont_aceitar_BIC[i][0] ," \t\t ", "%15.4f",Prop_BIC[i][0]);
}println("\n Vies_posto_estimado_BIC: ","%10.4f",Vies_posto_estimado_BIC);println("\n EQM_posto_estimado_BIC: ","%10.4f",EQM_posto_estimado_BIC);println("\n------------------- Criterio: HQIC----------------------------------");println("\nPosto \t\t", "Num. de replicas \t\t ", "Probabilidade ");for (i = 0; i <= p; i++){
println(" ",aux_HQIC[i][0], " \t\t\t ",cont_aceitar_HQIC[i][0] ," \t\t ", "%15.4f",Prop_HQIC[i][0]);
}println("\n Vies_posto_estimado_HQIC: ","%10.4f",Vies_posto_estimado_HQIC);println("\n EQM_posto_estimado_HQIC: ","%10.4f",EQM_posto_estimado_HQIC);
} // Fim do loop do tamanho de amostras
print("\n\n\t\t Data: ", date());print("\n\n\t\t Hora: ", time());print("\n\n\t\t Tempo total de execucao: ", timespan(dExecTime), "\tminutos");print("\n");
} // Fim do corpo principal
137
A5.2. Biblioteca de funcoes
• Modelo 1
/******************************************************************* PROGRAMA: funcoes1.ox* AUTORA: Tatiane Ferreira do Nascimento Melo* DATA: 27 de fevereiro de 2004* ULTIMA MODIFICACAO: 30 de agosto de 2004 Hora: 19:00******************************************************************/
/* Arquivos principais */#include <oxstd.h>#include <oxfloat.h>#include <oxprob.h>#import <maximize>#import <solvenle>
// Variaveis Globaisstatic decl mX, mY, p, k, ta, gg, gg1, gg2;static decl m_mi, m_eta, m_mi_trans, eta_trans, mi1;static decl soma, soma1, soma2, soma3, M, M4;static decl B_est, B_est1, m_eta_est, m_g_eta_est, m_mi_est, g_est, g1_est;
//===================================================================================
// Funcao log-verossimilhanca do modelo1 da regressao Dirichletfloglik1(const vP, const adFunc, const avScore, const amHess){
// Variaveis locaisdecl i, j, som;decl B = shape(vP[0:((k*(p-1))-1)], k, p-1);decl eta = mX*B;decl phi = vP[k*(p-1)];decl mi = zeros(ta,p);
// Loop para preencher a matriz mifor (i = 0; i < ta; i++){
som = 0.0;mi[i][0] = exp(eta[i][0])/(1.0 + exp(eta[i][0]));for (j = 1; j < p-1; j++){
som = som + mi[i][j-1];mi[i][j] = (exp(eta[i][j])/(1.0 + exp(eta[i][j])))*(1.0 - som);
}mi[i][p-1] = 1.0 - sumr(mi[i][0:(p-2)]);
} // Fim do loop para preencher a matriz mi
// Matriz alphadecl alpha = phi .* mi;
adFunc[0] = double(sumc(loggamma(phi) - sumr(loggamma(alpha))+ sumr((alpha - 1.0) .* log(mY))));
if (isnan(adFunc[0]) || isdotinf(adFunc[0]))return 0;
elsereturn 1; // 1 indica sucesso
} // Fim da funcao log-verossimilhanca do modelo1 de regressao Dirichlet
//=========================================================================================
// Funcao para preencher a matriz inversa de informacao de Fisher do modelo 1finfFishermodelo1(const vp5, const adFunc){
decl r, m, t, P, K, Q, V1, V2, V3, V4, M2, M3,
138
m_inv_Inf_Fisch_B1, i, j, U, mIdent_Kronec_X1,mInf_Fisch_B1, I_bb_inv, Sigma_inv, I_bb, I_phi_phi,I_b_phi, I_phi_b, meval3, ab3, I_bb_aux, n, v,I_b_phi_aux, I_phi_phi_aux, S1, S2, S3, S4, S5, S6,S7, S8, S9, S10, S11, S12, S13, S14, S15, S16, S17, S18,S19, S20, S21, S22, S23, P1, P2, P3, P4, P6, P7, P8,P9, P10, P11, P12, SS4, SS44, SS5, SS13, SS15, SS17,SS19, PS, PS1, PS3, PS4, PS5, PS6, PS8, PS9, PS10,PS12, PS16, PS17, PS18, PS20, PS21, PS22, PS23, SP1,SP2, SP3, SP4, PP1, PP2, PP7, PP10, S1_aux, S2_aux,Sigma_inv_aux;
V1 = zeros(ta,1);V2 = zeros(ta,1);V3 = zeros(ta,1);V4 = zeros(ta,1);M3 = zeros(ta,p-1);mInf_Fisch_B1 = zeros((k*(p-1))+1,(k*(p-1))+1);I_bb_aux = zeros(k,k);I_b_phi_aux = zeros(k,p-1);
for (n = 0; n < k; n++){
for (v = 0; v < k; v++){ S1_aux = 0.0;
for (i = 0; i < ta; i++){ S1_aux = S1_aux + (mX[i][v] * mX[i][n]*vp5^2*(polygamma(vp5*mi1[i][0],1) +
polygamma(vp5*(1 - mi1[i][0]),1))*(gg1[i][0]^2));}I_bb_aux [n][v] = S1_aux;
}}
for (v = 0; v < k; v++){ S2_aux = 0.0;
for (i = 0; i < ta; i++){ S2_aux = S2_aux + (mX[i][v]*vp5*gg1[i][0]*(polygamma(vp5*mi1[i][0],1)
* mi1[i][0] - polygamma(vp5*(1 - mi1[i][0]),1)* (1 - mi1[i][0])));}I_b_phi_aux[v][0] = S2_aux;
}
I_phi_phi_aux = 0.0;for (i = 0; i < ta; i++){ I_phi_phi_aux = I_phi_phi_aux + (polygamma(vp5 .* mi1[i][0],1)* mi1[i][0]^2 +
polygamma(vp5*(1 - mi1[i][0]),1)* (1 - mi1[i][0])^2 -polygamma(vp5,1));
}
Sigma_inv_aux = I_bb_aux - (I_b_phi_aux * invert(I_phi_phi_aux) * I_b_phi_aux’);
//**************************** Matriz M4 usada para calcular I_bb ********************
// Preenchimento do U00,ifor (i = 0; i < ta; i++){
S1 = 0.0;S2 = 0.0;if(p-2 >= 1){
for (j = 1; j <= p-2; j++){
if(j > 1){ PS1 = 1;
for (t = 1; t <= j-1; t++){PS1 = PS1*(1.0 - gg[i][t]);}
}else if(j == 1){PS1 = 1;}
S2 = S2 + (gg[i][j]*PS1);S1 = S1 + (polygamma(vp5*mi1[i][j],1) * gg[i][j]^2*PS1^2);
}}else if(p-2 < 1){S1 = 0.0; S2 = 0.0;}
139
if(p > 2){V1[i][0] = vp5^2*gg1[i][0]^2*(polygamma(vp5*mi1[i][0],1) + S1 +
polygamma(vp5*(1.0 - sumr(mi1[i][0:p-2])),1)*(1.0 - S2)^2);}
else if(p == 2){V1[i][0] = vp5^2*gg1[i][0]^2*(polygamma(vp5*mi1[i][0],1) +
polygamma(vp5*(1.0 - sumr(mi1[i][0:p-2])),1));}
}//Fim do loop i e fim do preenchimento do U00,i
M4 = diag(V1);
// Preenchimento do U0r,ifor (r = 1; r <= p-2; r++){ V2 = zeros(ta,1);
for (i = 0; i < ta; i++){ S3 = 0.0;
for (t = 0; t <= r-1; t++){S3 = S3 + mi1[i][t];}P1 = 1;if(r-1 >= 1){
for (t = 1; t <= r-1; t++){P1 = P1* (1.0 - gg[i][t]);}
}else if(r-1 < 1){P1 = 1;}
//CALCULAR S4 E S6if(r < p-2){ S4 = 0.0;
S6 = 0.0;if(r+1 <= p-2){for (j = r+1; j <= p-2; j++){
if(j == r+1){PS6 = 1;}else if(j > r+1){ PS6 = 1;
for (t = r+1; t <= j-1; t++){PS6 = PS6*(1.0 - gg[i][t]);}
}
PS4 = 1;for (t = 1; t <= j-1; t++)
{PS4 = PS4*(1.0 - gg[i][t]);}S6 = S6 + gg[i][j]*PS6;S4 = S4 + polygamma(vp5*mi1[i][j],1) * gg[i][j]^2*PS4*PS6;
}
}else if(r+1 > p-2){S4 = 0.0; S6 = 0.0;}
}// Fim do if(r < p-2)
else if(r == p-2){S4 = 0.0; S6 = 0.0;}// Fim do else if(r == p-2)
//CALCULAR S5if(1 <= p-2){ S5 = 0.0;
for (j = 1; j <= p-2; j++){
if(j == 1){PS5 = 1;}else if(j > 1){ PS5 = 1;for (t = 1; t <= j-1; t++){PS5 = PS5*(1.0 - gg[i][t]);}
}S5 = S5 + gg[i][j]*PS5;
}}else if(1 > p-2){S5 = 0.0;}
V2[i][0] = (-vp5^2)*gg1[i][r]*gg1[i][0]*(1.0 - S3)*(polygamma(vp5*mi1[i][r],1)*gg[i][r]*P1 - S4 -
140
polygamma(vp5*(1.0 - sumr(mi1[i][0:p-2])),1)*(1.0 - S5)*(1.0 - S6)); //U0r
}//Fim do loop iK = diag(V2);M4 = M4~K;
}//Fim do loop r e fim do preenchimento do U0r,i
for (m = 1; m <= p-2; m++){
// Preenchimento do Um0,ifor (i = 0; i < ta; i++){ S7 = 0.0;
for (t = 0; t <= m-1; t++){S7 = S7 + mi1[i][t];}
P2 = 1;if(m-1 >= 1){
for (t = 1; t <= m-1; t++){P2 = P2* (1.0 - gg[i][t]);}
}else if(m-1 < 1){P2 = 1;}
//CALCULAR S8 E S10if(m < p-2){ S8 = 0.0;
S10 = 0.0;if(m+1 <= p-2){
for (j = m+1; j <= p-2; j++){
if(j == m+1){PS10 = 1;}else if(j > m+1){ PS10 = 1;
for (t = m+1; t <= j-1; t++){PS10 = PS10*(1.0 - gg[i][t]);}
}PS8 = 1;for (t = 1; t <= j-1; t++){PS8 = PS8*(1.0 - gg[i][t]);}S10 = S10 + gg[i][j]*PS10;S8 = S8 + polygamma(vp5*mi1[i][j],1) * gg[i][j]^2*PS8*PS10;
}
}else if(m+1 > p-2){S8 = 0.0; S10 = 0.0;}
}// Fim do if(r < p-2)else if(m == p-2){S8 = 0.0; S10 = 0.0;}// Fim do else if(r == p-2)
//CALCULAR S9if(1 <= p-2){ S9 = 0.0;
for (j = 1; j <= p-2; j++){
if(j == 1){PS9 = 1;}else if(j > 1){ PS9 = 1;for (t = 1; t <= j-1; t++){PS9 = PS9*(1.0 - gg[i][t]);}
}S9 = S9 + gg[i][j]*PS9;
}}else if(1 > p-2){S9 = 0.0;}
V3[i][0] = (-vp5^2)*gg1[i][m]*gg1[i][0]*(1.0 - S7)*(polygamma(vp5*mi1[i][m],1)*gg[i][m]*P2 - S8 -polygamma(vp5*(1.0 - sumr(mi1[i][0:p-2])),1)*(1.0 - S9)*(1.0 - S10)); //Um0
}//Fim do loop i e fim do preenchimento do Um0,i
141
P = diag(V3);
for (r = 1; r <= p-2; r++){
V4 = zeros(ta,1);// Preenchimento do Umr,ifor (i = 0; i < ta; i++){
if(r == m){
//Calculo de S11S11 = 0.0;for (t = 0; t <= r-1; t++){S11 = S11 + mi1[i][t];}
//Calculo de S12 e S13if(r < p-2){S12 = 0.0;S13 = 0.0;if(r+1 <= p-2){
for (j = r+1; j <= p-2; j++){if(j == r+1){PS12 = 1;}else if(j > r+1){ PS12 = 1;
for (t = r+1; t <= j-1; t++){PS12 = PS12*(1.0 - gg[i][t]);}
}
S13 = S13 + gg[i][j]*PS12;S12 = S12 + polygamma(vp5*mi1[i][j],1) * gg[i][j]^2*PS12^2;
}
}else if(r+1 > p-2){S13 = 0.0; S12 = 0.0;}
}// Fim do if(r < p-2)else if(r == p-2){S12 = 0.0; S13 = 0.0;}
V4[i][0] = vp5^2*gg1[i][r]^2*(1.0 - S11)^2*(polygamma(vp5*mi1[i][r],1) +S12 + polygamma(vp5*(1.0 - sumr(mi1[i][0:p-2])),1)*(1.0 - S13)^2);
}//Fim do if(r == m)else if(r > m){
//Calculo de S14S14 = 0.0;for (t = 0; t <= m-1; t++){S14 = S14 + mi1[i][t];}
//Calculo de S15S15 = 0.0;for (t = 0; t <= r-1; t++){S15 = S15 + mi1[i][t];}
//Calculo de S16 e S17if(r < p-2){S16 = 0.0;S17 = 0.0;if(r+1 <= p-2){
for (j = r+1; j <= p-2; j++){if(j == r+1){PS17 = 1;}else if(j > r+1){ PS17 = 1;
for (t = r+1; t <= j-1; t++){PS17 = PS17*(1.0 - gg[i][t]);}
}
if(m+1 > j-1){PS16 = 1;}
142
else if(m+1 <= j-1){ PS16 = 1;
for (t = m+1; t <= j-1; t++){PS16 = PS16*(1.0 - gg[i][t]);}
}
S17 = S17 + gg[i][j]*PS17;S16 = S16 + polygamma(vp5*mi1[i][j],1) * gg[i][j]^2*PS16*PS17;
}
}else if(r+1 > p-2){S16 = 0.0; S17 = 0.0;}
}// Fim do if r < p-2else if(r == p-2){S16 = 0.0; S17 = 0.0;}
//Calculo de S18if(m+1 <= p-2){ S18 = 0.0;
for (j = m+1; j <= p-2; j++){
if(j == m+1){PS18 = 1;}else if(j > m+1){ PS18 = 1;for (t = m+1; t <= j-1; t++){PS18 = PS18*(1.0 - gg[i][t]);}
}S18 = S18 + gg[i][j]*PS18;
}}else if(m+1 > p-2){S18 = 0.0;}
if(r-1 >= m+1){ P3 = 1;
for (t = m+1; t <= r-1; t++){P3 = P3* (1.0 - gg[i][t]);}
}else if(r-1 < m+1){P3 = 1;}
V4[i][0] = (-vp5^2)*gg1[i][r]*gg1[i][m]*(1.0 - S14)*(1.0 - S15)*(polygamma(vp5*mi1[i][r],1)*gg[i][r]*P3 - S16 -polygamma(vp5*(1.0 - sumr(mi1[i][0:p-2])),1)*(1.0 - S17)*(1.0 - S18));
} //Fim do else if(r > m)
else if(r < m){
//Calculo de S19S19 = 0.0;for (t = 0; t <= m-1; t++){S19 = S19 + mi1[i][t];}
//Calculo de S20S20 = 0.0;for (t = 0; t <= r-1; t++){S20 = S20 + mi1[i][t];}
//Calculo de S21 e S22if(m < p-2){S21 = 0.0;S22 = 0.0;if(m+1 <= p-2){
for (j = m+1; j <= p-2; j++){if(j == m+1){PS22 = 1;}else if(j > m+1){ PS22 = 1;
for (t = m+1; t <= j-1; t++){PS22 = PS22*(1.0 - gg[i][t]);}
}
143
if(r+1 > j-1){PS21 = 1;}else if(r+1 <= j-1){ PS21 = 1;
for (t = r+1; t <= j-1; t++){PS21 = PS21*(1.0 - gg[i][t]);}
}
S22 = S22 + gg[i][j]*PS22;S21 = S21 + polygamma(vp5*mi1[i][j],1) * gg[i][j]^2*PS21*PS22;
}
}else if(m+1 > p-2){S21 = 0.0; S22 = 0.0;}
} // Fim do if m < p-2
else if(m == p-2){S21 = 0.0; S22 = 0.0;}
//Calculo de S23if(r+1 <= p-2){ S23 = 0.0;
for (j = r+1; j <= p-2; j++){
if(j == r+1){PS23 = 1;}else if(j > r+1){ PS23 = 1;for (t = r+1; t <= j-1; t++){PS23 = PS23*(1.0 - gg[i][t]);}
}S23 = S23 + gg[i][j]*PS23;
}}else if(r+1 > p-2){S23 = 0.0;}
if(m-1 >= r+1){ P4 = 1;
for (t = r+1; t <= m-1; t++){P4 = P3* (1.0 - gg[i][t]);}
}else if(m-1 < r+1){P4 = 1;}
V4[i][0] = (-vp5^2)*gg1[i][r]*gg1[i][m]*(1.0 - S19)*(1.0 - S20)*(polygamma(vp5*mi1[i][m],1)*gg[i][m]*P4 - S21 -polygamma(vp5*(1.0 - sumr(mi1[i][0:p-2])),1)*(1.0 - S22)*(1.0 - S23));
}//Fim do else if(r < m)}//Fim do loop iQ = diag(V4);P = P~Q;
}//Fim do loop r e fim do preenchimento do Umr,iM4 = M4|P;
}//Fim do loop m
//**************************** Matriz M3 usada para calcular I_b_phi ********************for (i = 0; i < ta; i++){
for (r = 0; r <= p-2; r++){
// Calcular SP1 e SP2if(r-1 >= 0){ SP1 = 0.0;for (t = 0; t <= r-1; t++){SP1 = SP1 + mi1[i][t];}
}else if(r-1 < 0){SP1 = 0.0;}
if(r < p-2){
SP3 = 0.0;if(p-2 >= r+1)
144
{for (j = r+1; j <= p-2; j++){
if(j == r+1){PS = 1;}else if(j > r+1){ PS = 1;for (t = r+1; t <= j-1; t++){PS = PS*(1.0 - gg[i][t]);}
}SP3 = SP3 + ((polygamma(vp5*mi1[i][j],1)* mi1[i][j] -
polygamma(vp5*(1.0 - sumr(mi1[i][0:p-2])),1)*(1.0 - sumr(mi1[i][0:p-2])))* gg[i][j]*PS);
}}else if(p-2 < r+1){SP3 = 0.0;}
}// Fim do if(r < p-2)else if(r == p-2){SP3 = 0.0;}
M3[i][r] = gg1[i][r] * (1.0 - SP1) * vp5 *(polygamma(vp5*mi1[i][r],1) * mi1[i][r]- polygamma(vp5*(1 - sumr(mi1[i][0:p-2])),1) * (1 - sumr(mi1[i][0:p-2]))- SP3);
}// Fim do loop do r}// Fim do loop do i
M2 = mX’*M3;
mIdent_Kronec_X1 = unit(p-1) ** mX;U = (mIdent_Kronec_X1’)*M4*(mIdent_Kronec_X1);
I_bb = U;I_phi_phi = - sumc(polygamma(vp5,1) - sumr((mi1.^2) .* polygamma(vp5 .* mi1,1)));I_b_phi = vec(M2);I_phi_b = vec(M2);Sigma_inv = I_bb - (I_b_phi * invert(I_phi_phi) * I_b_phi’);
adFunc[0] = Sigma_inv;
} // Fim da funcao para preencher a matriz inversa de informacao de Fisher do modelo 1
//============================================================================================
// Funcao para o teste sequencialftestemodelo1(const vp4, const adFunc){
decl posto, V, D, U, S, w, svd, i, j, p_B, mu, mv, mw,v, min, U1, U2, V1, V2, D1, D2, Q_inv, l, n, L,quantil, nivel, posto_estimado;
// decomposicao em valores singulares da matriz B estimadasvd = decsvd(B_est1, &mu, &mw, &mv);V = mv;D = diag(mw);U = zeros(k,k);S = zeros(k,k);w = zeros(k,k);v = mu~(unit(k,k-(p-1)));
// Loop para completar a matriz U// atraves do metodo de Gram-Schmidtfor (j = 0; j < (p-1); j++){U[][j] = v[][j];}for (i = p-1; i < k; i++){
for (j = 0; j < i; j++){S[][i] = S[][i] + sumc(v[][i].* U[][j])* U[][j];}
w[][i] = v[][i] - S[][i];U[][i] = w[][i] ./ ((sumc(w[][i].^2)).^0.5);
} // Fim do loop para completar a matriz U
// Loop para testar H0for (posto = 0; posto <= p-2; posto +=1){
145
if(posto == 0){ U2 = U; V2 = V; }
else if(posto > 0){ U2 = U[][posto:k-1];
V2 = V[][posto:p-2]; }
Q_inv = (V2’ ** U2’) * vp4 * (V2 ** U2);l = vec(U2’*B_est1*V2);// a estatistica de teste L(b)L = l’*Q_inv*l;// graus de liberdade para a qui-quadradon = (k-posto)*((p-1)-posto);// quantil da qui-quadrado vezes a funcao C_N = sqrt(log(N))quantil = quanchi(0.95,n)*((log(ta))^0.5);
// Aceita H0 seif(L <= quantil){
posto_estimado = posto;break;
}
} // Fim do loop para testar H0
// Condicao para rejeitar H0if(L > quantil){posto_estimado = p-1;}// Fim da condicao para rejeitar H0
adFunc[0] = posto_estimado;
} // Fim da funo para o teste sequencial
//============================================================================================
// Funcao para o criterio de informacao BICftesteBIC1(const vp6, const adFunc){
decl posto, V, D, U, S, w, svd, i, j, p_B, mu, mv, mw,v, U1, U2, V1, V2, D1, D2, Q_inv, l, n, L,BIC, posto_estimado;
// decomposicao em valores singulares da matriz B estimadasvd = decsvd(B_est1, &mu, &mw, &mv);V = mv;D = diag(mw);U = zeros(k,k);S = zeros(k,k);w = zeros(k,k);v = mu~(unit(k,k-(p-1)));BIC = zeros(1,p);L = zeros(1,p-1);
// Loop para completar a matriz U// atraves do metodo de Gram-Schmidtfor (j = 0; j < p-1; j++){U[][j] = v[][j];}for (i = p-1; i < k; i++){
for (j = 0; j < i; j++){S[][i] = S[][i] + sumc(v[][i].* U[][j])* U[][j];}
w[][i] = v[][i] - S[][i];U[][i] = w[][i] ./ ((sumc(w[][i].^2)).^0.5);
} // Fim do loop para completar a matriz U
// Loop para o calculo do vetor BICfor (posto = 0; posto <= p-2; posto+=1){
if(posto == 0){U2 = U; V2 = V;}
else if(posto > 0){U2 = U[][posto:k-1]; V2 = V[][posto:(p-1)-1]; }
146
Q_inv = (V2’ ** U2’) * vp6 * (V2 ** U2);l = vec(U2’*B_est1*V2);// a estatistica de teste L(b)L[posto] = l’*Q_inv*l;// vetor IC(b, C_N)BIC[posto] = (L[posto] + (posto)*log(ta));
} // Fim do loop para o calculo do vetor BIC
// se b = p-1 entao L(b) = 0BIC[p-1] = (p-1)*log(ta);
posto_estimado = (vecindex(BIC, min(BIC))); // o minimo do vetor BIC
adFunc[0] = posto_estimado;
} // Fim da funo para o criterio de informacao BIC
//=============================================================================================
// Funcao para o teste HQICftesteHQIC1(const vp7, const adFunc){
decl posto, V, D, U, S, w, svd, i, j, p_B, mu, mv, mw,v, U1, U2, V1, V2, D1, D2, Q_inv, l, n, L,HQIC, posto_estimado, const_c;
// decomposicao em valores singulares da matriz B estimadasvd = decsvd(B_est1, &mu, &mw, &mv);V = mv;D = diag(mw);U = zeros(k,k);S = zeros(k,k);w = zeros(k,k);v = mu~(unit(k,k-(p-1)));HQIC = zeros(1,p);L = zeros(1,p-1);
const_c = 2.01;
// Loop para completar a matriz U// atraves do metodo de Gram-Schmidtfor (j = 0; j < p-1; j++){U[][j] = v[][j];}for (i = p-1; i < k; i++){
for (j = 0; j < i; j++){S[][i] = S[][i] + sumc(v[][i].* U[][j])* U[][j];}
w[][i] = v[][i] - S[][i];U[][i] = w[][i] ./ ((sumc(w[][i].^2)).^0.5);
} // Fim do loop para completar a matriz U
// Loop para o calculo do vetor HQICfor (posto = 0; posto <= p-2; posto+=1){
if(posto == 0){U2 = U; V2 = V;}
else if(posto > 0){U2 = U[][posto:k-1]; V2 = V[][posto:(p-1)-1];}
Q_inv = (V2’ ** U2’) * vp7 * (V2 ** U2);l = vec(U2’*B_est1*V2);// a estatistica de teste L(b)L[posto] = l’*Q_inv*l;// vetor IC(b, C_N)HQIC[posto] = (L[posto] + (posto)*(const_c*(log(log(ta)))));
} // Fim do loop para o calculo do vetor HQIC
// se b = p-1 entao L(b) = 0HQIC[p-1] = (p-1)*const_c*(log(log(ta)));
posto_estimado = (vecindex(HQIC, min(HQIC))); // o minimo do vetor HQIC
147
adFunc[0] = posto_estimado;
} // Fim da funcao para o criterio de informacao HIC
• Modelo 2
/******************************************************************* PROGRAMA: funcoes2.ox* AUTORA: Tatiane Ferreira do Nascimento Melo* DATA: 27 de fevereiro de 2004* ULTIMA MODIFICACAO: 30 de agosto de 2004 Hora: 19:00******************************************************************/
/* Arquivos principais */#include <oxstd.h>#include <oxfloat.h>#include <oxprob.h>#import <maximize>#import <solvenle>
// Variaveis Globaisstatic decl mX, mY, m_mi, m_eta, k, p, ta, M;static decl B_est, m_eta_est, m_g_eta_est, m_mi_est, g_est, g1_est;
//===================================================================================
// Funcao log-verossimilhanca do modelo2 de regressao Dirichletfloglik2(const vP, const adFunc, const avScore, const amHess){
// Variveis locaisdecl i, j, B, eta, phi2, alpha, mi, g_eta;
B = shape(vP[0:((k*p)-1)], k, p);eta = mX*B;g_eta = exp(eta);phi2 = sumr(g_eta);//matriz mimi = g_eta ./ phi2;//matriz alphaalpha = g_eta;
adFunc[0] = double(sumc(loggamma(phi2) - sumr(loggamma(alpha)) +sumr((alpha - 1.0) .* log(mY))));
if (isnan(adFunc[0]) || isdotinf(adFunc[0]))return 0;
elsereturn 1; // 1 indica sucesso
} // Fim da funcao log-verossimilhanca do modelo2 de regressao Dirichlet
//============================================================================================
// Funcao para preencher a matriz inversa de informacao de Fisher
finfFishermodelo2(const phi, const adFunc){
// Variaveis locaisdecl i, j, r, m, V1, V2, V3, V4, P, Q, mIdent_Kronec_X, mInf_Fisch_B_est;
V1 = zeros(ta,1);for (i = 0; i < ta; i++){V1[i][0] = - g1_est[i][0]^2 * (polygamma(phi[i][0],1)
- polygamma(phi[i][0]*m_mi_est[i][0], 1));} // U00
148
M = diag(V1);
for (r = 1; r <= p-1; r++){
V2 = zeros(ta,1);for (i = 0; i < ta; i++){V2[i][0] = -g1_est[i][r]*g1_est[i][0]*polygamma(phi[i][0],1);} // U0r
M = M ~ diag(V2);
} // Fim do loop do r
for (m = 1; m <= p-1; m++){
V3 = zeros(ta,1);for (i = 0; i < ta; i++){V3[i][0] = -g1_est[i][m]*g1_est[i][0]*polygamma(phi[i][0],1);}// Um0
P = diag(V3);
for (r = 1; r <= p-1; r++){
V4 = zeros(ta,1);for (i = 0; i < ta; i++){
if(r == m){V4[i][0] = -g1_est[i][m]^2*(polygamma(phi[i][0],1)
- polygamma(phi[i][0]*m_mi_est[i][m], 1));}// Umm
else{V4[i][0] = -g1_est[i][r]*g1_est[i][m]*polygamma(phi[i][0],1);}// Umr
}// Fim do loop do i
Q = diag(V4);P = P ~ Q;
}// Fim do loop do r
M = M | P;
}// Fim do loop do m
mIdent_Kronec_X = unit(p) ** mX;mInf_Fisch_B_est = ((mIdent_Kronec_X)’)*M*(mIdent_Kronec_X);
adFunc[0] = mInf_Fisch_B_est;
return 1; // 1 indica sucesso
} // Fim da funcao para preencher a matriz inversa de informacao de Fisher
//=============================================================================================
// Funcao para o teste sequencialftestemodelo2(const vp4, const adFunc){
// Variaveis locaisdecl posto, V, D, U, S, w, svd, i, j, mu, mv, mw,
v, U1, U2, V1, V2, Q_inv, l, n, L, quantil,posto_estimado;
// decomposicao em valores singulares a matriz B estimadasvd = decsvd(B_est, &mu, &mw, &mv);V = mv;D = diag(mw);U = zeros(k,k);S = zeros(k,k);w = zeros(k,k);v = mu~(unit(k,k-p));
// Loop para completar a matriz U// atraves do metodo de Gram-Schmidtfor (j = 0; j < p; j++){U[][j] = v[][j];}
149
for (i = p; i < k; i++){
for (j = 0; j < i; j++){S[][i] = S[][i] + sumc(v[][i].* U[][j])* U[][j];}
w[][i] = v[][i] - S[][i];U[][i] = w[][i] ./ ((sumc(w[][i].^2)).^0.5);
} // Fim do loop para completar a matriz U
// Loop para testar H0for (posto = 0; posto <= p-1; posto++){
if(posto == 0){ U2 = U; V2 = V;}else{
U1 = U[][0:posto-1];U2 = U[][posto:k-1];V1 = V[][0:posto-1];V2 = V[][posto:p-1];
}
Q_inv = (V2’ ** U2’) * vp4 * (V2 ** U2);l = vec(U2’*B_est*V2);// a estatistica de teste L(b)L = l’*Q_inv*l;// graus de liberdade para a qui-quadradon = (k-posto)*(p-posto);// quantil da qui-quadrado vezes a funcao C_N = sqrt(log(N))quantil = quanchi(0.95,n)*((log(ta))^0.5);
// Aceita H0 seif(L <= quantil){
posto_estimado = posto;break;
}} // Fim do loop para testar H0
// Condio para rejeitar H0if(L > quantil){posto_estimado = p;}// Fim da condio para rejeitar H0
adFunc[0] = posto_estimado;
} // Fim da funcao para o teste sequencial
//=============================================================================================
// Funcao para o criterio de informacao BICftesteBIC2(const vp5, const adFunc){
// Variveis locaisdecl posto, V, D, U, S, w, svd, i, j, mu, mv, mw, v, U1,
U2, V1, V2, Q_inv, l, L, BIC, posto_estimado;
// decomposicao em valores singulares da matriz B estimadasvd = decsvd(B_est, &mu, &mw, &mv);V = mv;D = diag(mw);U = zeros(k,k);S = zeros(k,k);w = zeros(k,k);v = mu~(unit(k,k-p));BIC = zeros(1,p+1);L = zeros(1,p);
// Loop para completar a matriz U// atraves do metodo de Gram-Schmidtfor (j = 0; j < p; j++){U[][j] = v[][j];}
for (i = p; i < k; i++){
150
for (j = 0; j < i; j++){S[][i] = S[][i] + sumc(v[][i].* U[][j])* U[][j];}
w[][i] = v[][i] - S[][i];U[][i] = w[][i] ./ ((sumc(w[][i].^2)).^0.5);
} // Fim do loop para completar a matriz U
// Loop para testar H0for (posto = 0; posto <= p-1; posto++){
if(posto == 0){U2 = U; V2 = V;}
else if(posto >= 1){U1 = U[][0:posto-1];U2 = U[][posto:k-1];V1 = V[][0:posto-1];V2 = V[][posto:p-1];
}
Q_inv = (V2’ ** U2’) * vp5 * (V2 ** U2);l = vec(U2’*B_est*V2);// a estatistica de teste L(b)L[posto] = l’*Q_inv*l;// vetor IC(b, C_N)BIC[posto] = L[posto] + posto*log(ta);
} // Fim do loop para testar H0
// se b = p entao L(b) = 0BIC[p] = p*log(ta);
posto_estimado = (vecindex(BIC, min(BIC))); // o minimo do vetor BIC
adFunc[0] = posto_estimado;
} // Fim da funcao para o criterio de informacao BIC
//=============================================================================================
// Funcao para o criterio de informacao HQICftesteHQIC2(const vp7, const adFunc){
// Variveis locaisdecl posto, V, D, U, S, w, svd, i, j, mu, mv, mw,
v, U1, U2, V1, V2, Q_inv, l, L, HQIC,posto_estimado, const_c;
// decomposicao em valores singulares da matriz B estimadasvd = decsvd(B_est, &mu, &mw, &mv);V = mv;D = diag(mw);U = zeros(k,k);S = zeros(k,k);w = zeros(k,k);v = mu~(unit(k,k-p));HQIC = zeros(1,p+1);L = zeros(1,p);
const_c = 2.01;
// Loop para completar a matriz U// atraves do metodo de Gram-Schmidtfor (j = 0; j < p; j++){U[][j] = v[][j];}
for (i = p; i < k; i++){
for (j = 0; j < i; j++){S[][i] = S[][i] + sumc(v[][i].* U[][j])* U[][j];}
w[][i] = v[][i] - S[][i];U[][i] = w[][i] ./ ((sumc(w[][i].^2)).^0.5);
151
} // Fim do loop para completar a matriz U
// Loop para testar H0for (posto = 0; posto <= p-1; posto++){
if(posto == 0){U2 = U; V2 = V;}
else if(posto >= 1){
U1 = U[][0:posto-1];U2 = U[][posto:k-1];V1 = V[][0:posto-1];V2 = V[][posto:p-1];
}
Q_inv = (V2’ ** U2’) * vp7 * (V2 ** U2);l = vec(U2’*B_est*V2);// a estatistica de teste L(b)L[posto] = l’*Q_inv*l;// vetor IC(b, C_N)HQIC[posto] = L[posto] + posto*const_c*(log(log(ta)));
} // Fim do loop para testar H0
// se b = p entao L(b) = 0HQIC[p] = p*const_c*(log(log(ta)));
posto_estimado = (vecindex(HQIC, min(HQIC))); // o minimo do vetor HQIC
adFunc[0] = posto_estimado;
} // Fim da funcao para o criterio de informacao HQIC
152
A5.3. Programas de ligacao
• Modelo 1
/******************************************************************* PROGRAMA: funcoes1.h* AUTORA: Tatiane Ferreira do Nascimento Melo* DATA: 27 de fevereiro de 2004* ULTIMA MODIFICACAO: 30 de agosto de 2004 Hora: 19:00******************************************************************/
// Funcao log-verossimilhanca no modelo 1 de regressao Dirichletfloglik1(const vP, const adFunc, const avScore, const amHess);
// Funcao para preencher a matriz inversa de informacao de Fisher no modelo 1finfFishermodelo1(const vp5, const adFunc);
// Funcao para o teste sequencialftestemodelo1(const vp4, const adFunc);
// Funcao para o criterio de informacao BICftesteBIC1(const vp6, const adFunc);
// Funcao para o criterio de informacao HQICftesteHQIC1(const vp7, const adFunc);
• Modelo 2
/******************************************************************* PROGRAMA: funcoes2.h* AUTORA: Tatiane Ferreira do Nascimento Melo* DATA: 27 de fevereiro de 2004* ULTIMA MODIFICACAO: 30 de agosto de 2004 Hora: 19:00******************************************************************/
// Funcao log-verossimilhanca no modelo 2 de regressao Dirichletfloglik2(const vP, const adFunc, const avScore, const amHess);
// Funcao para preencher a matriz de informacao de Fisher no modelo 2finfFishermodelo2(const phi, const adFunc);
// Funcao para o teste sequencialftestemodelo2(const vp4, const adFunc);
// Funcao para o criterio de informacao BICftesteBIC2(const vp5, const adFunc);
// Funcao para o o criterio de informacao HQICftesteHQIC2(const vp7, const adFunc);
153
Referencias
[1] Aitchison, J. (2003). The Statistical Analysis of Compositional Data. New Jersey: TheBlackburn Press.
[2] Akaike, H. (1974). A new look at the statistical model identification. IEEE Transactionsin Automatic Control, AC-19, 716–723.
[3] Anderson, T. W. & Kunitomo N. (1994). Asymptotic robustness of tests of overidenti-fication and predeterminess. Journal of Econometrics, 62, 383–414.
[4] Bury, K. (1999). Statistical Distributions in Engineering. New York: Cambridge Uni-versity Press.
[5] Cordeiro G. M. (1992). Introducao a Teoria de Verossimilhanca. Livro Texto do10 o Simposio Nacional de Probabilidade e Estatıstica, Universidade Federal do Rio deJaneiro, Rio de Janeiro.
[6] Cordeiro G. M. (1999). Introducao a Teoria Assintotica. Livro Texto do 22 o ColoquioBrasileiro de Matematica, IMPA, Rio de Janeiro.
[7] Cragg J. G. & Donald S. G. (1996). On the asymptotic properties of LDU based testsfor the rank of a matrix. Journal of the American Statistical Association, 91, 1301–1309.
[8] Cragg J. G. & Donald S. G. (1997). Inferring the rank of matrix. Journal of Econome-trics, 76, 223–250.
[9] Cribari–Neto, F. & Zarkos, S. G. (1999). R: yet another econometric programmingenvironment. Journal of Applied Econometrics, 14, 319–329.
[10] Cribari–Neto, F. & Zarkos, S. G. (2003). Econometric and statistical computing usingOx. Computational Economics, 21, 277–295.
[11] Doornik, J. A. (2001). Ox: an Object-oriented Matrix Programming Language, 4thed. London: Timberlake Consultants & Oxford: http://www.nuff.ox.ac.uk/Users/Doornik.
[12] Ferrari, S.L.P. & Cribari-Neto, F. (2004). Beta regression for modelling rates and pro-portions. Journal of Applied Statistics, 31(7), 799–815.
[13] Gill L. & Lewbel A. (1992). Testing the rank and definiteness of estimated matriceswith applications to factor, state space and ARMA models. Journal of the AmericanStatistical Association, 87, 766–776.
[14] Golub, G. H. & Loan, C. F. V. (1996). Matrix Computations. 3a ed. Johns HopkinsUniversity Press. Baltimore.
[15] Good, I. J. (1965). Estimation of probabilities. Cambridge. Mass: The M. I. T. Press.
154
[16] Hannan, E. J. & Quinn, B. G. (1979). The determination of the order of an autoregressi-on. Journal of Royal Statistical Society Series B, 41, 190–195.
[17] Hsiao C. (1986). Identification . Handbook of Econometrics, Volume 1, eds Z. Grilichesand M.D Intrilligator. Amsterdam: North-Holland.
[18] Janardan, K. G. & Padmanabhan, G. (1986). Double bounded beta distribution forhydrologic variables. Proc. 17th Annual Pittsburgh Conference (parte 3), 17, 1107–1111.
[19] Kato T. (1982). A Short Introduction to Perturbation Theory for Linear Operators.Springer Verlag, New York.
[20] Lewbel A. (1991). The rank of demand systems: theory and nonparametric estimation.Econometrica, 59, 711–730.
[21] Lewbel A. & Perraudin (1995). A Theorem on portfolio separation with general prefe-rences. Journal of Economic Theory, 65, 624–626.
[22] Mauldon, J. G. (1951). Random division of an interval. Proceedings of the CambridgePhilosophical Society, 47, 331–336.
[23] Rao C. R. (1973). Linear Statistical Inference and Its Applications. 2a ed. New York:John Wiley and Sons.
[24] Ratsimalahelo Z. (2003). Strongly consistent determination of the rank of matrix, artigoewp-em/0307007, disponıvel em http://econwpa.wustl.edu/eprints/em/papers/
0307/0307007.abs.
[25] Robin J-M & Smith R. J. (2000). Tests of rank. Econometric Theory, 16, 151–175.
[26] Schwarz G. (1978). Estimating the dimension of a model. The Annals of Statistics, 6,461–464.
[27] Stewart G. W.. (1984). Rank degeneracy. SIAM Journal on Scientific and StatisticalComputing, 5, 403–413.
[28] Stewart G. W. & Sun J. G. (1990). Matrix Pertubation Theory, Boston, Academic Press.
155