analise de variaveis canonicas

Upload: romariocca

Post on 12-Oct-2015

20 views

Category:

Documents


0 download

TRANSCRIPT

  • 5/21/2018 Analise de Variaveis Canonicas

    1/26

    Anlise de Variveis CannicasCarlos Alberto Alves Varella

    Dimensionalidade das variveis cannicasVetores cannicosPorcentagem de variao das cannicas

    Exemplo de aplicao

    ANLISE MULTIVARIADA APLICADA AS CINCIAS AGRRIASPS-GRADUAO EM AGRONOMIA CINCIA DO SOLO: CPGA-CS

  • 5/21/2018 Analise de Variaveis Canonicas

    2/26

    Introduo

    A anlise de variveis cannicas permite a

    reduo da dimensionalidade de dados; semelhante a componentes principais e

    correlaes cannicas.

    especialmente empregada em anlisesdiscriminantes realizadas a partir de amostrascom observaes repetidas.

  • 5/21/2018 Analise de Variaveis Canonicas

    3/26

    Objetivo da anlise

    A anlise procura, com base em um grande

    nmero de caractersticas originaiscorrelacionadas, obter combinaes linearesdessas caractersticas denominadas variveis

    cannicas de tal forma que a correlao entreessas variveis seja nula (KHATTREE & NAIK,2000).

  • 5/21/2018 Analise de Variaveis Canonicas

    4/26

    Vantagem da tcnica

    A utilizao dessa tcnica permite capturar o

    efeito simultneo de caractersticas originais; Pode capturar variaes no percebidas

    quando do uso de caractersticas originais

    isoladamente; A primeira varivel cannica a funo

    discriminante linear de Fisher;

    So funes discriminantes timas, ou seja,maximizam a variao entre tratamentos emrelao variao residual

  • 5/21/2018 Analise de Variaveis Canonicas

    5/26

    A variao cannica

    A variao de tratamentos, nesta anlise,

    expressa por uma matriz denominada H,composta pela soma de quadrados e produtosde tratamentos;

    A variao residual expressa pela matriz E,composta pela soma de quadrados e produtosdo resduo;

    As matrizes He Eso obtidas de uma anlisede varincia multivariada: MANOVA.

  • 5/21/2018 Analise de Variaveis Canonicas

    6/26

    Dimensionalidade das variveis

    A dimensionalidade o nmero de variveis

    cannicas obtidas na anlise; Pode tambm ser entendida como o nmero de

    razes no nulas da Equao1.

    (1)

    EH

    H= matriz de soma de quadrados e produtos detratamentos;

    = autovalores da Equao 1;

    ne= graus de liberdade do resduo;

    =matriz de covarincia.

  • 5/21/2018 Analise de Variaveis Canonicas

    7/26

    Teste de dimensionalidade

    Numa anlise de varincia varinica

    multivariada com k tratamentos, usualmentetestamos a hiptese:

    Esta hiptese equivalente ao teste de queno h diferena entre os vetores de mdias

    de tratamentos, isto :

  • 5/21/2018 Analise de Variaveis Canonicas

    8/26

    A importncia da dimensionalidade

    Se H0 verdadeira, conclumos que os vetores

    so idnticos. Ento H0verdadeira implica emd=0.

    Se H0 rejeitada, de importncia se

    determinar a real dimensionalidade d; Se d=t no h nenhuma restrio sobre os

    vetores de mdias;

    Em qualquer caso tem-se que:

  • 5/21/2018 Analise de Variaveis Canonicas

    9/26

    Nmero de variveis cannicas

    Em uma anlise de varincia multivariada o

    nmero de variveis estudas normalmente maior que nmero de tratamentos;

    A regra significa que: o nmero de variveis

    cannicas ser no mximo igual ao nmero degraus de liberdade de tratamentos (q).

    d= dimenso mxima;

    p= nmero de variveis;

    q= nmero de graus de liberdade de tratamentos;

    k= nmero de tratamentos.

  • 5/21/2018 Analise de Variaveis Canonicas

    10/26

    Porque existe a necessidade do teste

    Quando trabalhamos com dados observados,

    um autovalor pode ser muito pequeno sempropriamente ser nulo;

    Um teste de verificao da dimensionalidade

    torna-se necessrio; A aproximao mais adequada, nesse caso,

    segundo REGAZZI (2000), aquela proposta

    por BARTLETT (1947).

  • 5/21/2018 Analise de Variaveis Canonicas

    11/26

    Teste proposto por BARTLETT (1947)

    O teste feito sequencialmente para d=0, d=1, etc,

    at que um resultado no significativo aparea; Se at d-1 se obtiver resultados significativos, mas em

    d no, infere-se que a dimensionalidade d;

    A estatstica proposta por BARTLETT (1947) obtida

    atravs da Equao 3.

    A estatstca , assintoticamente tem distribuio qui-quadrada 2f com

    (3)

  • 5/21/2018 Analise de Variaveis Canonicas

    12/26

    Vetores cannicos

    Vetores cannicos so os autovetores j associadosaos autovalores jno nulos da matriz determinante;

    L o j-simo vetor cannico obtido na anlise; L normalizado de modo que:

    A projeo de um ponto X (observaes) sobre ohiperplano estimado pode ser representada em

    termos de coordenadas cannicas d-dimensional:

  • 5/21/2018 Analise de Variaveis Canonicas

    13/26

    Mdias cannicas

    As mdias cannicas dos k tratamentos so:

    As mdias cannicas representam a projeodo grupo de mdias sobre o hiperplanoestimado e podem ser usadas para estudar asdiferenas entre grupos (tratamentos).

  • 5/21/2018 Analise de Variaveis Canonicas

    14/26

    Varivel cannica

    A j-sima varivel cannica representada por:

    j-sima varivel cannica; j-simo vetor cannico;

    vetor de caractersticas originais.

    P t d i

  • 5/21/2018 Analise de Variaveis Canonicas

    15/26

    Porcentagem de variao

    A porcentagem de variao entre tratamentos

    explicada pelas primeiras d variveis cannicas o resultado da diviso da soma dosautovalores dpela soma dos autovalores p,isto :

    d= nmero de variveis cannicas; p= nmero de variveis originais.

    P di t CANDISC SAS

  • 5/21/2018 Analise de Variaveis Canonicas

    16/26

    Procedimento CANDISC - SAS O exerccio abaixo exemplifica o uso do procedimento

    CANDISC do SAS para anlise de variveis cannicas.dataexemplo;

    title'Exemplo de Anlise de Variveis Cannicas DIC';input trat rep X1 X2;

    cards;

    1 1 4.63 0.95

    1 2 4.38 0.89

    1 3 4.94 1.01

    1 4 4.96 1.23

    1 5 4.48 0.94

    2 1 6.03 1.08

    2 2 5.96 1.19

    2 3 6.16 1.08

    2 4 6.33 1.19

    2 5 6.08 1.08

    3 1 4.71 0.96

    3 2 4.81 0.93

    3 3 4.49 0.87

    3 4 4.43 0.82

    3 5 4.56 0.91

    ;

    P di t CANDISC SAS

  • 5/21/2018 Analise de Variaveis Canonicas

    17/26

    Procedimento CANDISC - SAS

    proccandiscdata=exemplo out=can all;

    classtrat;varX1 X2;

    run;

    procplot;plotcan2*can1 = trat / vpos=20;

    run;

    P di t G fi

  • 5/21/2018 Analise de Variaveis Canonicas

    18/26

    Procedimento para Grficos

    %let plotitop = gopts = gsfmode = replace

    gaccess = gsasfile device = gif

    hsize = 8.00 vsize = 6.00

    cback = white,

    cframe = ligr,

    color = black,colors = green blue red,

    options = noclip expand, post=myplot.gif;

    %plo ti t(data=can, plo tvars=Can2 Can1,

    labelvar=_blank_, symvar=symbol, typevar=symbol,symsize=1, sym len=4, exttypes=symbo l, ls=100,

    tsize=1.0, extend=c lose);

  • 5/21/2018 Analise de Variaveis Canonicas

    19/26

    Interpretao dos resultados do S S

    Exemplo de Anlise de Variveis Cannicas DIC 16

    21:59 Thursday, March 28, 2007

    The CANDISC Procedure O Procedimento CANDISCObservations 15 DF Total 14 GL total

    Variables 2 DF Within Classes 12 GL de resduo

    Classes (trat) 3 DF Between Classes 2 GL de tratamentos

    Class Level Information Probabilidades a priori

    Variabletrat Name Frequency Weight Proportion

    1 _1 5 5.0000 0.3333332 _2 5 5.0000 0.333333

    3 _3 5 5.0000 0.333333

    M t i E H A

  • 5/21/2018 Analise de Variaveis Canonicas

    20/26

    Matrizes E, H e AExemplo de Anlise de Variveis Cannicas DIC 18

    21:59 Thursday, March 28, 2007

    The CANDISC Procedure

    Pooled Within-Class SSCP Matrix MatrizE Resduo

    Variable X1 X2

    X1 0.4579600000 0.1512000000

    X2 0.1512000000 0.0975200000

    Between-Class SSCP Matrix Matriz HTrat

    Variable X1 X2

    X1 7.247640000 0.870100000

    X2 0.870100000 0.127853333

    Total-Sample SSCP Matrix MatrizATotal

    Variable X1 X2

    X1 7.705600000 1.021300000

    X2 1.021300000 0.225373333

    M t i d i i

  • 5/21/2018 Analise de Variaveis Canonicas

    21/26

    Matrizes de covarinciasExemplo de Anlise de Variveis Cannicas DIC 19

    21:59 Thursday, March 28, 2007

    The CANDISC Procedure

    Within-Class Covariance Matrices Matrizes Covdentro de trat

    trat = 1, DF = 4

    Variable X1 X2

    X1 0.0696200000 0.0286350000

    X2 0.0286350000 0.0177800000--------------------------------------------------------------------

    trat = 2, DF = 4

    Variable X1 X2

    X1 0.0201700000 0.0018150000

    X2 0.0018150000 0.0036300000

    --------------------------------------------------------------------

    trat = 3, DF = 4

    Variable X1 X2

    X1 0.0247000000 0.0073500000

    X2 0.0073500000 0.0029700000

    C fi i t d l

  • 5/21/2018 Analise de Variaveis Canonicas

    22/26

    Coeficiente de correlaoExemplo de Anlise de Variveis Cannicas DIC 21

    21:59 Thursday, March 28, 2007

    The CANDISC Procedure

    Within-Class Correlation Coefficients / Pr > |r|trat = 1

    Variable X1 X2

    X1 1.00000 0.81389 Correlao

    0.0936 Significncia

    X2 0.81389 1.00000

    0.0936

    trat = 2

    Variable X1 X2

    X1 1.00000 0.21211Correlao

    0.7320Significncia

    X2 0.21211 1.00000

    0.7320

    trat = 3Variable X1 X2

    X1 1.00000 0.85814Correlao

    0.0628Significncia

    X2 0.85814 1.00000

    0.0628

    R lt d d MANOVA

  • 5/21/2018 Analise de Variaveis Canonicas

    23/26

    Resultado da MANOVAMultivariate Statistics and F Approximations MANOVA

    S=2 M=-0.5 N=4.5

    Statistic Value F Value Num DF Den DF Pr > F

    Wilks' Lambda 0.03142928 25.52 4 22

  • 5/21/2018 Analise de Variaveis Canonicas

    24/26

    Proporo acumulada de varinciaLikelihood Approximate

    Eigenvalue Difference Proportion Cumulative Ratio F Value Num DF Den DF Pr > F

    1 22.6963 22.3536 0.9851 0.0314 25.52 4 22

  • 5/21/2018 Analise de Variaveis Canonicas

    25/26

    Vetores cannicos

    Raw Canonical Coefficients Vetores cannicos

    Variable Can1 Can2

    X1 7.16645900 -1.52496137

    X2 -8.80246974 13.21432007

    Mdias cannicas

  • 5/21/2018 Analise de Variaveis Canonicas

    26/26

    Mdias cannicas

    Class Means on Canonical Variables Mdias cannicas

    trat Can1 Can2

    1 -3.198161274 0.627615714

    2 6.022244556 0.026539512

    3 -2.824083283 -0.654155226