val osz nus} egsz am t as es matematikai statisztika · 2018. 12. 10. · (sz amuk fugg az eloszl...

70
Val´ osz´ ın˝ us´ egsz´ am´ ıt´ as ´ es matematikai statisztika Baran ´ Agnes Gyakorlat MATLAB Baran ´ Agnes Gyakorlat 1 / 70

Upload: others

Post on 30-Jan-2021

1 views

Category:

Documents


0 download

TRANSCRIPT

  • Valósźınűségszáḿıtás és matematikai statisztika

    Baran Ágnes

    GyakorlatMATLAB

    Baran Ágnes Gyakorlat 1 / 70

  • Véletlenszám generátorok

    randi(N,n,m) n ×m pszeudorandom egész szám az [1,N]-en adottdiszkrét egyenletes eloszlásból

    rand(n,m) n ×m véletlen szám a [0, 1]-en adott egyenleteseloszlásból

    randn(n,m) n ×m véletlen szám a standard normális eloszlásból

    [a, b] intervallumon egyenletes eloszlású véletlen számok generálása:(b-a)*rand(n,m)+a

    µ várható értékű, σ szórású normális eloszlású véletlen számok:µ+randn(n,m)*σ

    Véletlen számok a random függvénnyel:random(’name’,A,B,C,D,n,m) ahol name az eloszlás neve, A,B,C,D azeloszlás paraméterei (számuk függ az eloszlástól, ld. a random függvényhelp-jét.), n ×m az output mérete

    Baran Ágnes Gyakorlat 2 / 70

  • Nevezetes eloszlások eloszlásfüggvényeA cdf (cummulative distribution function) beéṕıtett függvénnyel:y = cdf(’name’,x,A,B,C,D) ahol name az eloszlás neve, x ahol azeloszlásfüggvény értékét tudni szeretnénk, A,B,C,D az eloszlás paraméterei(számuk függ az eloszlástól, ld. a cdf függvény help-jét.)

    Példa

    Rajzoltassa ki a standard normális eloszlás eloszlásfüggvényét a [−3, 3]intervallumon.

    Normális eloszlás esetén a két paraméter a várható érték és a szórás (most0 és 1)

    >> x=linspace(-3,3);

    >> y=cdf('normal',x,0,1);

    >> figure; plot(x,y,'LineWidth',2);

    >> ax=gca;

    >> ax.XAxisLocation='origin';

    >> ax.YAxisLocation='origin';

    Baran Ágnes Gyakorlat 3 / 70

  • x=linspace(-3,3);

    y=cdf('normal',x,0,1);

    figure; plot(x,y,'LineWidth',2);

    ax=gca;

    ax.XAxisLocation='origin';

    ax.YAxisLocation='origin';

    -3 -2 -1 0 1 2 3

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    0.8

    0.9

    Baran Ágnes Gyakorlat 4 / 70

  • Feladat

    Rajzoltassa ki a [−3, 3] intervallumon a0 várható értékű, 1 szórású,

    1 várható értékű, 1 szórású,

    0 várható értékű, 2 szórású,

    1 várható értékű, 2 szórású

    normális eloszlás eloszlásfüggvényét.

    -4 -2 0 2 4

    0.5

    =0, =1

    -4 -2 0 2 4

    0.5

    =1, =1

    -4 -2 0 2 4

    0.5

    =0, =2

    -4 -2 0 2 4

    0.5

    =1, =2

    Baran Ágnes Gyakorlat 5 / 70

  • Példa

    Rajzoltassa ki a 0.8 várható értékű exponenciális eloszláseloszlásfüggvényét a [−3, 3] intervallumon.

    Exponenciális eloszlás esetén egy paraméter van, a Matlab-ban ez avárható érték (ez most 0.8).

    >> x=linspace(-3,3);

    >> y=cdf('Exponential',x,0.8);

    >> figure; plot(x,y,'LineWidth',2);

    >> ax=gca;

    >> ax.XAxisLocation='origin';

    >> ax.YAxisLocation='origin';

    Baran Ágnes Gyakorlat 6 / 70

  • x=linspace(-3,3);

    y=cdf('Exponential',x,0.8);

    figure; plot(x,y,'LineWidth',2);

    ax=gca;

    ax.XAxisLocation='origin';

    ax.YAxisLocation='origin';

    -1 0 1 2 3 4 5

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    0.8

    0.9

    Baran Ágnes Gyakorlat 7 / 70

  • Példa

    Rajzoltassa ki a 0.8, az 1 és az 1.2 várható értékű exponenciális eloszláseloszlásfüggvényét a [−1, 5] intervallumon.

    x=linspace(-1,5);

    y1=cdf('Exponential',x,1);

    y2=cdf('Exponential',x,0.8);

    y3=cdf('Exponential',x,1.2);

    figure; plot(x,y1,x,y2,x,y3,'LineWidth',2);

    legend('\mu=1','\mu=0.8','\mu=1.2');

    title('exponencilis eloszlas, eloszlasfuggveny')

    Baran Ágnes Gyakorlat 8 / 70

  • x=linspace(-1,5);

    y1=cdf('Exponential',x,1);

    y2=cdf('Exponential',x,0.8);

    y3=cdf('Exponential',x,1.2);

    figure; plot(x,y1,x,y2,x,y3,'LineWidth',2);

    legend('\mu=1','\mu=0.8','\mu=1.2');

    title('exponencilis eloszlas, eloszlasfuggveny')

    -1 0 1 2 3 4 5

    0

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    0.8

    0.9

    1exponenciális eloszlás, eloszlásfüggvény

    =1

    =0.8

    =1.2

    Baran Ágnes Gyakorlat 9 / 70

  • Eloszlásfüggvények

    Példa

    Rajzoltassa ki az

    F (x) =

    {0 ha x ≤ 01− 1−e−xx egyébként

    eloszlásfüggvényt a [−1, 6] intervallumon.

    x=linspace(-1,6);

    y=(1-(1-exp(-x))./x).*(x>0);

    figure; plot(x,y,'LineWidth',2);

    Baran Ágnes Gyakorlat 10 / 70

  • x=linspace(-1,6);

    y=(1-(1-exp(-x))./x).*(x>0);

    figure; plot(x,y,'LineWidth',2);

    -1 0 1 2 3 4 5 6

    0

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    0.8

    0.9

    Baran Ágnes Gyakorlat 11 / 70

  • Nevezetes eloszlások sűrűségfüggvénye

    A pdf (probability density function) beéṕıtett függvénnyel:y = pdf(’name’,x,A,B,C,D) ahol name az eloszlás neve, x ahol asűrűségfüggvény értékét tudni szeretnénk, A,B,C,D az eloszlás paraméterei(számuk függ az eloszlástól, ld. a pdf függvény help-jét.)

    Példa

    Rajzoltassa ki a standard normális eloszlás sűrűségfüggvényét a [−3, 3]intervallumon.

    Normális eloszlás esetén a két paraméter a várható érték és a szórás (most0 és 1)

    >> x=linspace(-3,3);

    >> y=pdf('normal',x,0,1);

    >> figure; plot(x,y,'LineWidth',2);

    Baran Ágnes Gyakorlat 12 / 70

  • x=linspace(-3,3);

    y=pdf('normal',x,0,1);

    figure; plot(x,y,'LineWidth',2);

    -3 -2 -1 0 1 2 3

    0

    0.05

    0.1

    0.15

    0.2

    0.25

    0.3

    0.35

    0.4

    0.45

    0.5

    Baran Ágnes Gyakorlat 13 / 70

  • Feladat

    Ábrázolja a

    0 várható értékű, 1 szórású,

    1 várható értékű, 1 szórású,

    0 várható értékű, 2 szórású,

    1 várható értékű, 2 szórású

    normális eloszlás sűrűségfüggvényét.

    -5 -4 -3 -2 -1 0 1 2 3 4 5

    0.05

    0.1

    0.15

    0.2

    0.25

    0.3

    0.35

    0.4

    0.45=0, =1

    =1, =1

    =0, =2

    =1, =2

    Baran Ágnes Gyakorlat 14 / 70

  • A nevezetes eloszlások eloszlás- és sűrűségfüggvényét kirajzoltathatjuk adisttool alkalmazással is. Adjuk ki a disttool parancsot és amegjelenő ablakban álĺıtsuk be mit szeretnénk ábrázolni.

    >>disttool

    -8 -6 -4 -2 0 2 4 6 80

    0.2

    0.4

    0.6

    0.8

    1

    0

    2

    -2

    Mu

    Lower bound

    Upper bound

    1

    2

    0.5

    Sigma

    Lower bound

    Upper bound

    Lower boundLower bound

    Upper boundUpper bound

    Probability

    Distribution: Normal Function type: CDF

    X: 0

    0.5

    Baran Ágnes Gyakorlat 15 / 70

  • Példa

    Legyen ξ egy 400 várható értékű, 3 szórású normális eloszlású valósźınűségiváltozó. Mennyi a valósźınűsége, hogy ξ a [398,401] intervallumba esik?

    Paṕıron számolva ξ-t előbb normalizáltuk, majd a standard normáliseloszlás táblázatait használva meghatároztuk a kérdéses valósźınűséget.A Matlab-ot használva nincs szükség a standardizálásra.

    1. megoldás: eloszlásfüggvénnyel (p = Fξ(401)− Fξ(398))>> p=cdf('normal',401,400,3)-cdf('normal',398,400,3)

    0.3781

    2. megoldás: sűrűségfüggvénnyel (p =401∫398

    fξ(x)dx)

    >> f=@(x) pdf('normal',x,400,3);

    >> p=integral(f,398,401)

    0.3781Baran Ágnes Gyakorlat 16 / 70

  • Példa

    Legyen ξ ∼ N (0, 1). Adja meg a értékét úgy, hogy P(ξ ∈ [1, a]) = 0.14teljesüljön.

    Tudjuk, hogy P(ξ ∈ [1, a]) = F (a)− F (1), ı́gy F (a) = 0.14 + F (1).

    >> t=0.14+cdf('normal',1,0,1);

    >> a=norminv(t)

    a =

    2.0824

    norminv(p): a standard normális eloszlás eloszlásfüggvényénekinverze a p helyen

    norminv(p,µ,σ): a µ várható értékű, σ szórású normális eloszláseloszlásfüggvényének inverze a p helyen

    Baran Ágnes Gyakorlat 17 / 70

  • Kétdimenziós eloszlások

    Példa

    Ábrázoljuk az

    F (x , y) =

    {1 + e−x−y − e−x − e−y , ha x > 0, y > 0,0 egyébként

    eloszlásfüggvényt a [−2, 5]× [−2, 5] tartományon.

    x=linspace(-2,5); y=x;

    [X,Y]=meshgrid(x,y);

    Z=(1+exp(-X-Y)-exp(-X)-exp(-Y)).*(X>0).*(Y>0);

    figure; mesh(X,Y,Z)

    xlabel('x')

    ylabel('y')

    Baran Ágnes Gyakorlat 18 / 70

  • x=linspace(-2,5); y=x;

    [X,Y]=meshgrid(x,y);

    Z=(1+exp(-X-Y)-exp(-X)-exp(-Y)).*(X>0).*(Y>0);

    figure; mesh(X,Y,Z)

    xlabel('x')

    ylabel('y')

    0

    6

    0.2

    0.4

    4

    0.6

    0.8

    y

    2

    1

    640

    x

    20-2 -2

    Baran Ágnes Gyakorlat 19 / 70

  • Kétdimenziós eloszlások

    Példa

    Mennyi a valósźınűsége, hogy az előző eloszlásfüggvénnyel adott (ξ, η)valósźınűségi változó értéke az [1, 3]× [2, 4] tartományba esik?

    Tudjuk, hogy

    P((ξ, η) ∈ [a1, b1]× [a2, b2]) = F (b1, b2)−F (a1, b2)−F (b1, a2)+F (a1, a2)

    Ezek alapján a keresett valósźınűség:

    F=@(x,y) 1+exp(-x-y)-exp(-x)-exp(-y);

    p=F(3,4)-F(1,4)-F(3,2)+F(1,2)

    Baran Ágnes Gyakorlat 20 / 70

  • Kétdimenziós eloszlások

    Példa

    Ábrázoljuk a kétdimenziós standard normális eloszlás sűrűségfüggvényét a[−3, 3]× [−3, 3] tartományon!

    Tudjuk, hogy

    f (x , y) =1

    2πe−

    x2+y2

    2 , (x , y) ∈ R2.

    x=linspace(-3,3); y=x;

    [X,Y]=meshgrid(x,y);

    Z=exp(-(X.^2+Y.^2)/2)/2/pi;

    figure; mesh(X,Y,Z)

    xlabel('x')

    ylabel('y')

    Baran Ágnes Gyakorlat 21 / 70

  • x=linspace(-3,3); y=x;

    [X,Y]=meshgrid(x,y);

    Z=exp(-(X.^2+Y.^2)/2)/2/pi;

    figure; mesh(X,Y,Z)

    xlabel('x')

    ylabel('y')

    0

    4

    0.05

    2 4

    0.1

    2

    0.15

    y

    0

    x

    0.2

    0-2

    -2-4 -4

    Baran Ágnes Gyakorlat 22 / 70

  • Példa

    Legyen (ξ, η) egy kétdimenziós standard normális eloszlású valósźınűségiváltozó. Mennyi a valósźınűsége, hogy (ξ, η) értéke a [−1, 1]× [1.5, 2]tartományba esik?

    Tudjuk, hogy

    P((ξ, η) ∈ [a1, b1]× [a2, b2]) =b1∫

    a1

    b2∫a2

    f (x , y)dydx ,

    ezért

    f=@(x,y) exp(-(x.^2+y.^2)/2)/2/pi;

    p=integral2(f,-1,1,1.5,2)

    Baran Ágnes Gyakorlat 23 / 70

  • Nagy számok törvénye

    Példa

    Szimuláljuk egy szabályos dobókocka 10000 egymás utáni feldobását.Vizsgáljuk meg hogyan alakul az 5-ös dobások relat́ıv gyakorisága aḱısérlet során!

    Használjuk a randi függvényt!

    randi(N,n,m) : előálĺıt n ×m pszeudorandom egész számot az [1,N]-enadott diszkrét egyenletes eloszlásból.

    n=10000;

    x=randi(6,1,n);

    rel=zeros(1,n);

    for i=1:n

    rel(i)=sum(x(1:i)==5)/i;

    end

    figure;plot(1:n,rel,[0,n],[1/6,1/6])

    Baran Ágnes Gyakorlat 24 / 70

  • 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

    0

    0.05

    0.1

    0.15

    0.2

    0.25

    0.3

    0.35

    0.4

    0.45

    0.5

    Baran Ágnes Gyakorlat 25 / 70

  • Példa

    Egy szabályos dobókockával dobva jelölje A azt az eseményt, hogy adobott szám 4-nél nagyobb. Szimuláljuk a ḱısérlet 10000 egymás utánivégrehajtását és figyeljük hogy alakul A relat́ıv gyakorisága!

    N=10000;

    x=randi(6,1,N);

    rel=zeros(1,N);

    for n=1:N

    rel(n)=sum(x(1:n)>4)/n;

    end

    figure; plot(1:N,rel,[0 N],[1/3,1/3])

    xlabel('n')

    ylabel('k_A/n')

    Baran Ágnes Gyakorlat 26 / 70

  • 0 2000 4000 6000 8000 10000

    n

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    0.8

    0.9

    1

    kA

    /n

    Baran Ágnes Gyakorlat 27 / 70

  • Példa

    Szimuláljuk az alábbi ḱısérletet: 10000-szer egymás után, egymástólfüggetlenül véletlenszerűen (egyenletes eloszlás szerint) választunk egypontot az [1, 3] intervallumból. Jelölje ξi az i-edik esetben választottszámot. Ábrázoljuk az

    Snn

    :=ξ1 + · · ·+ ξn

    n

    értékeket n függvényében (n = 1, . . . , 10000).

    N=10000;

    x=random('uniform',1,3,1,N); s=zeros(1,N);

    for n=1:N

    s(n)=sum(x(1:n))/n;

    end

    figure; plot(1:N,s,[0,N],[2,2])

    xlabel('n')

    ylabel('S_n/n')

    Baran Ágnes Gyakorlat 28 / 70

  • 0 2000 4000 6000 8000 10000

    n

    1.75

    1.8

    1.85

    1.9

    1.95

    2

    2.05

    2.1

    2.15

    2.2

    2.25

    Sn/n

    Baran Ágnes Gyakorlat 29 / 70

  • Hisztogramok

    Példa

    Generáljunk egy 1000 elemű standard normális eloszlású, és egy 1000elemű 2 várható értékű, 0.8 szórású normális eloszlású mintát. Késźıtsünka mintákhoz gyakoriság hisztogramot!

    Használjuk a Matlab histogram függvényét!

    x=randn(1,1000);

    figure; histogram(x)

    x=2+randn(1,1000)*0.8;

    figure; histogram(x)

    Baran Ágnes Gyakorlat 30 / 70

  • Standard normális eloszlású minta

    -4 -3 -2 -1 0 1 2 3 4

    0

    20

    40

    60

    80

    100

    120

    140

    Baran Ágnes Gyakorlat 31 / 70

  • 2 várható értékű, 0.8 szórású normális eloszlású minta

    -1 0 1 2 3 4 5 6

    0

    50

    100

    150

    Baran Ágnes Gyakorlat 32 / 70

  • Példa

    Generáljunk egy 1000 elemű 2 várható értékű exponenciális eloszlásúmintát. Késźıtsünk a mintákhoz gyakoriság hisztogramot!

    0 2 4 6 8 10 12 14 16

    0

    20

    40

    60

    80

    100

    120

    140

    160

    180

    200

    Baran Ágnes Gyakorlat 33 / 70

  • Hisztogramok

    Példa

    Generáljunk egy N (N = 100, 1000, 10000, 100000) elemű [0, 1]-enegyenletes eloszlású mintát, és készitsünk gyakoriság hisztogramot (10részintervallumot használjunk).

    x=rand(1,100);

    subplot(2,2,1)

    histogram(x,10); title('N=100')

    x=rand(1,1000);

    subplot(2,2,2)

    histogram(x,10); title('N=1000')

    x=rand(1,10000);

    subplot(2,2,3)

    histogram(x,10); title('N=10000')

    x=rand(1,100000);

    subplot(2,2,4)

    histogram(x,10); title('N=10000')Baran Ágnes Gyakorlat 34 / 70

  • 0 0.2 0.4 0.6 0.8 1

    0

    5

    10

    15N=100

    0 0.2 0.4 0.6 0.8 1

    0

    20

    40

    60

    80

    100

    120N=1000

    0 0.2 0.4 0.6 0.8 1

    0

    200

    400

    600

    800

    1000

    1200N=10000

    0 0.2 0.4 0.6 0.8 1

    0

    2000

    4000

    6000

    8000

    10000

    12000N=10000

    Baran Ágnes Gyakorlat 35 / 70

  • Empirikus eloszlásfüggvény

    Példa

    Generáljunk egy 30 elemű standard normális eloszlású mintát, rajzoltassukki a minta empirikus eloszlásfüggvényét, illetve a standard normáliseloszlás eloszlásfüggvényét.

    Használjuk a Matlab ecdf (empirical cumulative distribution function)függvényét!

    x=random('normal',0,1,1,30);

    figure; ecdf(x)

    xx=linspace(-3,3);

    yy=cdf('normal',xx,0,1);

    hold on; plot(xx,yy)

    Baran Ágnes Gyakorlat 36 / 70

  • x=random('normal',0,1,1,30);

    figure; ecdf(x)

    xx=linspace(-3,3);

    yy=cdf('normal',xx,0,1);

    hold on; plot(xx,yy)

    -3 -2 -1 0 1 2 3

    x

    0

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    0.8

    0.9

    1

    F(x

    )

    Baran Ágnes Gyakorlat 37 / 70

  • Ismételjük meg az előző feladatot egy 100 elemű mintával!

    -3 -2 -1 0 1 2 3

    x

    0

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    0.8

    0.9

    1

    F(x

    )

    Baran Ágnes Gyakorlat 38 / 70

  • Empirikus eloszlásfüggvény

    Példa

    Generáljunk egy 30 elemű [0, 1]-en egyenletes eloszlású mintát,rajzoltassuk ki a minta empirikus eloszlásfüggvényét, illetve az elméletieloszlásfüggvényt.

    x=rand(1,30);

    figure; ecdf(x)

    xx=linspace(-0.1,1.1);

    yy=cdf('uniform',xx,0,1);

    hold on; plot(xx,yy)

    Baran Ágnes Gyakorlat 39 / 70

  • -0.2 0 0.2 0.4 0.6 0.8 1 1.2

    x

    0

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    0.8

    0.9

    1

    F(x

    )

    Baran Ágnes Gyakorlat 40 / 70

  • Ismételjük meg az előző feladatot egy 100 elemű mintával!

    -0.2 0 0.2 0.4 0.6 0.8 1 1.2

    x

    0

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    0.8

    0.9

    1

    F(x

    )

    Baran Ágnes Gyakorlat 41 / 70

  • Empirikus eloszlásfüggvény

    Példa

    Generáljunk egy 30 elemű mintát a 2 várható értékű exponenciáliseloszlásból, rajzoltassuk ki a minta empirikus eloszlásfüggvényét, illetve azelméleti eloszlásfüggvényt.

    x=random('exponential',2,1,30);

    figure; ecdf(x)

    xx=linspace(0,8);

    yy=cdf('exponential',xx,2);

    hold on; plot(xx,yy)

    Baran Ágnes Gyakorlat 42 / 70

  • 0 1 2 3 4 5 6 7 8

    x

    0

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    0.8

    0.9

    1

    F(x

    )

    Baran Ágnes Gyakorlat 43 / 70

  • Ismételjük meg az előző feladatot egy 100 elemű mintával!

    0 5 10 15

    x

    0

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7

    0.8

    0.9

    1

    F(x

    )

    Baran Ágnes Gyakorlat 44 / 70

  • Kétoldali u-próba

    Példa

    Egy üzemben csöveket gyártanak, melyek hossza normális eloszlású 2 mmszórással. Véletlenszerűen kiválasztva 8 elkészült csövet és megmérvehosszukat az alábbi értékeket kaptuk:

    199, 197, 196, 198, 199, 200, 202, 201.

    95%-os döntési szintet használva vizsgálja meg azt az álĺıtást, hogy azüzemben gyártott csövek hossza átlagosan 200 mm.

    A nullhipotézis:H0 : µ = 200,

    az ellenhipotézis:H1 : µ 6= 200.

    n = 8, σ = 2, α = 0.05, X = 199.

    Baran Ágnes Gyakorlat 45 / 70

  • A próbastatisztika:

    u =X − 200

    σ

    √n =

    199− 2002

    √8 = −1.4142

    A kritikus tartomány (amikor elvetjük H0-at):

    |u| ≥ Φ−1(

    1− α2

    )= Φ−1(0.975) = 1.96

    Mivel|u| = 1.4142 < 1.96

    ı́gy H0-at elfogadjuk.

    Baran Ágnes Gyakorlat 46 / 70

  • Kétoldali u-próba

    -3 -Φ-1(1- α /2) 0 Φ-1(1- α /2) 30

    0.05

    0.1

    0.15

    0.2

    0.25

    0.3

    0.35

    0.4

    0.45

    0.5

    A kritikus és az elfogadási tartomány

    Baran Ágnes Gyakorlat 47 / 70

  • A Matlab ztest függvényével:h=ztest(minta,µ0,σ)Ha h=0 akkor elfogadjuk, ha h=1 elvetjük H0-at 95%-os szinten.

    X=[199, 197, 196, 198, 199, 200, 202, 201];

    h=ztest(X,200,2)

    h =

    0

    Így elfogadjuk H0-at.Kiszáḿıthatjuk a p-értéket és a várható értékre vonatkozó konfidenciaintervallumot is:

    [h,p,Kint]=ztest(X,200,2)

    h =

    0

    p =

    0.1573

    Kint =

    197.6141 200.3859

    Baran Ágnes Gyakorlat 48 / 70

  • Egyoldali u-próba

    Példa

    Egy tejipari vállalkozás 500 g-os kiszerelésben gyárt gyümölcsjoghurtokat,melyek átlagos gyümölcstartalma a dobozon található felirat szerint 10%.Több fogyasztói panasz érkezett, hogy a termék a megjelöltnél kevesebbgyümölcsöt tartalmaz, ı́gy a cég önellenőrzést tartott. Megvizsgálták 10véletlenszerűen kiválasztott termék gyümölcstartalmát, grammbankifejezve az alábbi értékeket kapták:

    51, 45, 45, 51, 54, 50, 42, 53, 53, 50.

    Feltételezve, hogy a joghurtok grammban kifejezett gyümölcstartalmanormális eloszlású 3 g szórással döntsön 98%-os szinten, hogy igaza van-ea vásárlóknak.

    Baran Ágnes Gyakorlat 49 / 70

  • A nullhipotézis:H0 : µ = 50,

    az ellenhipotézis:H1 : µ < 50.

    n = 10, σ = 3, α = 0.02, X = 49.4. A próbastatisztika:

    u =X − 50σ

    √n =

    49.4− 503

    √10 = −0.6325

    A kritikus tartomány (amikor elvetjük H0-at):

    u ≤ Φ−1 (α) = Φ−1(0.02) = −2.0537

    Mivel a kapott u érték ebbe nem esik bele, ezért elfogadjuk H0-at.

    Baran Ágnes Gyakorlat 50 / 70

  • Egyoldali u-próba, baloldali ellenhipotézis

    -3 Φ-1(α ) 0 30

    0.05

    0.1

    0.15

    0.2

    0.25

    0.3

    0.35

    0.4

    0.45

    0.5

    A kritikus és az elfogadási tartomány

    Megj.: Φ−1 (α) = −Φ−1 (1− α)

    Baran Ágnes Gyakorlat 51 / 70

  • A Matlab ztest függvényével:

    A baloldali ellenhipotézis és a 98%-os szint beálĺıtása:h=ztest(X,µ0,σ,’alpha’,0.02,’tail’,’left’)

    Esetünkben:

    X=[51, 45, 45, 51, 54, 50, 42, 53, 53, 50];

    h=ztest(X,50,3,'alpha',0.02,'tail','left')

    h =

    0

    Mivel h=0 a nullhipotézist elfogadjuk.

    Baran Ágnes Gyakorlat 52 / 70

  • Egyoldali u-próba

    Példa

    Felmérések szerint az emberek átlagos IQ értéke 100. A sajtkésźıtőkszövetsége azt álĺıtja, hogy a sajtkésźıtéssel foglalkozó emberek esetén ezaz érték magasabb. 10 véletlenszerűen választott sajtkésźıtő IQ értékére azalábbiakat kaptuk:

    104, 97, 104, 98, 103, 112, 99, 95, 102, 106.

    Feltételezve, hogy az IQ érték normális eloszlású 3 szórással, döntsön98%-os szinten a szövetség álĺıtásáról.

    A nullhipotézis:H0 : µ = 100,

    az ellenhipotézis:H1 : µ > 100.

    n = 10, σ = 3, α = 0.02, X = 102.

    Baran Ágnes Gyakorlat 53 / 70

  • A próbastatisztika:

    u =X − 100

    σ

    √n =

    102− 1003

    √10 = 2.1082

    A kritikus tartomány (amikor elvetjük H0-at):

    u > Φ−1 (1− α) = Φ−1(0.98) = 2.0537

    Mivel a kapott u érték ebbe beleesik, ezért elvetjük H0-at (és boldogok asajtkésźıtők).

    Baran Ágnes Gyakorlat 54 / 70

  • Egyoldali u-próba (jobboldali ellenhipotézis)

    -3 0 Φ-1(1- α ) 30

    0.05

    0.1

    0.15

    0.2

    0.25

    0.3

    0.35

    0.4

    0.45

    0.5

    Az elfogadási és a kritikus tartomány

    Baran Ágnes Gyakorlat 55 / 70

  • A Matlab ztest függvényével:

    X=[104, 97, 104, 98, 103, 112, 99, 95, 102, 106];

    h=ztest(X,100,3,'alpha',0.02,'tail','right')

    h =

    1

    Mivel h=1 a nullhipotézist elvetjük.Száḿıttassuk ki a p-értéket is!

    [h,p]=ztest(X,100,3,'alpha',0.02,'tail','right')

    h =

    1

    p =

    0.0175

    A p-értékből látjuk, hogy 99%-os szinten már elfogadtuk volna anullhipotézist.

    Baran Ágnes Gyakorlat 56 / 70

  • t-eloszlás

    Példa

    Rajzoltassuk ki közös ábrán a standard normális eloszlás és az 5 és 10szabadsági fokú t-eloszlás sűrűségfüggvényét!

    x=linspace(-5,5);

    yn=pdf('normal',x,0,1);

    y1=pdf('T',x,5);

    y2=pdf('T',x,10);

    figure; plot(x,yn,x,y1,x,y2)

    legend('standard normalis','t_5','t_{10}')

    Baran Ágnes Gyakorlat 57 / 70

  • t-eloszlás

    -5 -4 -3 -2 -1 0 1 2 3 4 5

    0

    0.05

    0.1

    0.15

    0.2

    0.25

    0.3

    0.35

    0.4

    standard normális

    t5

    t10

    Megj.: A t-eloszlás is szimmetrikus 0-ra.

    Baran Ágnes Gyakorlat 58 / 70

  • t-próba

    Példa

    Egy fogkrémgyárban ellenőrizni szeretnék, hogy a 100 ml-es fogkrémektubusát töltő automata jól van-e kalibrálva. Véletlenszerűen kiválasztva 10tubust, lemérve a bennük lévő fogkrém mennyiségét a következő értékeketkapták.

    102, 106, 93, 103, 101, 96, 99, 101, 111, 108

    Feltételezve, hogy a tubusokba töltött fogkrém mennyisége normáliseloszlású, döntsön a fenti kérdésről 95%-os szinten.

    A nullhipotézis:H0 : µ = 100

    Az ellenhipotézis:H1 : µ 6= 100

    n = 10, X = 102, s∗n = 5.3955, α = 0.05

    Baran Ágnes Gyakorlat 59 / 70

  • A nullhipotézis:H0 : µ = 100

    Az ellenhipotézis:H1 : µ 6= 100

    n = 10, X = 102, s∗n = 5.3955, α = 0.05A próbastatisztika:

    t =X − µ0

    s∗n

    √n = 1.1722

    A kritikus tartomány (amikor elvetjük H0-at):

    |t| ≥ tn−1(

    1− α2

    )= t9(0.975) = 2.262

    Mivel az előbb kiszámolt t értékre ez nem teljesül, ezért H0-at elfogadjuk.

    Baran Ágnes Gyakorlat 60 / 70

  • Az előző feladat megoldása Matlab-bal:

    Használjuk a Matlab ttest függvényét.

    h=ttest(X,µ0), ahol X a minta, µ0 a feltételezett várható érték. Ha h=0akkor 95%-os szinten (α = 0.05) elfogadjuk, ha h=1 akkor elvetjük anullhipotézist.

    Ha más α érték mellett szeretnénk dönteni:h=ttest(X,µ0,’Alpha’,α)

    Esetünkben:

    X=[102 106 93 103 101 96 99 101 111 108];

    h=ttest(X,100)

    h =

    0

    Tehát elfogadjuk H0-at.

    Baran Ágnes Gyakorlat 61 / 70

  • t-próba

    Példa

    Több vásárlói panasz érkezett, hogy a 100 ml-esként árult fogkrémektubusa a feltüntetettnél kevesebb fogkrémet tartalmaz. Az esetetkivizsgálandó megmérték 10 véletlenszerűen kiválasztott tubus tartalmát.Az alábbi értékeket kapták:

    96, 94, 94, 105, 102, 98, 93, 94, 96, 99

    Döntsön 95%-os szinten a fogyasztók álĺıtásáról.

    A nullhipotézis:H0 : µ = 100

    Az ellenhipotézis (baloldali):

    H1 : µ < 100

    n = 10, X = 97.1, s∗n = 3.9285, α = 0.05

    Baran Ágnes Gyakorlat 62 / 70

  • A nullhipotézis:H0 : µ = 100

    Az ellenhipotézis (baloldali):

    H1 : µ < 100

    n = 10, X = 97.1, s∗n = 3.9285, α = 0.05A próbastatisztika:

    t =X − µ0

    s∗n

    √n = −2.3344

    A kritikus tartomány (amikor elvetjük H0-at):

    t ≤ tn−1(α) = −tn−1 (1− α) = −t9(0.95) = −1.833

    Mivel az előbb kiszámolt t értékre ez teljesül, ezért H0-at elvetjük.

    Baran Ágnes Gyakorlat 63 / 70

  • Az előző feladat megoldása Matlab-bal:

    Mivel az ellenhipotézisünk baloldali, ı́gy

    X =[96 94 94 105 102 98 93 94 96 99];

    h=ttest(X,100,'tail','left')

    h =

    1

    ami azt jelenti, hogy a nullhipotézist elvetjük. Kiszámolhatjuk a p-értéketis:

    [h,p]=ttest(X,100,'tail','left')

    h =

    1

    p =

    0.0222

    Innen látszik, hogy 99%-os szinten már elfogadtuk volna a nullhipotézist.

    Baran Ágnes Gyakorlat 64 / 70

  • Párośıtott t-próba

    Példa

    Egy 10 kisebb üzletet működtető bolthálózat megmérte az egyes boltoknapi átlagos forgalmát:

    X : 2987, 2976, 2995, 2971, 3000, 2989, 3044,

    3023, 2950, 3009.

    Ezután egy reklámkampányba kezdtek, azt remélve, hogy ezzel megnövelika forgalmat. A kampány után megismételték a mérést:

    Y : 3011, 3018, 3050, 3003, 3036, 3026,

    3015, 2999, 3014, 3018.

    Feltételezve, hogy az üzletek forgalma normális eloszlású, döntsön 99%-osszinten a kampány eredményességéről.

    Baran Ágnes Gyakorlat 65 / 70

  • Legyen Z = Y − X . Ekkor

    Z : 24, 42, 55, 32, 36, 37, −29, −24, 64, 9.

    A nullhipotézis:H0 : µZ = 0

    Az ellenhipotézis (jobboldali):

    H1 : µZ > 0.

    n = 10, Z = 24.6, s∗n = 30.91, α = 0.01A próbastatisztika:

    t =Z

    s∗n

    √n = 2.5171.

    A kritikus tartomány:

    t ≥ tn−1(1− α) = t9(0.99) = 2.821

    Mivel a kiszámolt t érték ebbe nem esik bele, ezért H0-at elfogadjuk

    Baran Ágnes Gyakorlat 66 / 70

  • Az előző feladat megoldása Matlab-bal:

    Használjuk a Matlab ttest függvényét.

    h=ttest(X,Y), ahol X és Y a két minta, kétoldali párośıtott t-próbátvégez, α = 0.05 mellett.

    Ha jobboldali ellenhipotézisünk van, és α = 0.01, akkor

    X=[2987 2976 2995 2971 3000 2989 3044 3023 2950 3009];

    Y=[3011 3018 3050 3003 3036 3026 3015 2999 3014 3018];

    h=ttest(Y,X,'tail','right','Alpha',0.01)

    h =

    0

    Egyoldali ellenhipotézis esetén figyeljünk a minták sorrendére!

    Baran Ágnes Gyakorlat 67 / 70

  • Független mintás t-próba

    Példa

    Egy tantárgy két különböző napon zajló ı́rásbeli vizsgájának nehézségétszeretnék összehasonĺıtani. Az első vizsganapon ı́rt dolgozatok közülvéletlenszerűen kiválasztva 10-et azok pontszámai az alábbiak:

    X : 69, 82, 65, 73, 74, 84, 89, 83, 76, 88.

    A második napon ı́rt dolgozatok közül 12-t választottunk, pontszámaik:

    Y : 80, 61, 71, 87, 80, 70, 75, 83, 71, 91, 75, 99.

    A mintákat független normális eloszlásúaknak feltételezve döntsön 95%-osszinten arról, hogy a két vizsga azonos nehézségű volt-e.

    Baran Ágnes Gyakorlat 68 / 70

  • A megoldás Matlab-balElőször végezzünk egy F-próbát annak eldöntésére, hogy a szórásokmegegyeznek-e:A nullhipotézis:

    H0 : σX = σY

    Az ellenhipotézis:H1 : σX 6= σY .

    X =[69 82 65 73 74 84 89 83 76 88];

    Y =[80 61 71 87 80 70 75 83 71 91 75 99];

    h=vartest2(X,Y)

    h =

    0

    Azt kaptuk, hogy 95%-os szinten elfogadjuk a szórások egyenlőségét.

    Baran Ágnes Gyakorlat 69 / 70

  • Ezután megh́ıvhatjuk a ttest2 függvényt.

    A nullhipotézis:H0 : µX = µY

    Az ellenhipotézis:H1 : µX 6= µY .

    h=ttest2(X,Y)

    h =

    0

    Tehát 95%-os szinten elfogadjuk H0-at.

    Baran Ágnes Gyakorlat 70 / 70