val osz nus} egsz am t as es matematikai statisztika · 2018. 12. 10. · (sz amuk fugg az eloszl...

Valósźınűségszáḿıtás és matematikai statisztika

Baran Ágnes

GyakorlatMATLAB

Baran Ágnes Gyakorlat 1 / 70

Véletlenszám generátorok

randi(N,n,m) n ×m pszeudorandom egész szám az [1,N]-en adottdiszkrét egyenletes eloszlásból

rand(n,m) n ×m véletlen szám a [0, 1]-en adott egyenleteseloszlásból

randn(n,m) n ×m véletlen szám a standard normális eloszlásból

[a, b] intervallumon egyenletes eloszlású véletlen számok generálása:(b-a)*rand(n,m)+a

µ várható értékű, σ szórású normális eloszlású véletlen számok:µ+randn(n,m)*σ

Véletlen számok a random függvénnyel:random(’name’,A,B,C,D,n,m) ahol name az eloszlás neve, A,B,C,D azeloszlás paraméterei (számuk függ az eloszlástól, ld. a random függvényhelp-jét.), n ×m az output mérete


Nevezetes eloszlások eloszlásfüggvényeA cdf (cummulative distribution function) beéṕıtett függvénnyel:y = cdf(’name’,x,A,B,C,D) ahol name az eloszlás neve, x ahol azeloszlásfüggvény értékét tudni szeretnénk, A,B,C,D az eloszlás paraméterei(számuk függ az eloszlástól, ld. a cdf függvény help-jét.)

Példa

Rajzoltassa ki a standard normális eloszlás eloszlásfüggvényét a [−3, 3]intervallumon.

Normális eloszlás esetén a két paraméter a várható érték és a szórás (most0 és 1)

>> x=linspace(-3,3);

>> y=cdf('normal',x,0,1);

>> figure; plot(x,y,'LineWidth',2);

>> ax=gca;

>> ax.XAxisLocation='origin';

>> ax.YAxisLocation='origin';


x=linspace(-3,3);

y=cdf('normal',x,0,1);

figure; plot(x,y,'LineWidth',2);

ax=gca;

ax.XAxisLocation='origin';

ax.YAxisLocation='origin';

-3 -2 -1 0 1 2 3

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9


Feladat

Rajzoltassa ki a [−3, 3] intervallumon a0 várható értékű, 1 szórású,

1 várható értékű, 1 szórású,


1 várható értékű, 2 szórású

normális eloszlás eloszlásfüggvényét.

-4 -2 0 2 4

0.5

=0, =1

-4 -2 0 2 4

0.5

=1, =1

-4 -2 0 2 4

0.5

=0, =2

-4 -2 0 2 4

0.5

=1, =2


Példa

Rajzoltassa ki a 0.8 várható értékű exponenciális eloszláseloszlásfüggvényét a [−3, 3] intervallumon.

Exponenciális eloszlás esetén egy paraméter van, a Matlab-ban ez avárható érték (ez most 0.8).


>> y=cdf('Exponential',x,0.8);


>> ax=gca;

>> ax.XAxisLocation='origin';

>> ax.YAxisLocation='origin';


x=linspace(-3,3);

y=cdf('Exponential',x,0.8);


ax=gca;

ax.XAxisLocation='origin';

ax.YAxisLocation='origin';

-1 0 1 2 3 4 5

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9


Példa

Rajzoltassa ki a 0.8, az 1 és az 1.2 várható értékű exponenciális eloszláseloszlásfüggvényét a [−1, 5] intervallumon.

x=linspace(-1,5);

y1=cdf('Exponential',x,1);

y2=cdf('Exponential',x,0.8);


figure; plot(x,y1,x,y2,x,y3,'LineWidth',2);

legend('\mu=1','\mu=0.8','\mu=1.2');

title('exponencilis eloszlas, eloszlasfuggveny')


x=linspace(-1,5);

y1=cdf('Exponential',x,1);



figure; plot(x,y1,x,y2,x,y3,'LineWidth',2);

legend('\mu=1','\mu=0.8','\mu=1.2');

title('exponencilis eloszlas, eloszlasfuggveny')

-1 0 1 2 3 4 5

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1exponenciális eloszlás, eloszlásfüggvény

=1

=0.8

=1.2


Eloszlásfüggvények

Példa

Rajzoltassa ki az

F (x) =

{0 ha x ≤ 01− 1−e−xx egyébként

eloszlásfüggvényt a [−1, 6] intervallumon.

x=linspace(-1,6);

y=(1-(1-exp(-x))./x).*(x>0);



x=linspace(-1,6);

y=(1-(1-exp(-x))./x).*(x>0);


-1 0 1 2 3 4 5 6

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9


Nevezetes eloszlások sűrűségfüggvénye

A pdf (probability density function) beéṕıtett függvénnyel:y = pdf(’name’,x,A,B,C,D) ahol name az eloszlás neve, x ahol asűrűségfüggvény értékét tudni szeretnénk, A,B,C,D az eloszlás paraméterei(számuk függ az eloszlástól, ld. a pdf függvény help-jét.)

Példa

Rajzoltassa ki a standard normális eloszlás sűrűségfüggvényét a [−3, 3]intervallumon.

Normális eloszlás esetén a két paraméter a várható érték és a szórás (most0 és 1)


>> y=pdf('normal',x,0,1);



x=linspace(-3,3);

y=pdf('normal',x,0,1);


-3 -2 -1 0 1 2 3

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5


Feladat

Ábrázolja a




1 várható értékű, 2 szórású

normális eloszlás sűrűségfüggvényét.

-5 -4 -3 -2 -1 0 1 2 3 4 5

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45=0, =1

=1, =1

=0, =2

=1, =2


A nevezetes eloszlások eloszlás- és sűrűségfüggvényét kirajzoltathatjuk adisttool alkalmazással is. Adjuk ki a disttool parancsot és amegjelenő ablakban álĺıtsuk be mit szeretnénk ábrázolni.

>>disttool

-8 -6 -4 -2 0 2 4 6 80

0.2

0.4

0.6

0.8

1

0

2

-2

Mu

Lower bound

Upper bound

1

2

0.5

Sigma

Lower bound

Upper bound

Lower boundLower bound

Upper boundUpper bound

Probability

Distribution: Normal Function type: CDF

X: 0

0.5


Példa

Legyen ξ egy 400 várható értékű, 3 szórású normális eloszlású valósźınűségiváltozó. Mennyi a valósźınűsége, hogy ξ a [398,401] intervallumba esik?

Paṕıron számolva ξ-t előbb normalizáltuk, majd a standard normáliseloszlás táblázatait használva meghatároztuk a kérdéses valósźınűséget.A Matlab-ot használva nincs szükség a standardizálásra.

1. megoldás: eloszlásfüggvénnyel (p = Fξ(401)− Fξ(398))>> p=cdf('normal',401,400,3)-cdf('normal',398,400,3)

0.3781

2. megoldás: sűrűségfüggvénnyel (p =401∫398

fξ(x)dx)

>> f=@(x) pdf('normal',x,400,3);

>> p=integral(f,398,401)

0.3781Baran Ágnes Gyakorlat 16 / 70

Példa

Legyen ξ ∼ N (0, 1). Adja meg a értékét úgy, hogy P(ξ ∈ [1, a]) = 0.14teljesüljön.

Tudjuk, hogy P(ξ ∈ [1, a]) = F (a)− F (1), ı́gy F (a) = 0.14 + F (1).

>> t=0.14+cdf('normal',1,0,1);

>> a=norminv(t)

a =

2.0824

norminv(p): a standard normális eloszlás eloszlásfüggvényénekinverze a p helyen

norminv(p,µ,σ): a µ várható értékű, σ szórású normális eloszláseloszlásfüggvényének inverze a p helyen


Kétdimenziós eloszlások

Példa

Ábrázoljuk az

F (x , y) =

{1 + e−x−y − e−x − e−y , ha x > 0, y > 0,0 egyébként

eloszlásfüggvényt a [−2, 5]× [−2, 5] tartományon.

x=linspace(-2,5); y=x;

[X,Y]=meshgrid(x,y);

Z=(1+exp(-X-Y)-exp(-X)-exp(-Y)).*(X>0).*(Y>0);

figure; mesh(X,Y,Z)

xlabel('x')

ylabel('y')




Z=(1+exp(-X-Y)-exp(-X)-exp(-Y)).*(X>0).*(Y>0);

figure; mesh(X,Y,Z)

xlabel('x')

ylabel('y')

0

6

0.2

0.4

4

0.6

0.8

y

2

1

640

x

20-2 -2



Példa

Mennyi a valósźınűsége, hogy az előző eloszlásfüggvénnyel adott (ξ, η)valósźınűségi változó értéke az [1, 3]× [2, 4] tartományba esik?

Tudjuk, hogy

P((ξ, η) ∈ [a1, b1]× [a2, b2]) = F (b1, b2)−F (a1, b2)−F (b1, a2)+F (a1, a2)

Ezek alapján a keresett valósźınűség:

F=@(x,y) 1+exp(-x-y)-exp(-x)-exp(-y);

p=F(3,4)-F(1,4)-F(3,2)+F(1,2)



Példa

Ábrázoljuk a kétdimenziós standard normális eloszlás sűrűségfüggvényét a[−3, 3]× [−3, 3] tartományon!

Tudjuk, hogy

f (x , y) =1

2πe−

x2+y2

2 , (x , y) ∈ R2.



Z=exp(-(X.^2+Y.^2)/2)/2/pi;

figure; mesh(X,Y,Z)

xlabel('x')

ylabel('y')




Z=exp(-(X.^2+Y.^2)/2)/2/pi;

figure; mesh(X,Y,Z)

xlabel('x')

ylabel('y')

0

4

0.05

2 4

0.1

2

0.15

y

0

x

0.2

0-2

-2-4 -4


Példa

Legyen (ξ, η) egy kétdimenziós standard normális eloszlású valósźınűségiváltozó. Mennyi a valósźınűsége, hogy (ξ, η) értéke a [−1, 1]× [1.5, 2]tartományba esik?

Tudjuk, hogy

P((ξ, η) ∈ [a1, b1]× [a2, b2]) =b1∫

a1

b2∫a2

f (x , y)dydx ,

ezért

f=@(x,y) exp(-(x.^2+y.^2)/2)/2/pi;

p=integral2(f,-1,1,1.5,2)


Nagy számok törvénye

Példa

Szimuláljuk egy szabályos dobókocka 10000 egymás utáni feldobását.Vizsgáljuk meg hogyan alakul az 5-ös dobások relat́ıv gyakorisága aḱısérlet során!

Használjuk a randi függvényt!

randi(N,n,m) : előálĺıt n ×m pszeudorandom egész számot az [1,N]-enadott diszkrét egyenletes eloszlásból.

n=10000;

x=randi(6,1,n);

rel=zeros(1,n);

for i=1:n

rel(i)=sum(x(1:i)==5)/i;

end

figure;plot(1:n,rel,[0,n],[1/6,1/6])


0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5


Példa

Egy szabályos dobókockával dobva jelölje A azt az eseményt, hogy adobott szám 4-nél nagyobb. Szimuláljuk a ḱısérlet 10000 egymás utánivégrehajtását és figyeljük hogy alakul A relat́ıv gyakorisága!

N=10000;

x=randi(6,1,N);

rel=zeros(1,N);

for n=1:N

rel(n)=sum(x(1:n)>4)/n;

end

figure; plot(1:N,rel,[0 N],[1/3,1/3])

xlabel('n')

ylabel('k_A/n')


0 2000 4000 6000 8000 10000

n

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

kA

/n


Példa

Szimuláljuk az alábbi ḱısérletet: 10000-szer egymás után, egymástólfüggetlenül véletlenszerűen (egyenletes eloszlás szerint) választunk egypontot az [1, 3] intervallumból. Jelölje ξi az i-edik esetben választottszámot. Ábrázoljuk az

Snn

:=ξ1 + · · ·+ ξn

n

értékeket n függvényében (n = 1, . . . , 10000).

N=10000;

x=random('uniform',1,3,1,N); s=zeros(1,N);

for n=1:N

s(n)=sum(x(1:n))/n;

end

figure; plot(1:N,s,[0,N],[2,2])

xlabel('n')

ylabel('S_n/n')


0 2000 4000 6000 8000 10000

n

1.75

1.8

1.85

1.9

1.95

2

2.05

2.1

2.15

2.2

2.25

Sn/n


Hisztogramok

Példa

Generáljunk egy 1000 elemű standard normális eloszlású, és egy 1000elemű 2 várható értékű, 0.8 szórású normális eloszlású mintát. Késźıtsünka mintákhoz gyakoriság hisztogramot!

Használjuk a Matlab histogram függvényét!

x=randn(1,1000);

figure; histogram(x)

x=2+randn(1,1000)*0.8;

figure; histogram(x)


Standard normális eloszlású minta

-4 -3 -2 -1 0 1 2 3 4

0

20

40

60

80

100

120

140


2 várható értékű, 0.8 szórású normális eloszlású minta

-1 0 1 2 3 4 5 6

0

50

100

150


Példa

Generáljunk egy 1000 elemű 2 várható értékű exponenciális eloszlásúmintát. Késźıtsünk a mintákhoz gyakoriság hisztogramot!

0 2 4 6 8 10 12 14 16

0

20

40

60

80

100

120

140

160

180

200


Hisztogramok

Példa

Generáljunk egy N (N = 100, 1000, 10000, 100000) elemű [0, 1]-enegyenletes eloszlású mintát, és készitsünk gyakoriság hisztogramot (10részintervallumot használjunk).

x=rand(1,100);

subplot(2,2,1)

histogram(x,10); title('N=100')

x=rand(1,1000);

subplot(2,2,2)


x=rand(1,10000);

subplot(2,2,3)


x=rand(1,100000);

subplot(2,2,4)

histogram(x,10); title('N=10000')Baran Ágnes Gyakorlat 34 / 70

0 0.2 0.4 0.6 0.8 1

0

5

10

15N=100

0 0.2 0.4 0.6 0.8 1

0

20

40

60

80

100

120N=1000

0 0.2 0.4 0.6 0.8 1

0

200

400

600

800

1000

1200N=10000

0 0.2 0.4 0.6 0.8 1

0

2000

4000

6000

8000

10000

12000N=10000


Empirikus eloszlásfüggvény

Példa

Generáljunk egy 30 elemű standard normális eloszlású mintát, rajzoltassukki a minta empirikus eloszlásfüggvényét, illetve a standard normáliseloszlás eloszlásfüggvényét.

Használjuk a Matlab ecdf (empirical cumulative distribution function)függvényét!

x=random('normal',0,1,1,30);

figure; ecdf(x)

xx=linspace(-3,3);

yy=cdf('normal',xx,0,1);

hold on; plot(xx,yy)


x=random('normal',0,1,1,30);

figure; ecdf(x)

xx=linspace(-3,3);

yy=cdf('normal',xx,0,1);


-3 -2 -1 0 1 2 3

x

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

F(x

)


Ismételjük meg az előző feladatot egy 100 elemű mintával!

-3 -2 -1 0 1 2 3

x

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

F(x

)



Példa

Generáljunk egy 30 elemű [0, 1]-en egyenletes eloszlású mintát,rajzoltassuk ki a minta empirikus eloszlásfüggvényét, illetve az elméletieloszlásfüggvényt.

x=rand(1,30);

figure; ecdf(x)

xx=linspace(-0.1,1.1);

yy=cdf('uniform',xx,0,1);



-0.2 0 0.2 0.4 0.6 0.8 1 1.2

x

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

F(x

)



Példa

Generáljunk egy 30 elemű mintát a 2 várható értékű exponenciáliseloszlásból, rajzoltassuk ki a minta empirikus eloszlásfüggvényét, illetve azelméleti eloszlásfüggvényt.

x=random('exponential',2,1,30);

figure; ecdf(x)

xx=linspace(0,8);

yy=cdf('exponential',xx,2);



0 1 2 3 4 5 6 7 8

x

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

F(x

)



0 5 10 15

x

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

F(x

)


Kétoldali u-próba

Példa

Egy üzemben csöveket gyártanak, melyek hossza normális eloszlású 2 mmszórással. Véletlenszerűen kiválasztva 8 elkészült csövet és megmérvehosszukat az alábbi értékeket kaptuk:

199, 197, 196, 198, 199, 200, 202, 201.

95%-os döntési szintet használva vizsgálja meg azt az álĺıtást, hogy azüzemben gyártott csövek hossza átlagosan 200 mm.

A nullhipotézis:H0 : µ = 200,

az ellenhipotézis:H1 : µ 6= 200.

n = 8, σ = 2, α = 0.05, X = 199.


A próbastatisztika:

u =X − 200

σ

√n =

199− 2002

√8 = −1.4142

A kritikus tartomány (amikor elvetjük H0-at):

|u| ≥ Φ−1(

1− α2

)= Φ−1(0.975) = 1.96

Mivel|u| = 1.4142 < 1.96

ı́gy H0-at elfogadjuk.


Kétoldali u-próba

-3 -Φ-1(1- α /2) 0 Φ-1(1- α /2) 30

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5

A kritikus és az elfogadási tartomány


A Matlab ztest függvényével:h=ztest(minta,µ0,σ)Ha h=0 akkor elfogadjuk, ha h=1 elvetjük H0-at 95%-os szinten.

X=[199, 197, 196, 198, 199, 200, 202, 201];

h=ztest(X,200,2)

h =

0

Így elfogadjuk H0-at.Kiszáḿıthatjuk a p-értéket és a várható értékre vonatkozó konfidenciaintervallumot is:

[h,p,Kint]=ztest(X,200,2)

h =

0

p =

0.1573

Kint =

197.6141 200.3859


Egyoldali u-próba

Példa

Egy tejipari vállalkozás 500 g-os kiszerelésben gyárt gyümölcsjoghurtokat,melyek átlagos gyümölcstartalma a dobozon található felirat szerint 10%.Több fogyasztói panasz érkezett, hogy a termék a megjelöltnél kevesebbgyümölcsöt tartalmaz, ı́gy a cég önellenőrzést tartott. Megvizsgálták 10véletlenszerűen kiválasztott termék gyümölcstartalmát, grammbankifejezve az alábbi értékeket kapták:

51, 45, 45, 51, 54, 50, 42, 53, 53, 50.

Feltételezve, hogy a joghurtok grammban kifejezett gyümölcstartalmanormális eloszlású 3 g szórással döntsön 98%-os szinten, hogy igaza van-ea vásárlóknak.



az ellenhipotézis:H1 : µ < 50.

n = 10, σ = 3, α = 0.02, X = 49.4. A próbastatisztika:

u =X − 50σ

√n =

49.4− 503

√10 = −0.6325


u ≤ Φ−1 (α) = Φ−1(0.02) = −2.0537

Mivel a kapott u érték ebbe nem esik bele, ezért elfogadjuk H0-at.


Egyoldali u-próba, baloldali ellenhipotézis

-3 Φ-1(α ) 0 30

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5

A kritikus és az elfogadási tartomány

Megj.: Φ−1 (α) = −Φ−1 (1− α)


A Matlab ztest függvényével:

A baloldali ellenhipotézis és a 98%-os szint beálĺıtása:h=ztest(X,µ0,σ,’alpha’,0.02,’tail’,’left’)

Esetünkben:

X=[51, 45, 45, 51, 54, 50, 42, 53, 53, 50];

h=ztest(X,50,3,'alpha',0.02,'tail','left')

h =

0

Mivel h=0 a nullhipotézist elfogadjuk.


Egyoldali u-próba

Példa

Felmérések szerint az emberek átlagos IQ értéke 100. A sajtkésźıtőkszövetsége azt álĺıtja, hogy a sajtkésźıtéssel foglalkozó emberek esetén ezaz érték magasabb. 10 véletlenszerűen választott sajtkésźıtő IQ értékére azalábbiakat kaptuk:

104, 97, 104, 98, 103, 112, 99, 95, 102, 106.

Feltételezve, hogy az IQ érték normális eloszlású 3 szórással, döntsön98%-os szinten a szövetség álĺıtásáról.


az ellenhipotézis:H1 : µ > 100.

n = 10, σ = 3, α = 0.02, X = 102.


A próbastatisztika:

u =X − 100

σ

√n =

102− 1003

√10 = 2.1082


u > Φ−1 (1− α) = Φ−1(0.98) = 2.0537

Mivel a kapott u érték ebbe beleesik, ezért elvetjük H0-at (és boldogok asajtkésźıtők).


Egyoldali u-próba (jobboldali ellenhipotézis)

-3 0 Φ-1(1- α ) 30

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5

Az elfogadási és a kritikus tartomány


A Matlab ztest függvényével:

X=[104, 97, 104, 98, 103, 112, 99, 95, 102, 106];

h=ztest(X,100,3,'alpha',0.02,'tail','right')

h =

1

Mivel h=1 a nullhipotézist elvetjük.Száḿıttassuk ki a p-értéket is!

[h,p]=ztest(X,100,3,'alpha',0.02,'tail','right')

h =

1

p =

0.0175

A p-értékből látjuk, hogy 99%-os szinten már elfogadtuk volna anullhipotézist.


t-eloszlás

Példa

Rajzoltassuk ki közös ábrán a standard normális eloszlás és az 5 és 10szabadsági fokú t-eloszlás sűrűségfüggvényét!

x=linspace(-5,5);

yn=pdf('normal',x,0,1);

y1=pdf('T',x,5);

y2=pdf('T',x,10);

figure; plot(x,yn,x,y1,x,y2)

legend('standard normalis','t_5','t_{10}')


t-eloszlás

-5 -4 -3 -2 -1 0 1 2 3 4 5

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

standard normális

t5

t10

Megj.: A t-eloszlás is szimmetrikus 0-ra.


t-próba

Példa

Egy fogkrémgyárban ellenőrizni szeretnék, hogy a 100 ml-es fogkrémektubusát töltő automata jól van-e kalibrálva. Véletlenszerűen kiválasztva 10tubust, lemérve a bennük lévő fogkrém mennyiségét a következő értékeketkapták.

102, 106, 93, 103, 101, 96, 99, 101, 111, 108

Feltételezve, hogy a tubusokba töltött fogkrém mennyisége normáliseloszlású, döntsön a fenti kérdésről 95%-os szinten.

A nullhipotézis:H0 : µ = 100

Az ellenhipotézis:H1 : µ 6= 100

n = 10, X = 102, s∗n = 5.3955, α = 0.05



Az ellenhipotézis:H1 : µ 6= 100

n = 10, X = 102, s∗n = 5.3955, α = 0.05A próbastatisztika:

t =X − µ0

s∗n

√n = 1.1722


|t| ≥ tn−1(

1− α2

)= t9(0.975) = 2.262

Mivel az előbb kiszámolt t értékre ez nem teljesül, ezért H0-at elfogadjuk.


Az előző feladat megoldása Matlab-bal:

Használjuk a Matlab ttest függvényét.

h=ttest(X,µ0), ahol X a minta, µ0 a feltételezett várható érték. Ha h=0akkor 95%-os szinten (α = 0.05) elfogadjuk, ha h=1 akkor elvetjük anullhipotézist.

Ha más α érték mellett szeretnénk dönteni:h=ttest(X,µ0,’Alpha’,α)

Esetünkben:

X=[102 106 93 103 101 96 99 101 111 108];

h=ttest(X,100)

h =

0

Tehát elfogadjuk H0-at.


t-próba

Példa

Több vásárlói panasz érkezett, hogy a 100 ml-esként árult fogkrémektubusa a feltüntetettnél kevesebb fogkrémet tartalmaz. Az esetetkivizsgálandó megmérték 10 véletlenszerűen kiválasztott tubus tartalmát.Az alábbi értékeket kapták:

96, 94, 94, 105, 102, 98, 93, 94, 96, 99

Döntsön 95%-os szinten a fogyasztók álĺıtásáról.


Az ellenhipotézis (baloldali):

H1 : µ < 100

n = 10, X = 97.1, s∗n = 3.9285, α = 0.05



Az ellenhipotézis (baloldali):

H1 : µ < 100

n = 10, X = 97.1, s∗n = 3.9285, α = 0.05A próbastatisztika:

t =X − µ0

s∗n

√n = −2.3344


t ≤ tn−1(α) = −tn−1 (1− α) = −t9(0.95) = −1.833

Mivel az előbb kiszámolt t értékre ez teljesül, ezért H0-at elvetjük.



Mivel az ellenhipotézisünk baloldali, ı́gy

X =[96 94 94 105 102 98 93 94 96 99];

h=ttest(X,100,'tail','left')

h =

1

ami azt jelenti, hogy a nullhipotézist elvetjük. Kiszámolhatjuk a p-értéketis:

[h,p]=ttest(X,100,'tail','left')

h =

1

p =

0.0222

Innen látszik, hogy 99%-os szinten már elfogadtuk volna a nullhipotézist.


Párośıtott t-próba

Példa

Egy 10 kisebb üzletet működtető bolthálózat megmérte az egyes boltoknapi átlagos forgalmát:

X : 2987, 2976, 2995, 2971, 3000, 2989, 3044,

3023, 2950, 3009.

Ezután egy reklámkampányba kezdtek, azt remélve, hogy ezzel megnövelika forgalmat. A kampány után megismételték a mérést:

Y : 3011, 3018, 3050, 3003, 3036, 3026,

3015, 2999, 3014, 3018.

Feltételezve, hogy az üzletek forgalma normális eloszlású, döntsön 99%-osszinten a kampány eredményességéről.


Legyen Z = Y − X . Ekkor

Z : 24, 42, 55, 32, 36, 37, −29, −24, 64, 9.

A nullhipotézis:H0 : µZ = 0

Az ellenhipotézis (jobboldali):

H1 : µZ > 0.

n = 10, Z = 24.6, s∗n = 30.91, α = 0.01A próbastatisztika:

t =Z

s∗n

√n = 2.5171.

A kritikus tartomány:

t ≥ tn−1(1− α) = t9(0.99) = 2.821

Mivel a kiszámolt t érték ebbe nem esik bele, ezért H0-at elfogadjuk



Használjuk a Matlab ttest függvényét.

h=ttest(X,Y), ahol X és Y a két minta, kétoldali párośıtott t-próbátvégez, α = 0.05 mellett.

Ha jobboldali ellenhipotézisünk van, és α = 0.01, akkor

X=[2987 2976 2995 2971 3000 2989 3044 3023 2950 3009];

Y=[3011 3018 3050 3003 3036 3026 3015 2999 3014 3018];

h=ttest(Y,X,'tail','right','Alpha',0.01)

h =

0

Egyoldali ellenhipotézis esetén figyeljünk a minták sorrendére!


Független mintás t-próba

Példa

Egy tantárgy két különböző napon zajló ı́rásbeli vizsgájának nehézségétszeretnék összehasonĺıtani. Az első vizsganapon ı́rt dolgozatok közülvéletlenszerűen kiválasztva 10-et azok pontszámai az alábbiak:

X : 69, 82, 65, 73, 74, 84, 89, 83, 76, 88.

A második napon ı́rt dolgozatok közül 12-t választottunk, pontszámaik:

Y : 80, 61, 71, 87, 80, 70, 75, 83, 71, 91, 75, 99.

A mintákat független normális eloszlásúaknak feltételezve döntsön 95%-osszinten arról, hogy a két vizsga azonos nehézségű volt-e.


A megoldás Matlab-balElőször végezzünk egy F-próbát annak eldöntésére, hogy a szórásokmegegyeznek-e:A nullhipotézis:

H0 : σX = σY

Az ellenhipotézis:H1 : σX 6= σY .

X =[69 82 65 73 74 84 89 83 76 88];

Y =[80 61 71 87 80 70 75 83 71 91 75 99];

h=vartest2(X,Y)

h =

0

Azt kaptuk, hogy 95%-os szinten elfogadjuk a szórások egyenlőségét.


Ezután megh́ıvhatjuk a ttest2 függvényt.

A nullhipotézis:H0 : µX = µY

Az ellenhipotézis:H1 : µX 6= µY .

h=ttest2(X,Y)

h =

0

Tehát 95%-os szinten elfogadjuk H0-at.


val osz nus} egsz am t as es matematikai statisztika · 2018. 12. 10. · (sz amuk fugg az eloszl...

Documents