val osz nus} egsz am t as es matematikai statisztika · 2018. 12. 10. · (sz amuk fugg az eloszl...
TRANSCRIPT
-
Valósźınűségszáḿıtás és matematikai statisztika
Baran Ágnes
GyakorlatMATLAB
Baran Ágnes Gyakorlat 1 / 70
-
Véletlenszám generátorok
randi(N,n,m) n ×m pszeudorandom egész szám az [1,N]-en adottdiszkrét egyenletes eloszlásból
rand(n,m) n ×m véletlen szám a [0, 1]-en adott egyenleteseloszlásból
randn(n,m) n ×m véletlen szám a standard normális eloszlásból
[a, b] intervallumon egyenletes eloszlású véletlen számok generálása:(b-a)*rand(n,m)+a
µ várható értékű, σ szórású normális eloszlású véletlen számok:µ+randn(n,m)*σ
Véletlen számok a random függvénnyel:random(’name’,A,B,C,D,n,m) ahol name az eloszlás neve, A,B,C,D azeloszlás paraméterei (számuk függ az eloszlástól, ld. a random függvényhelp-jét.), n ×m az output mérete
Baran Ágnes Gyakorlat 2 / 70
-
Nevezetes eloszlások eloszlásfüggvényeA cdf (cummulative distribution function) beéṕıtett függvénnyel:y = cdf(’name’,x,A,B,C,D) ahol name az eloszlás neve, x ahol azeloszlásfüggvény értékét tudni szeretnénk, A,B,C,D az eloszlás paraméterei(számuk függ az eloszlástól, ld. a cdf függvény help-jét.)
Példa
Rajzoltassa ki a standard normális eloszlás eloszlásfüggvényét a [−3, 3]intervallumon.
Normális eloszlás esetén a két paraméter a várható érték és a szórás (most0 és 1)
>> x=linspace(-3,3);
>> y=cdf('normal',x,0,1);
>> figure; plot(x,y,'LineWidth',2);
>> ax=gca;
>> ax.XAxisLocation='origin';
>> ax.YAxisLocation='origin';
Baran Ágnes Gyakorlat 3 / 70
-
x=linspace(-3,3);
y=cdf('normal',x,0,1);
figure; plot(x,y,'LineWidth',2);
ax=gca;
ax.XAxisLocation='origin';
ax.YAxisLocation='origin';
-3 -2 -1 0 1 2 3
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Baran Ágnes Gyakorlat 4 / 70
-
Feladat
Rajzoltassa ki a [−3, 3] intervallumon a0 várható értékű, 1 szórású,
1 várható értékű, 1 szórású,
0 várható értékű, 2 szórású,
1 várható értékű, 2 szórású
normális eloszlás eloszlásfüggvényét.
-4 -2 0 2 4
0.5
=0, =1
-4 -2 0 2 4
0.5
=1, =1
-4 -2 0 2 4
0.5
=0, =2
-4 -2 0 2 4
0.5
=1, =2
Baran Ágnes Gyakorlat 5 / 70
-
Példa
Rajzoltassa ki a 0.8 várható értékű exponenciális eloszláseloszlásfüggvényét a [−3, 3] intervallumon.
Exponenciális eloszlás esetén egy paraméter van, a Matlab-ban ez avárható érték (ez most 0.8).
>> x=linspace(-3,3);
>> y=cdf('Exponential',x,0.8);
>> figure; plot(x,y,'LineWidth',2);
>> ax=gca;
>> ax.XAxisLocation='origin';
>> ax.YAxisLocation='origin';
Baran Ágnes Gyakorlat 6 / 70
-
x=linspace(-3,3);
y=cdf('Exponential',x,0.8);
figure; plot(x,y,'LineWidth',2);
ax=gca;
ax.XAxisLocation='origin';
ax.YAxisLocation='origin';
-1 0 1 2 3 4 5
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Baran Ágnes Gyakorlat 7 / 70
-
Példa
Rajzoltassa ki a 0.8, az 1 és az 1.2 várható értékű exponenciális eloszláseloszlásfüggvényét a [−1, 5] intervallumon.
x=linspace(-1,5);
y1=cdf('Exponential',x,1);
y2=cdf('Exponential',x,0.8);
y3=cdf('Exponential',x,1.2);
figure; plot(x,y1,x,y2,x,y3,'LineWidth',2);
legend('\mu=1','\mu=0.8','\mu=1.2');
title('exponencilis eloszlas, eloszlasfuggveny')
Baran Ágnes Gyakorlat 8 / 70
-
x=linspace(-1,5);
y1=cdf('Exponential',x,1);
y2=cdf('Exponential',x,0.8);
y3=cdf('Exponential',x,1.2);
figure; plot(x,y1,x,y2,x,y3,'LineWidth',2);
legend('\mu=1','\mu=0.8','\mu=1.2');
title('exponencilis eloszlas, eloszlasfuggveny')
-1 0 1 2 3 4 5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1exponenciális eloszlás, eloszlásfüggvény
=1
=0.8
=1.2
Baran Ágnes Gyakorlat 9 / 70
-
Eloszlásfüggvények
Példa
Rajzoltassa ki az
F (x) =
{0 ha x ≤ 01− 1−e−xx egyébként
eloszlásfüggvényt a [−1, 6] intervallumon.
x=linspace(-1,6);
y=(1-(1-exp(-x))./x).*(x>0);
figure; plot(x,y,'LineWidth',2);
Baran Ágnes Gyakorlat 10 / 70
-
x=linspace(-1,6);
y=(1-(1-exp(-x))./x).*(x>0);
figure; plot(x,y,'LineWidth',2);
-1 0 1 2 3 4 5 6
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Baran Ágnes Gyakorlat 11 / 70
-
Nevezetes eloszlások sűrűségfüggvénye
A pdf (probability density function) beéṕıtett függvénnyel:y = pdf(’name’,x,A,B,C,D) ahol name az eloszlás neve, x ahol asűrűségfüggvény értékét tudni szeretnénk, A,B,C,D az eloszlás paraméterei(számuk függ az eloszlástól, ld. a pdf függvény help-jét.)
Példa
Rajzoltassa ki a standard normális eloszlás sűrűségfüggvényét a [−3, 3]intervallumon.
Normális eloszlás esetén a két paraméter a várható érték és a szórás (most0 és 1)
>> x=linspace(-3,3);
>> y=pdf('normal',x,0,1);
>> figure; plot(x,y,'LineWidth',2);
Baran Ágnes Gyakorlat 12 / 70
-
x=linspace(-3,3);
y=pdf('normal',x,0,1);
figure; plot(x,y,'LineWidth',2);
-3 -2 -1 0 1 2 3
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
Baran Ágnes Gyakorlat 13 / 70
-
Feladat
Ábrázolja a
0 várható értékű, 1 szórású,
1 várható értékű, 1 szórású,
0 várható értékű, 2 szórású,
1 várható értékű, 2 szórású
normális eloszlás sűrűségfüggvényét.
-5 -4 -3 -2 -1 0 1 2 3 4 5
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45=0, =1
=1, =1
=0, =2
=1, =2
Baran Ágnes Gyakorlat 14 / 70
-
A nevezetes eloszlások eloszlás- és sűrűségfüggvényét kirajzoltathatjuk adisttool alkalmazással is. Adjuk ki a disttool parancsot és amegjelenő ablakban álĺıtsuk be mit szeretnénk ábrázolni.
>>disttool
-8 -6 -4 -2 0 2 4 6 80
0.2
0.4
0.6
0.8
1
0
2
-2
Mu
Lower bound
Upper bound
1
2
0.5
Sigma
Lower bound
Upper bound
Lower boundLower bound
Upper boundUpper bound
Probability
Distribution: Normal Function type: CDF
X: 0
0.5
Baran Ágnes Gyakorlat 15 / 70
-
Példa
Legyen ξ egy 400 várható értékű, 3 szórású normális eloszlású valósźınűségiváltozó. Mennyi a valósźınűsége, hogy ξ a [398,401] intervallumba esik?
Paṕıron számolva ξ-t előbb normalizáltuk, majd a standard normáliseloszlás táblázatait használva meghatároztuk a kérdéses valósźınűséget.A Matlab-ot használva nincs szükség a standardizálásra.
1. megoldás: eloszlásfüggvénnyel (p = Fξ(401)− Fξ(398))>> p=cdf('normal',401,400,3)-cdf('normal',398,400,3)
0.3781
2. megoldás: sűrűségfüggvénnyel (p =401∫398
fξ(x)dx)
>> f=@(x) pdf('normal',x,400,3);
>> p=integral(f,398,401)
0.3781Baran Ágnes Gyakorlat 16 / 70
-
Példa
Legyen ξ ∼ N (0, 1). Adja meg a értékét úgy, hogy P(ξ ∈ [1, a]) = 0.14teljesüljön.
Tudjuk, hogy P(ξ ∈ [1, a]) = F (a)− F (1), ı́gy F (a) = 0.14 + F (1).
>> t=0.14+cdf('normal',1,0,1);
>> a=norminv(t)
a =
2.0824
norminv(p): a standard normális eloszlás eloszlásfüggvényénekinverze a p helyen
norminv(p,µ,σ): a µ várható értékű, σ szórású normális eloszláseloszlásfüggvényének inverze a p helyen
Baran Ágnes Gyakorlat 17 / 70
-
Kétdimenziós eloszlások
Példa
Ábrázoljuk az
F (x , y) =
{1 + e−x−y − e−x − e−y , ha x > 0, y > 0,0 egyébként
eloszlásfüggvényt a [−2, 5]× [−2, 5] tartományon.
x=linspace(-2,5); y=x;
[X,Y]=meshgrid(x,y);
Z=(1+exp(-X-Y)-exp(-X)-exp(-Y)).*(X>0).*(Y>0);
figure; mesh(X,Y,Z)
xlabel('x')
ylabel('y')
Baran Ágnes Gyakorlat 18 / 70
-
x=linspace(-2,5); y=x;
[X,Y]=meshgrid(x,y);
Z=(1+exp(-X-Y)-exp(-X)-exp(-Y)).*(X>0).*(Y>0);
figure; mesh(X,Y,Z)
xlabel('x')
ylabel('y')
0
6
0.2
0.4
4
0.6
0.8
y
2
1
640
x
20-2 -2
Baran Ágnes Gyakorlat 19 / 70
-
Kétdimenziós eloszlások
Példa
Mennyi a valósźınűsége, hogy az előző eloszlásfüggvénnyel adott (ξ, η)valósźınűségi változó értéke az [1, 3]× [2, 4] tartományba esik?
Tudjuk, hogy
P((ξ, η) ∈ [a1, b1]× [a2, b2]) = F (b1, b2)−F (a1, b2)−F (b1, a2)+F (a1, a2)
Ezek alapján a keresett valósźınűség:
F=@(x,y) 1+exp(-x-y)-exp(-x)-exp(-y);
p=F(3,4)-F(1,4)-F(3,2)+F(1,2)
Baran Ágnes Gyakorlat 20 / 70
-
Kétdimenziós eloszlások
Példa
Ábrázoljuk a kétdimenziós standard normális eloszlás sűrűségfüggvényét a[−3, 3]× [−3, 3] tartományon!
Tudjuk, hogy
f (x , y) =1
2πe−
x2+y2
2 , (x , y) ∈ R2.
x=linspace(-3,3); y=x;
[X,Y]=meshgrid(x,y);
Z=exp(-(X.^2+Y.^2)/2)/2/pi;
figure; mesh(X,Y,Z)
xlabel('x')
ylabel('y')
Baran Ágnes Gyakorlat 21 / 70
-
x=linspace(-3,3); y=x;
[X,Y]=meshgrid(x,y);
Z=exp(-(X.^2+Y.^2)/2)/2/pi;
figure; mesh(X,Y,Z)
xlabel('x')
ylabel('y')
0
4
0.05
2 4
0.1
2
0.15
y
0
x
0.2
0-2
-2-4 -4
Baran Ágnes Gyakorlat 22 / 70
-
Példa
Legyen (ξ, η) egy kétdimenziós standard normális eloszlású valósźınűségiváltozó. Mennyi a valósźınűsége, hogy (ξ, η) értéke a [−1, 1]× [1.5, 2]tartományba esik?
Tudjuk, hogy
P((ξ, η) ∈ [a1, b1]× [a2, b2]) =b1∫
a1
b2∫a2
f (x , y)dydx ,
ezért
f=@(x,y) exp(-(x.^2+y.^2)/2)/2/pi;
p=integral2(f,-1,1,1.5,2)
Baran Ágnes Gyakorlat 23 / 70
-
Nagy számok törvénye
Példa
Szimuláljuk egy szabályos dobókocka 10000 egymás utáni feldobását.Vizsgáljuk meg hogyan alakul az 5-ös dobások relat́ıv gyakorisága aḱısérlet során!
Használjuk a randi függvényt!
randi(N,n,m) : előálĺıt n ×m pszeudorandom egész számot az [1,N]-enadott diszkrét egyenletes eloszlásból.
n=10000;
x=randi(6,1,n);
rel=zeros(1,n);
for i=1:n
rel(i)=sum(x(1:i)==5)/i;
end
figure;plot(1:n,rel,[0,n],[1/6,1/6])
Baran Ágnes Gyakorlat 24 / 70
-
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
Baran Ágnes Gyakorlat 25 / 70
-
Példa
Egy szabályos dobókockával dobva jelölje A azt az eseményt, hogy adobott szám 4-nél nagyobb. Szimuláljuk a ḱısérlet 10000 egymás utánivégrehajtását és figyeljük hogy alakul A relat́ıv gyakorisága!
N=10000;
x=randi(6,1,N);
rel=zeros(1,N);
for n=1:N
rel(n)=sum(x(1:n)>4)/n;
end
figure; plot(1:N,rel,[0 N],[1/3,1/3])
xlabel('n')
ylabel('k_A/n')
Baran Ágnes Gyakorlat 26 / 70
-
0 2000 4000 6000 8000 10000
n
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
kA
/n
Baran Ágnes Gyakorlat 27 / 70
-
Példa
Szimuláljuk az alábbi ḱısérletet: 10000-szer egymás után, egymástólfüggetlenül véletlenszerűen (egyenletes eloszlás szerint) választunk egypontot az [1, 3] intervallumból. Jelölje ξi az i-edik esetben választottszámot. Ábrázoljuk az
Snn
:=ξ1 + · · ·+ ξn
n
értékeket n függvényében (n = 1, . . . , 10000).
N=10000;
x=random('uniform',1,3,1,N); s=zeros(1,N);
for n=1:N
s(n)=sum(x(1:n))/n;
end
figure; plot(1:N,s,[0,N],[2,2])
xlabel('n')
ylabel('S_n/n')
Baran Ágnes Gyakorlat 28 / 70
-
0 2000 4000 6000 8000 10000
n
1.75
1.8
1.85
1.9
1.95
2
2.05
2.1
2.15
2.2
2.25
Sn/n
Baran Ágnes Gyakorlat 29 / 70
-
Hisztogramok
Példa
Generáljunk egy 1000 elemű standard normális eloszlású, és egy 1000elemű 2 várható értékű, 0.8 szórású normális eloszlású mintát. Késźıtsünka mintákhoz gyakoriság hisztogramot!
Használjuk a Matlab histogram függvényét!
x=randn(1,1000);
figure; histogram(x)
x=2+randn(1,1000)*0.8;
figure; histogram(x)
Baran Ágnes Gyakorlat 30 / 70
-
Standard normális eloszlású minta
-4 -3 -2 -1 0 1 2 3 4
0
20
40
60
80
100
120
140
Baran Ágnes Gyakorlat 31 / 70
-
2 várható értékű, 0.8 szórású normális eloszlású minta
-1 0 1 2 3 4 5 6
0
50
100
150
Baran Ágnes Gyakorlat 32 / 70
-
Példa
Generáljunk egy 1000 elemű 2 várható értékű exponenciális eloszlásúmintát. Késźıtsünk a mintákhoz gyakoriság hisztogramot!
0 2 4 6 8 10 12 14 16
0
20
40
60
80
100
120
140
160
180
200
Baran Ágnes Gyakorlat 33 / 70
-
Hisztogramok
Példa
Generáljunk egy N (N = 100, 1000, 10000, 100000) elemű [0, 1]-enegyenletes eloszlású mintát, és készitsünk gyakoriság hisztogramot (10részintervallumot használjunk).
x=rand(1,100);
subplot(2,2,1)
histogram(x,10); title('N=100')
x=rand(1,1000);
subplot(2,2,2)
histogram(x,10); title('N=1000')
x=rand(1,10000);
subplot(2,2,3)
histogram(x,10); title('N=10000')
x=rand(1,100000);
subplot(2,2,4)
histogram(x,10); title('N=10000')Baran Ágnes Gyakorlat 34 / 70
-
0 0.2 0.4 0.6 0.8 1
0
5
10
15N=100
0 0.2 0.4 0.6 0.8 1
0
20
40
60
80
100
120N=1000
0 0.2 0.4 0.6 0.8 1
0
200
400
600
800
1000
1200N=10000
0 0.2 0.4 0.6 0.8 1
0
2000
4000
6000
8000
10000
12000N=10000
Baran Ágnes Gyakorlat 35 / 70
-
Empirikus eloszlásfüggvény
Példa
Generáljunk egy 30 elemű standard normális eloszlású mintát, rajzoltassukki a minta empirikus eloszlásfüggvényét, illetve a standard normáliseloszlás eloszlásfüggvényét.
Használjuk a Matlab ecdf (empirical cumulative distribution function)függvényét!
x=random('normal',0,1,1,30);
figure; ecdf(x)
xx=linspace(-3,3);
yy=cdf('normal',xx,0,1);
hold on; plot(xx,yy)
Baran Ágnes Gyakorlat 36 / 70
-
x=random('normal',0,1,1,30);
figure; ecdf(x)
xx=linspace(-3,3);
yy=cdf('normal',xx,0,1);
hold on; plot(xx,yy)
-3 -2 -1 0 1 2 3
x
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
F(x
)
Baran Ágnes Gyakorlat 37 / 70
-
Ismételjük meg az előző feladatot egy 100 elemű mintával!
-3 -2 -1 0 1 2 3
x
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
F(x
)
Baran Ágnes Gyakorlat 38 / 70
-
Empirikus eloszlásfüggvény
Példa
Generáljunk egy 30 elemű [0, 1]-en egyenletes eloszlású mintát,rajzoltassuk ki a minta empirikus eloszlásfüggvényét, illetve az elméletieloszlásfüggvényt.
x=rand(1,30);
figure; ecdf(x)
xx=linspace(-0.1,1.1);
yy=cdf('uniform',xx,0,1);
hold on; plot(xx,yy)
Baran Ágnes Gyakorlat 39 / 70
-
-0.2 0 0.2 0.4 0.6 0.8 1 1.2
x
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
F(x
)
Baran Ágnes Gyakorlat 40 / 70
-
Ismételjük meg az előző feladatot egy 100 elemű mintával!
-0.2 0 0.2 0.4 0.6 0.8 1 1.2
x
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
F(x
)
Baran Ágnes Gyakorlat 41 / 70
-
Empirikus eloszlásfüggvény
Példa
Generáljunk egy 30 elemű mintát a 2 várható értékű exponenciáliseloszlásból, rajzoltassuk ki a minta empirikus eloszlásfüggvényét, illetve azelméleti eloszlásfüggvényt.
x=random('exponential',2,1,30);
figure; ecdf(x)
xx=linspace(0,8);
yy=cdf('exponential',xx,2);
hold on; plot(xx,yy)
Baran Ágnes Gyakorlat 42 / 70
-
0 1 2 3 4 5 6 7 8
x
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
F(x
)
Baran Ágnes Gyakorlat 43 / 70
-
Ismételjük meg az előző feladatot egy 100 elemű mintával!
0 5 10 15
x
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
F(x
)
Baran Ágnes Gyakorlat 44 / 70
-
Kétoldali u-próba
Példa
Egy üzemben csöveket gyártanak, melyek hossza normális eloszlású 2 mmszórással. Véletlenszerűen kiválasztva 8 elkészült csövet és megmérvehosszukat az alábbi értékeket kaptuk:
199, 197, 196, 198, 199, 200, 202, 201.
95%-os döntési szintet használva vizsgálja meg azt az álĺıtást, hogy azüzemben gyártott csövek hossza átlagosan 200 mm.
A nullhipotézis:H0 : µ = 200,
az ellenhipotézis:H1 : µ 6= 200.
n = 8, σ = 2, α = 0.05, X = 199.
Baran Ágnes Gyakorlat 45 / 70
-
A próbastatisztika:
u =X − 200
σ
√n =
199− 2002
√8 = −1.4142
A kritikus tartomány (amikor elvetjük H0-at):
|u| ≥ Φ−1(
1− α2
)= Φ−1(0.975) = 1.96
Mivel|u| = 1.4142 < 1.96
ı́gy H0-at elfogadjuk.
Baran Ágnes Gyakorlat 46 / 70
-
Kétoldali u-próba
-3 -Φ-1(1- α /2) 0 Φ-1(1- α /2) 30
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
A kritikus és az elfogadási tartomány
Baran Ágnes Gyakorlat 47 / 70
-
A Matlab ztest függvényével:h=ztest(minta,µ0,σ)Ha h=0 akkor elfogadjuk, ha h=1 elvetjük H0-at 95%-os szinten.
X=[199, 197, 196, 198, 199, 200, 202, 201];
h=ztest(X,200,2)
h =
0
Így elfogadjuk H0-at.Kiszáḿıthatjuk a p-értéket és a várható értékre vonatkozó konfidenciaintervallumot is:
[h,p,Kint]=ztest(X,200,2)
h =
0
p =
0.1573
Kint =
197.6141 200.3859
Baran Ágnes Gyakorlat 48 / 70
-
Egyoldali u-próba
Példa
Egy tejipari vállalkozás 500 g-os kiszerelésben gyárt gyümölcsjoghurtokat,melyek átlagos gyümölcstartalma a dobozon található felirat szerint 10%.Több fogyasztói panasz érkezett, hogy a termék a megjelöltnél kevesebbgyümölcsöt tartalmaz, ı́gy a cég önellenőrzést tartott. Megvizsgálták 10véletlenszerűen kiválasztott termék gyümölcstartalmát, grammbankifejezve az alábbi értékeket kapták:
51, 45, 45, 51, 54, 50, 42, 53, 53, 50.
Feltételezve, hogy a joghurtok grammban kifejezett gyümölcstartalmanormális eloszlású 3 g szórással döntsön 98%-os szinten, hogy igaza van-ea vásárlóknak.
Baran Ágnes Gyakorlat 49 / 70
-
A nullhipotézis:H0 : µ = 50,
az ellenhipotézis:H1 : µ < 50.
n = 10, σ = 3, α = 0.02, X = 49.4. A próbastatisztika:
u =X − 50σ
√n =
49.4− 503
√10 = −0.6325
A kritikus tartomány (amikor elvetjük H0-at):
u ≤ Φ−1 (α) = Φ−1(0.02) = −2.0537
Mivel a kapott u érték ebbe nem esik bele, ezért elfogadjuk H0-at.
Baran Ágnes Gyakorlat 50 / 70
-
Egyoldali u-próba, baloldali ellenhipotézis
-3 Φ-1(α ) 0 30
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
A kritikus és az elfogadási tartomány
Megj.: Φ−1 (α) = −Φ−1 (1− α)
Baran Ágnes Gyakorlat 51 / 70
-
A Matlab ztest függvényével:
A baloldali ellenhipotézis és a 98%-os szint beálĺıtása:h=ztest(X,µ0,σ,’alpha’,0.02,’tail’,’left’)
Esetünkben:
X=[51, 45, 45, 51, 54, 50, 42, 53, 53, 50];
h=ztest(X,50,3,'alpha',0.02,'tail','left')
h =
0
Mivel h=0 a nullhipotézist elfogadjuk.
Baran Ágnes Gyakorlat 52 / 70
-
Egyoldali u-próba
Példa
Felmérések szerint az emberek átlagos IQ értéke 100. A sajtkésźıtőkszövetsége azt álĺıtja, hogy a sajtkésźıtéssel foglalkozó emberek esetén ezaz érték magasabb. 10 véletlenszerűen választott sajtkésźıtő IQ értékére azalábbiakat kaptuk:
104, 97, 104, 98, 103, 112, 99, 95, 102, 106.
Feltételezve, hogy az IQ érték normális eloszlású 3 szórással, döntsön98%-os szinten a szövetség álĺıtásáról.
A nullhipotézis:H0 : µ = 100,
az ellenhipotézis:H1 : µ > 100.
n = 10, σ = 3, α = 0.02, X = 102.
Baran Ágnes Gyakorlat 53 / 70
-
A próbastatisztika:
u =X − 100
σ
√n =
102− 1003
√10 = 2.1082
A kritikus tartomány (amikor elvetjük H0-at):
u > Φ−1 (1− α) = Φ−1(0.98) = 2.0537
Mivel a kapott u érték ebbe beleesik, ezért elvetjük H0-at (és boldogok asajtkésźıtők).
Baran Ágnes Gyakorlat 54 / 70
-
Egyoldali u-próba (jobboldali ellenhipotézis)
-3 0 Φ-1(1- α ) 30
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
Az elfogadási és a kritikus tartomány
Baran Ágnes Gyakorlat 55 / 70
-
A Matlab ztest függvényével:
X=[104, 97, 104, 98, 103, 112, 99, 95, 102, 106];
h=ztest(X,100,3,'alpha',0.02,'tail','right')
h =
1
Mivel h=1 a nullhipotézist elvetjük.Száḿıttassuk ki a p-értéket is!
[h,p]=ztest(X,100,3,'alpha',0.02,'tail','right')
h =
1
p =
0.0175
A p-értékből látjuk, hogy 99%-os szinten már elfogadtuk volna anullhipotézist.
Baran Ágnes Gyakorlat 56 / 70
-
t-eloszlás
Példa
Rajzoltassuk ki közös ábrán a standard normális eloszlás és az 5 és 10szabadsági fokú t-eloszlás sűrűségfüggvényét!
x=linspace(-5,5);
yn=pdf('normal',x,0,1);
y1=pdf('T',x,5);
y2=pdf('T',x,10);
figure; plot(x,yn,x,y1,x,y2)
legend('standard normalis','t_5','t_{10}')
Baran Ágnes Gyakorlat 57 / 70
-
t-eloszlás
-5 -4 -3 -2 -1 0 1 2 3 4 5
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
standard normális
t5
t10
Megj.: A t-eloszlás is szimmetrikus 0-ra.
Baran Ágnes Gyakorlat 58 / 70
-
t-próba
Példa
Egy fogkrémgyárban ellenőrizni szeretnék, hogy a 100 ml-es fogkrémektubusát töltő automata jól van-e kalibrálva. Véletlenszerűen kiválasztva 10tubust, lemérve a bennük lévő fogkrém mennyiségét a következő értékeketkapták.
102, 106, 93, 103, 101, 96, 99, 101, 111, 108
Feltételezve, hogy a tubusokba töltött fogkrém mennyisége normáliseloszlású, döntsön a fenti kérdésről 95%-os szinten.
A nullhipotézis:H0 : µ = 100
Az ellenhipotézis:H1 : µ 6= 100
n = 10, X = 102, s∗n = 5.3955, α = 0.05
Baran Ágnes Gyakorlat 59 / 70
-
A nullhipotézis:H0 : µ = 100
Az ellenhipotézis:H1 : µ 6= 100
n = 10, X = 102, s∗n = 5.3955, α = 0.05A próbastatisztika:
t =X − µ0
s∗n
√n = 1.1722
A kritikus tartomány (amikor elvetjük H0-at):
|t| ≥ tn−1(
1− α2
)= t9(0.975) = 2.262
Mivel az előbb kiszámolt t értékre ez nem teljesül, ezért H0-at elfogadjuk.
Baran Ágnes Gyakorlat 60 / 70
-
Az előző feladat megoldása Matlab-bal:
Használjuk a Matlab ttest függvényét.
h=ttest(X,µ0), ahol X a minta, µ0 a feltételezett várható érték. Ha h=0akkor 95%-os szinten (α = 0.05) elfogadjuk, ha h=1 akkor elvetjük anullhipotézist.
Ha más α érték mellett szeretnénk dönteni:h=ttest(X,µ0,’Alpha’,α)
Esetünkben:
X=[102 106 93 103 101 96 99 101 111 108];
h=ttest(X,100)
h =
0
Tehát elfogadjuk H0-at.
Baran Ágnes Gyakorlat 61 / 70
-
t-próba
Példa
Több vásárlói panasz érkezett, hogy a 100 ml-esként árult fogkrémektubusa a feltüntetettnél kevesebb fogkrémet tartalmaz. Az esetetkivizsgálandó megmérték 10 véletlenszerűen kiválasztott tubus tartalmát.Az alábbi értékeket kapták:
96, 94, 94, 105, 102, 98, 93, 94, 96, 99
Döntsön 95%-os szinten a fogyasztók álĺıtásáról.
A nullhipotézis:H0 : µ = 100
Az ellenhipotézis (baloldali):
H1 : µ < 100
n = 10, X = 97.1, s∗n = 3.9285, α = 0.05
Baran Ágnes Gyakorlat 62 / 70
-
A nullhipotézis:H0 : µ = 100
Az ellenhipotézis (baloldali):
H1 : µ < 100
n = 10, X = 97.1, s∗n = 3.9285, α = 0.05A próbastatisztika:
t =X − µ0
s∗n
√n = −2.3344
A kritikus tartomány (amikor elvetjük H0-at):
t ≤ tn−1(α) = −tn−1 (1− α) = −t9(0.95) = −1.833
Mivel az előbb kiszámolt t értékre ez teljesül, ezért H0-at elvetjük.
Baran Ágnes Gyakorlat 63 / 70
-
Az előző feladat megoldása Matlab-bal:
Mivel az ellenhipotézisünk baloldali, ı́gy
X =[96 94 94 105 102 98 93 94 96 99];
h=ttest(X,100,'tail','left')
h =
1
ami azt jelenti, hogy a nullhipotézist elvetjük. Kiszámolhatjuk a p-értéketis:
[h,p]=ttest(X,100,'tail','left')
h =
1
p =
0.0222
Innen látszik, hogy 99%-os szinten már elfogadtuk volna a nullhipotézist.
Baran Ágnes Gyakorlat 64 / 70
-
Párośıtott t-próba
Példa
Egy 10 kisebb üzletet működtető bolthálózat megmérte az egyes boltoknapi átlagos forgalmát:
X : 2987, 2976, 2995, 2971, 3000, 2989, 3044,
3023, 2950, 3009.
Ezután egy reklámkampányba kezdtek, azt remélve, hogy ezzel megnövelika forgalmat. A kampány után megismételték a mérést:
Y : 3011, 3018, 3050, 3003, 3036, 3026,
3015, 2999, 3014, 3018.
Feltételezve, hogy az üzletek forgalma normális eloszlású, döntsön 99%-osszinten a kampány eredményességéről.
Baran Ágnes Gyakorlat 65 / 70
-
Legyen Z = Y − X . Ekkor
Z : 24, 42, 55, 32, 36, 37, −29, −24, 64, 9.
A nullhipotézis:H0 : µZ = 0
Az ellenhipotézis (jobboldali):
H1 : µZ > 0.
n = 10, Z = 24.6, s∗n = 30.91, α = 0.01A próbastatisztika:
t =Z
s∗n
√n = 2.5171.
A kritikus tartomány:
t ≥ tn−1(1− α) = t9(0.99) = 2.821
Mivel a kiszámolt t érték ebbe nem esik bele, ezért H0-at elfogadjuk
Baran Ágnes Gyakorlat 66 / 70
-
Az előző feladat megoldása Matlab-bal:
Használjuk a Matlab ttest függvényét.
h=ttest(X,Y), ahol X és Y a két minta, kétoldali párośıtott t-próbátvégez, α = 0.05 mellett.
Ha jobboldali ellenhipotézisünk van, és α = 0.01, akkor
X=[2987 2976 2995 2971 3000 2989 3044 3023 2950 3009];
Y=[3011 3018 3050 3003 3036 3026 3015 2999 3014 3018];
h=ttest(Y,X,'tail','right','Alpha',0.01)
h =
0
Egyoldali ellenhipotézis esetén figyeljünk a minták sorrendére!
Baran Ágnes Gyakorlat 67 / 70
-
Független mintás t-próba
Példa
Egy tantárgy két különböző napon zajló ı́rásbeli vizsgájának nehézségétszeretnék összehasonĺıtani. Az első vizsganapon ı́rt dolgozatok közülvéletlenszerűen kiválasztva 10-et azok pontszámai az alábbiak:
X : 69, 82, 65, 73, 74, 84, 89, 83, 76, 88.
A második napon ı́rt dolgozatok közül 12-t választottunk, pontszámaik:
Y : 80, 61, 71, 87, 80, 70, 75, 83, 71, 91, 75, 99.
A mintákat független normális eloszlásúaknak feltételezve döntsön 95%-osszinten arról, hogy a két vizsga azonos nehézségű volt-e.
Baran Ágnes Gyakorlat 68 / 70
-
A megoldás Matlab-balElőször végezzünk egy F-próbát annak eldöntésére, hogy a szórásokmegegyeznek-e:A nullhipotézis:
H0 : σX = σY
Az ellenhipotézis:H1 : σX 6= σY .
X =[69 82 65 73 74 84 89 83 76 88];
Y =[80 61 71 87 80 70 75 83 71 91 75 99];
h=vartest2(X,Y)
h =
0
Azt kaptuk, hogy 95%-os szinten elfogadjuk a szórások egyenlőségét.
Baran Ágnes Gyakorlat 69 / 70
-
Ezután megh́ıvhatjuk a ttest2 függvényt.
A nullhipotézis:H0 : µX = µY
Az ellenhipotézis:H1 : µX 6= µY .
h=ttest2(X,Y)
h =
0
Tehát 95%-os szinten elfogadjuk H0-at.
Baran Ágnes Gyakorlat 70 / 70