excel...excelの分析ツールで相関係数を算出 するとr=0 近似式ではr2=1...

14
y = x 2 R² = 1 -20 0 20 40 60 80 100 120 -15 -10 -5 0 5 10 15 下図の二次曲線の相関係数Rはいくつですか? 相関係数Rは 0(ゼロ)です では、二次曲線の決定係数R はいくつですか? 決定係数R 2 1です Excelの分析ツールで相関係数を算出 するとR=0 近似式ではR =1 RとR の数値が合いませんね RとR の成り立ちが違うからな のです。ここ理解してください

Upload: others

Post on 23-Jan-2021

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Excel...Excelの分析ツールで相関係数を算出 するとR=0 近似式ではR2=1 RとR2の数値が合いませんね RとR2の成り立ちが違うからな のです。ここ理解してください

y = x2

R² = 1

-20

0

20

40

60

80

100

120

-15 -10 -5 0 5 10 15

下図の二次曲線の相関係数Rはいくつですか?

相関係数Rは 0(ゼロ)です

では、二次曲線の決定係数R2はいくつですか?

決定係数R2は 1です

Excelの分析ツールで相関係数を算出するとR=0 近似式ではR2=1 RとR2の数値が合いませんね ⇓ RとR2の成り立ちが違うからなのです。ここ理解してください

Page 2: Excel...Excelの分析ツールで相関係数を算出 するとR=0 近似式ではR2=1 RとR2の数値が合いませんね RとR2の成り立ちが違うからな のです。ここ理解してください
Page 3: Excel...Excelの分析ツールで相関係数を算出 するとR=0 近似式ではR2=1 RとR2の数値が合いませんね RとR2の成り立ちが違うからな のです。ここ理解してください

相関のパターン ①正の相関:横軸の値が大きくなるほど、縦軸の値も大きくなる

②負の相関:横軸の値が大きくなるほど、縦軸の値は小さくなる

③無相関 :横軸の値と 縦軸の値に明確な関係がない

0.2 ≦ R≦1 -1 ≦R ≦ -0.2 -0.2 ≦R ≦ 0.2

相関係数 相関の強さ

0.7≦R≦1.0 強い正の相関

0.4≦R≦0.7 正の相関

0.2≦R≦0.4 弱い正の相関

-0.2≦R≦0.2 ほとんど相関がない

-0.4≦R≦-0.2 弱い負の相関

-0.7≦R≦-0.4 負の相関

-1.0≦R≦-0.7 強い負の相関

Page 4: Excel...Excelの分析ツールで相関係数を算出 するとR=0 近似式ではR2=1 RとR2の数値が合いませんね RとR2の成り立ちが違うからな のです。ここ理解してください

1𝑛 (𝑥𝑖 −𝑛𝑖=1 𝑥 )(𝑦𝑖 − 𝑦 )

1𝑛 (𝑥𝑖 − 𝑥 )2𝑛𝑖=1 ×

1𝑛 (𝑦𝑖 − 𝑦 )2𝑛𝑖=1

= (𝑥𝑖 −𝑛𝑖=1 𝑥 )(𝑦𝑖 − 𝑦 )

(𝑥𝑖 − 𝑥 )2𝑛𝑖=1 × (𝑦𝑖 − 𝑦 )2𝑛

𝑖=1

相関係数 = 共分散の平均

(𝑥の標準偏差)×(𝑦の標準偏差)

相関係数

分子は負の値をとることもありますので、 相関係数は負の値もあります

Page 5: Excel...Excelの分析ツールで相関係数を算出 するとR=0 近似式ではR2=1 RとR2の数値が合いませんね RとR2の成り立ちが違うからな のです。ここ理解してください

-1≦相関係数r≦ 1

θ=0°cosθ=1 r=1

θ=90°cosθ=0 r=0

相関がない 直交している

Page 6: Excel...Excelの分析ツールで相関係数を算出 するとR=0 近似式ではR2=1 RとR2の数値が合いませんね RとR2の成り立ちが違うからな のです。ここ理解してください

(𝑥 , 𝑦 )

(𝑥𝑖 , 𝑦𝑖)

(𝑥𝑖 , 𝑦 )

𝑦 = 𝐴x +𝐵 𝒆𝒊 = 𝒚𝒊 − 𝒚

𝒚 − 𝒚 𝒚𝒊 − 𝒚

残差変動

回帰変動

全変動

推定される回帰式

𝒊 番目のデータ

予測値

平均値

全変動の平方和=回帰変動の平方和+残差変動の平方和 全変動の平方和= (𝒚𝒊 − 𝒚 )𝟐𝒏

𝒊=𝟏

残差変動の平方和= (𝒚𝒊 − 𝒚𝒊 )𝟐𝒏

𝒊=𝟏

回帰変動の平方和= (𝒚𝒊 − 𝒚 )𝟐𝒏𝒊=𝟏

下図は、品質工学、分散分析及びGRR( Gage Repeatability and Reproducibility)全てに共通した概念です。

Page 7: Excel...Excelの分析ツールで相関係数を算出 するとR=0 近似式ではR2=1 RとR2の数値が合いませんね RとR2の成り立ちが違うからな のです。ここ理解してください

全変動の平方和=回帰変動の平方和+残差変動の平方和 全変動の平方和= (𝒚𝒊 − 𝒚 )𝟐𝒏

𝒊=𝟏

残差変動の平方和= (𝒚𝒊 − 𝒚𝒊 )

𝟐𝒏𝒊=𝟏

回帰変動の平方和= (𝒚𝒊 − 𝒚 )𝟐𝒏

𝒊=𝟏

𝑥 , 𝑦 = 0,0 (𝑥1, 𝑦1) = 1,2 (𝑥2, 𝑦2) = 2,2 (𝑥3, 𝑦3) = 3,2 のとき 全変動 =(2 − 0)2+(2 − 0)2+(2 − 0)2 =12 残差変動=(2 − 1)2+(2 − 2)2+(2 − 3)2 =2 回帰変動=(1 − 0)2+(2 − 0)2+(3 − 0)2 =14 全変動=回帰変動+残差変動=14+2=14

具体的な数字を入れると理解が深まります

Page 8: Excel...Excelの分析ツールで相関係数を算出 するとR=0 近似式ではR2=1 RとR2の数値が合いませんね RとR2の成り立ちが違うからな のです。ここ理解してください

(𝑥𝑖 , 𝑦𝑖) 𝑦 = 𝐴𝑥 + 𝐵

𝒆𝒊 = 𝒚𝒊 − 𝒚 残差変動

推定される回帰式 𝒊 番目のデータ

最小二乗法を用いて、回帰式を求めます 最小二乗法とは、 残差の平方和 𝑦𝑖 − (𝐴𝑥𝑖 + 𝐵) 2𝑛

𝑖=1 が最小となる回帰式の

AとBを求める手法

𝑦𝑖

𝒚

𝒚 = 𝐴𝑥𝑖 + 𝐵

Page 9: Excel...Excelの分析ツールで相関係数を算出 するとR=0 近似式ではR2=1 RとR2の数値が合いませんね RとR2の成り立ちが違うからな のです。ここ理解してください

残差の平方和S 𝑆 = 𝑦𝑖 − (𝐴𝑥𝑖 + 𝐵) 2𝑛𝑖=1 が最小となるのは

𝑆 = 𝑦𝑖 − (𝐴𝑥𝑖 + 𝐵) 2

𝑛

𝑖=1

= 𝑦𝑖2 − 2𝑦𝑖(𝐴𝑥𝑖 + 𝐵) + (𝐴𝑥𝑖 + 𝐵)2

𝑛

𝑖−1

= 𝑦𝑖2 − 2𝐴𝑥𝑖𝑦𝑖 − 2𝐵𝑦𝑖 + 𝐴2𝑥𝑖

2 + 2𝐴𝐵𝑥𝑖 + 𝐵2

𝑛

𝑖−1

𝑆 = 𝐴2 𝑥𝑖2 + 𝑛𝐵2 + 𝑦𝑖

2 − 2𝐴 𝑥𝑖𝑦𝑖

𝑛

𝑖=1

− 2𝐵 𝑦𝑖 + 2𝐴𝐵 𝑥𝑖

𝑛

𝐼=1

𝑛

𝐼=1

𝑛

𝑖=1

𝑛

𝑖=1

𝜕𝑆

𝜕𝐴= 2𝑨 𝑥𝑖

2

𝑛

𝑖=1

− 2 𝑥𝑖𝑦𝑖

𝑛

𝑖=1

+ 2𝑩 𝑥𝑖

𝑛

𝐼=1

= 0

𝜕𝑆

𝜕𝐵= 2𝑛𝑩 − 2 𝑦𝑖

𝑛

𝐼=1

+ 2𝑨 𝑥𝑖

𝑛

𝐼=1

= 0

𝑦𝑖

𝑛

𝐼=1

− 𝑛𝑩 − 𝑨 𝑥𝑖

𝑛

𝐼=1

= 0

𝑩 =1

𝑛 𝑦𝑖

𝑛

𝐼=1

−𝑨

𝑛 𝑥𝑖

𝑛

𝐼=1

=𝑛𝒚

𝑛−𝑛𝑨𝒙

𝑛= 𝒚 − 𝑨𝒙

Page 10: Excel...Excelの分析ツールで相関係数を算出 するとR=0 近似式ではR2=1 RとR2の数値が合いませんね RとR2の成り立ちが違うからな のです。ここ理解してください

𝑥𝑖𝑦𝑖

𝑛

𝑖=1

− 𝑨 𝑥𝑖2

𝑛

𝑖=1

− 𝑩 𝑥𝑖

𝑛

𝐼=1

= 0 𝑩 = 𝒚 − 𝑨𝒙 を代入して𝑨について解く

𝑨 = 𝑥𝑖𝑛𝑖=1 𝑦𝑖 − 𝑦 𝑥𝑖

𝑛𝑖=1

𝑥𝑖2 − 𝑥 𝑥𝑖

𝑛𝑖=1

𝑛𝑖=1

= 𝑥𝑖𝑛𝑖=1 𝑦𝑖 − 𝑛𝑥 𝑦 − 𝑛𝑥 𝑦 + 𝑛𝑥 𝑦

𝑥𝑖2 − 2𝑥 𝑥𝑖 + 𝑥 𝑛

𝑖=1𝑛𝑖=1 𝑥𝑖

𝑛𝑖=1

= 𝑥𝑖𝑛𝑖=1 𝑦𝑖 − 𝑥 𝑦𝑖 − 𝑦 𝑥𝑖 + 𝑥 𝑦 𝑛

𝐼=1𝑛𝑖=1

𝑛𝑖=1

𝑥𝑖2𝑛

𝑖=1 − 2𝑛𝑥 2 + 𝑛𝑥 2

=

(𝑥𝑖 − 𝑥 )(𝑦𝑖 − 𝑦 )𝑛𝑖=1

𝑛 (𝑥𝑖 − 𝑥 )2𝑛𝑖=1

𝑛

=𝜎𝑥𝑦

𝜎𝑥2

𝑦 − 𝑦 =𝜎𝑥𝑦

𝜎𝑥2(𝑥 − 𝑥 )

最小二乗法の公式

𝑥

𝑦

各点の平均値からのx及びyの偏差の掛算(共分散)をxのばらつき(分散)で割ったもの

勾配 𝜎𝑥𝑦

𝜎𝑥2

Page 11: Excel...Excelの分析ツールで相関係数を算出 するとR=0 近似式ではR2=1 RとR2の数値が合いませんね RとR2の成り立ちが違うからな のです。ここ理解してください

𝜕𝑆

𝜕𝐴= 2𝑨 𝑥𝑖

2

𝑛

𝑖=1

− 2 𝑥𝑖𝑦𝑖

𝑛

𝑖=1

+ 2𝑩 𝑥𝑖

𝑛

𝐼=1

= 0

𝜕𝑆

𝜕𝐵= 2𝑛𝑩 − 2 𝑦𝑖

𝑛

𝐼=1

+ 2𝑨 𝑥𝑖

𝑛

𝐼=1

= 0

𝑨 𝑥𝑖2

𝑛

𝑖=1

+ 𝑩 𝑥𝑖

𝑛

𝐼=1

= 𝑥𝑖𝑦𝑖

𝑛

𝑖=1

𝑨 𝑥𝑖

𝑛

𝐼=1

+ 𝑛𝑩 = 𝑦𝑖

𝑛

𝐼=1

𝑥𝑖2

𝑛

𝑖=1

𝑥𝑖

𝑛

𝐼=1

𝑥𝑖

𝑛

𝐼=1

AB

=

𝑥𝑖𝑦𝑖

𝑛

𝑖=1

𝑦𝑖

𝑛

𝐼=1

AB

=

𝑥𝑖2

𝑛

𝑖=1

𝑥𝑖

𝑛

𝐼=1

𝑥𝑖

𝑛

𝐼=1

−1

𝑥𝑖𝑦𝑖

𝑛

𝑖=1

𝑦𝑖

𝑛

𝐼=1

上記連立方程式を行列を解いてA及びBを算出する

逆行列

次数が増えた場合は行列を解く方が容易

Page 12: Excel...Excelの分析ツールで相関係数を算出 するとR=0 近似式ではR2=1 RとR2の数値が合いませんね RとR2の成り立ちが違うからな のです。ここ理解してください

決定係数R2

𝑦𝑖 − 𝑦 =𝜎𝑥𝑦

𝜎𝑥2(𝑥𝑖 − 𝑥 )+ 𝑒𝑖

(𝑥 , 𝑦 )

(𝑥𝑖 , 𝑦𝑖)

𝑦 = 𝐴x +𝐵 残差変動

𝒆𝒊

推定される回帰式

平均値

𝑥𝑖 − 𝑥

𝜎𝑥𝑦

𝜎𝑥2(𝑥𝑖 − 𝑥 )

(𝑦𝑖 − 𝑦 )2𝑛

𝑖=1

= (𝜎𝑥𝑦

𝜎𝑥2)2 (𝑥𝑖 − 𝑥 )2

𝑛

𝑖=1

+ 𝑒𝑖2

𝑛

𝑖=1

𝑅2 =(𝜎𝑥𝑦𝜎𝑥

2)2 (𝑥𝑖 − 𝑥 )2𝑛

𝑖=1

(𝑦𝑖 − 𝑦 )2𝑛𝑖=1

= 1 − 𝑒𝑖

2𝑛𝑖=1

(𝑦𝑖 − 𝑦 )2𝑛𝑖=1

𝑅2 =回帰変動の平方和

全体変動の平方和= 1 −

残差変動の平方和

全体変動の平方和

回帰式への 当てはまり度

Page 13: Excel...Excelの分析ツールで相関係数を算出 するとR=0 近似式ではR2=1 RとR2の数値が合いませんね RとR2の成り立ちが違うからな のです。ここ理解してください

決定係数𝑹𝟐 =(𝜎𝑥𝑦𝜎𝑥

2)2 (𝑥𝑖 − 𝑥 )2𝑛

𝑖=1

(𝑦𝑖 − 𝑦 )2𝑛𝑖=1

=(𝜎𝑥𝑦𝜎𝑥

2)2 (𝑥𝑖 − 𝑥 )2𝑛

𝑖=1𝑛

(𝑦𝑖 − 𝑦 )2𝑛𝑖=1

𝑛

=(𝜎𝑥𝑦

𝜎𝑥2)2

(𝑥𝑖−𝑥 )2𝑛

𝑖=1𝑛

2

(𝑦𝑖−𝑦 )2𝑛

𝑖=1𝑛

2 =(𝜎𝑥𝑦

𝜎𝑥2)2(𝜎𝑥

2)

𝜎𝑦2 = (

𝜎𝑥𝑦

𝜎𝑥𝜎𝑦)2

=(相関係数𝑹)𝟐

決定係数R2は相関係数Rの二乗である (直線近似の場合)

相関係数と決定係数は、別の目的で定義付けされたが、 直線近似の場合は、上述の関係になっています

Page 14: Excel...Excelの分析ツールで相関係数を算出 するとR=0 近似式ではR2=1 RとR2の数値が合いませんね RとR2の成り立ちが違うからな のです。ここ理解してください

相関係数𝑹 =𝜎𝑥𝑦

𝜎𝑥𝜎𝑦=𝜎𝑥𝑦

𝜎𝑥2∙𝜎𝑥𝜎𝑦

=勾配𝐴 ∙𝜎𝑥𝜎𝑦

𝐱と𝐲のばらつきが同じであれば、相関係数と勾配𝐀は同じ値