excel...excelの分析ツールで相関係数を算出 するとr=0 近似式ではr2=1...
TRANSCRIPT
y = x2
R² = 1
-20
0
20
40
60
80
100
120
-15 -10 -5 0 5 10 15
下図の二次曲線の相関係数Rはいくつですか?
相関係数Rは 0(ゼロ)です
では、二次曲線の決定係数R2はいくつですか?
決定係数R2は 1です
Excelの分析ツールで相関係数を算出するとR=0 近似式ではR2=1 RとR2の数値が合いませんね ⇓ RとR2の成り立ちが違うからなのです。ここ理解してください
相関のパターン ①正の相関:横軸の値が大きくなるほど、縦軸の値も大きくなる
②負の相関:横軸の値が大きくなるほど、縦軸の値は小さくなる
③無相関 :横軸の値と 縦軸の値に明確な関係がない
0.2 ≦ R≦1 -1 ≦R ≦ -0.2 -0.2 ≦R ≦ 0.2
相関係数 相関の強さ
0.7≦R≦1.0 強い正の相関
0.4≦R≦0.7 正の相関
0.2≦R≦0.4 弱い正の相関
-0.2≦R≦0.2 ほとんど相関がない
-0.4≦R≦-0.2 弱い負の相関
-0.7≦R≦-0.4 負の相関
-1.0≦R≦-0.7 強い負の相関
1𝑛 (𝑥𝑖 −𝑛𝑖=1 𝑥 )(𝑦𝑖 − 𝑦 )
1𝑛 (𝑥𝑖 − 𝑥 )2𝑛𝑖=1 ×
1𝑛 (𝑦𝑖 − 𝑦 )2𝑛𝑖=1
= (𝑥𝑖 −𝑛𝑖=1 𝑥 )(𝑦𝑖 − 𝑦 )
(𝑥𝑖 − 𝑥 )2𝑛𝑖=1 × (𝑦𝑖 − 𝑦 )2𝑛
𝑖=1
相関係数 = 共分散の平均
(𝑥の標準偏差)×(𝑦の標準偏差)
相関係数
分子は負の値をとることもありますので、 相関係数は負の値もあります
-1≦相関係数r≦ 1
θ=0°cosθ=1 r=1
θ=90°cosθ=0 r=0
相関がない 直交している
(𝑥 , 𝑦 )
(𝑥𝑖 , 𝑦𝑖)
(𝑥𝑖 , 𝑦 )
𝑦 = 𝐴x +𝐵 𝒆𝒊 = 𝒚𝒊 − 𝒚
𝒚 − 𝒚 𝒚𝒊 − 𝒚
残差変動
回帰変動
全変動
推定される回帰式
𝒊 番目のデータ
予測値
平均値
全変動の平方和=回帰変動の平方和+残差変動の平方和 全変動の平方和= (𝒚𝒊 − 𝒚 )𝟐𝒏
𝒊=𝟏
残差変動の平方和= (𝒚𝒊 − 𝒚𝒊 )𝟐𝒏
𝒊=𝟏
回帰変動の平方和= (𝒚𝒊 − 𝒚 )𝟐𝒏𝒊=𝟏
下図は、品質工学、分散分析及びGRR( Gage Repeatability and Reproducibility)全てに共通した概念です。
全変動の平方和=回帰変動の平方和+残差変動の平方和 全変動の平方和= (𝒚𝒊 − 𝒚 )𝟐𝒏
𝒊=𝟏
残差変動の平方和= (𝒚𝒊 − 𝒚𝒊 )
𝟐𝒏𝒊=𝟏
回帰変動の平方和= (𝒚𝒊 − 𝒚 )𝟐𝒏
𝒊=𝟏
𝑥 , 𝑦 = 0,0 (𝑥1, 𝑦1) = 1,2 (𝑥2, 𝑦2) = 2,2 (𝑥3, 𝑦3) = 3,2 のとき 全変動 =(2 − 0)2+(2 − 0)2+(2 − 0)2 =12 残差変動=(2 − 1)2+(2 − 2)2+(2 − 3)2 =2 回帰変動=(1 − 0)2+(2 − 0)2+(3 − 0)2 =14 全変動=回帰変動+残差変動=14+2=14
具体的な数字を入れると理解が深まります
(𝑥𝑖 , 𝑦𝑖) 𝑦 = 𝐴𝑥 + 𝐵
𝒆𝒊 = 𝒚𝒊 − 𝒚 残差変動
推定される回帰式 𝒊 番目のデータ
最小二乗法を用いて、回帰式を求めます 最小二乗法とは、 残差の平方和 𝑦𝑖 − (𝐴𝑥𝑖 + 𝐵) 2𝑛
𝑖=1 が最小となる回帰式の
AとBを求める手法
𝑦𝑖
𝒚
𝒚 = 𝐴𝑥𝑖 + 𝐵
残差の平方和S 𝑆 = 𝑦𝑖 − (𝐴𝑥𝑖 + 𝐵) 2𝑛𝑖=1 が最小となるのは
𝑆 = 𝑦𝑖 − (𝐴𝑥𝑖 + 𝐵) 2
𝑛
𝑖=1
= 𝑦𝑖2 − 2𝑦𝑖(𝐴𝑥𝑖 + 𝐵) + (𝐴𝑥𝑖 + 𝐵)2
𝑛
𝑖−1
= 𝑦𝑖2 − 2𝐴𝑥𝑖𝑦𝑖 − 2𝐵𝑦𝑖 + 𝐴2𝑥𝑖
2 + 2𝐴𝐵𝑥𝑖 + 𝐵2
𝑛
𝑖−1
𝑆 = 𝐴2 𝑥𝑖2 + 𝑛𝐵2 + 𝑦𝑖
2 − 2𝐴 𝑥𝑖𝑦𝑖
𝑛
𝑖=1
− 2𝐵 𝑦𝑖 + 2𝐴𝐵 𝑥𝑖
𝑛
𝐼=1
𝑛
𝐼=1
𝑛
𝑖=1
𝑛
𝑖=1
𝜕𝑆
𝜕𝐴= 2𝑨 𝑥𝑖
2
𝑛
𝑖=1
− 2 𝑥𝑖𝑦𝑖
𝑛
𝑖=1
+ 2𝑩 𝑥𝑖
𝑛
𝐼=1
= 0
𝜕𝑆
𝜕𝐵= 2𝑛𝑩 − 2 𝑦𝑖
𝑛
𝐼=1
+ 2𝑨 𝑥𝑖
𝑛
𝐼=1
= 0
𝑦𝑖
𝑛
𝐼=1
− 𝑛𝑩 − 𝑨 𝑥𝑖
𝑛
𝐼=1
= 0
𝑩 =1
𝑛 𝑦𝑖
𝑛
𝐼=1
−𝑨
𝑛 𝑥𝑖
𝑛
𝐼=1
=𝑛𝒚
𝑛−𝑛𝑨𝒙
𝑛= 𝒚 − 𝑨𝒙
𝑥𝑖𝑦𝑖
𝑛
𝑖=1
− 𝑨 𝑥𝑖2
𝑛
𝑖=1
− 𝑩 𝑥𝑖
𝑛
𝐼=1
= 0 𝑩 = 𝒚 − 𝑨𝒙 を代入して𝑨について解く
𝑨 = 𝑥𝑖𝑛𝑖=1 𝑦𝑖 − 𝑦 𝑥𝑖
𝑛𝑖=1
𝑥𝑖2 − 𝑥 𝑥𝑖
𝑛𝑖=1
𝑛𝑖=1
= 𝑥𝑖𝑛𝑖=1 𝑦𝑖 − 𝑛𝑥 𝑦 − 𝑛𝑥 𝑦 + 𝑛𝑥 𝑦
𝑥𝑖2 − 2𝑥 𝑥𝑖 + 𝑥 𝑛
𝑖=1𝑛𝑖=1 𝑥𝑖
𝑛𝑖=1
= 𝑥𝑖𝑛𝑖=1 𝑦𝑖 − 𝑥 𝑦𝑖 − 𝑦 𝑥𝑖 + 𝑥 𝑦 𝑛
𝐼=1𝑛𝑖=1
𝑛𝑖=1
𝑥𝑖2𝑛
𝑖=1 − 2𝑛𝑥 2 + 𝑛𝑥 2
=
(𝑥𝑖 − 𝑥 )(𝑦𝑖 − 𝑦 )𝑛𝑖=1
𝑛 (𝑥𝑖 − 𝑥 )2𝑛𝑖=1
𝑛
=𝜎𝑥𝑦
𝜎𝑥2
𝑦 − 𝑦 =𝜎𝑥𝑦
𝜎𝑥2(𝑥 − 𝑥 )
最小二乗法の公式
𝑥
𝑦
各点の平均値からのx及びyの偏差の掛算(共分散)をxのばらつき(分散)で割ったもの
勾配 𝜎𝑥𝑦
𝜎𝑥2
𝜕𝑆
𝜕𝐴= 2𝑨 𝑥𝑖
2
𝑛
𝑖=1
− 2 𝑥𝑖𝑦𝑖
𝑛
𝑖=1
+ 2𝑩 𝑥𝑖
𝑛
𝐼=1
= 0
𝜕𝑆
𝜕𝐵= 2𝑛𝑩 − 2 𝑦𝑖
𝑛
𝐼=1
+ 2𝑨 𝑥𝑖
𝑛
𝐼=1
= 0
𝑨 𝑥𝑖2
𝑛
𝑖=1
+ 𝑩 𝑥𝑖
𝑛
𝐼=1
= 𝑥𝑖𝑦𝑖
𝑛
𝑖=1
𝑨 𝑥𝑖
𝑛
𝐼=1
+ 𝑛𝑩 = 𝑦𝑖
𝑛
𝐼=1
𝑥𝑖2
𝑛
𝑖=1
𝑥𝑖
𝑛
𝐼=1
𝑥𝑖
𝑛
𝐼=1
n
AB
=
𝑥𝑖𝑦𝑖
𝑛
𝑖=1
𝑦𝑖
𝑛
𝐼=1
AB
=
𝑥𝑖2
𝑛
𝑖=1
𝑥𝑖
𝑛
𝐼=1
𝑥𝑖
𝑛
𝐼=1
n
−1
𝑥𝑖𝑦𝑖
𝑛
𝑖=1
𝑦𝑖
𝑛
𝐼=1
上記連立方程式を行列を解いてA及びBを算出する
逆行列
次数が増えた場合は行列を解く方が容易
決定係数R2
𝑦𝑖 − 𝑦 =𝜎𝑥𝑦
𝜎𝑥2(𝑥𝑖 − 𝑥 )+ 𝑒𝑖
(𝑥 , 𝑦 )
(𝑥𝑖 , 𝑦𝑖)
𝑦 = 𝐴x +𝐵 残差変動
𝒆𝒊
推定される回帰式
平均値
𝑥𝑖 − 𝑥
𝜎𝑥𝑦
𝜎𝑥2(𝑥𝑖 − 𝑥 )
(𝑦𝑖 − 𝑦 )2𝑛
𝑖=1
= (𝜎𝑥𝑦
𝜎𝑥2)2 (𝑥𝑖 − 𝑥 )2
𝑛
𝑖=1
+ 𝑒𝑖2
𝑛
𝑖=1
𝑅2 =(𝜎𝑥𝑦𝜎𝑥
2)2 (𝑥𝑖 − 𝑥 )2𝑛
𝑖=1
(𝑦𝑖 − 𝑦 )2𝑛𝑖=1
= 1 − 𝑒𝑖
2𝑛𝑖=1
(𝑦𝑖 − 𝑦 )2𝑛𝑖=1
𝑅2 =回帰変動の平方和
全体変動の平方和= 1 −
残差変動の平方和
全体変動の平方和
回帰式への 当てはまり度
決定係数𝑹𝟐 =(𝜎𝑥𝑦𝜎𝑥
2)2 (𝑥𝑖 − 𝑥 )2𝑛
𝑖=1
(𝑦𝑖 − 𝑦 )2𝑛𝑖=1
=(𝜎𝑥𝑦𝜎𝑥
2)2 (𝑥𝑖 − 𝑥 )2𝑛
𝑖=1𝑛
(𝑦𝑖 − 𝑦 )2𝑛𝑖=1
𝑛
=(𝜎𝑥𝑦
𝜎𝑥2)2
(𝑥𝑖−𝑥 )2𝑛
𝑖=1𝑛
2
(𝑦𝑖−𝑦 )2𝑛
𝑖=1𝑛
2 =(𝜎𝑥𝑦
𝜎𝑥2)2(𝜎𝑥
2)
𝜎𝑦2 = (
𝜎𝑥𝑦
𝜎𝑥𝜎𝑦)2
=(相関係数𝑹)𝟐
決定係数R2は相関係数Rの二乗である (直線近似の場合)
相関係数と決定係数は、別の目的で定義付けされたが、 直線近似の場合は、上述の関係になっています
相関係数𝑹 =𝜎𝑥𝑦
𝜎𝑥𝜎𝑦=𝜎𝑥𝑦
𝜎𝑥2∙𝜎𝑥𝜎𝑦
=勾配𝐴 ∙𝜎𝑥𝜎𝑦
𝐱と𝐲のばらつきが同じであれば、相関係数と勾配𝐀は同じ値