您現在的位置是:首頁 > 攝影首頁攝影
離均差、方差、均方差、協方差之間的區別在哪?
什麼叫方差率
離均差、方差、均方差、協方差這幾個數學名詞都聽上去都差不多,可是在日常工作生活中能用得上這些概念的人應該不多,今天就來說說其中的差別。
要想搞清楚什麼是離均差、方差、均方差和協方差,得先從均值這個概念開始。哪怕是數學再不好的人,也應該知道算術平均數是怎麼回事吧。
以標準普爾500指數為例,在2018年9月10日至9月21日期間共有10個交易日,自然也就有10個標準普爾500指數的收盤價。將這10個交易日的標準普爾500指數收盤價相加後除以交易天數10,就會得出這10個交易日標準普爾500指數收盤價的均值2,902。46。
日期
標準普爾500指數X
均值
2018-9-10
2,877。13
2,902.46
2018-9-11
2,887。89
2018-9-12
2,888。92
2018-9-13
2,904。18
2018-9-14
2,904。98
2018-9-17
2,888。80
2018-9-18
2,904。31
2018-9-19
2,907。95
2018-9-20
2,930。75
2018-9-21
2,929。67
合計
29,024。58
有了均值,下面就可以計算離均差,
離均差就是一組資料中各個數值與該組資料均值的差異
。用上述10個交易日的收盤價分別減去均值2,902。46,可以得出每一個收盤價的離均差。
日期
標準普爾500指數X
均值M
離均差=X-M
2018-9-10
2,877。13
2,902。46
(25.33)
2018-9-11
2,887。89
(14.57)
2018-9-12
2,888。92
(13.54)
2018-9-13
2,904。18
1.72
2018-9-14
2,904。98
2.52
2018-9-17
2,888。80
(13.66)
2018-9-18
2,904。31
1.85
2018-9-19
2,907。95
5.49
2018-9-20
2,930。75
28.29
2018-9-21
2,929。67
27.21
離均差是計算方差的基礎,將離均差乘方,相加求和後再除以10求平均值,得出來的結果就是這組資料的方差,
方差衡量的也是一組資料中各個數值與該組資料均值的離散程度
。在下表中,方差等於280。7405。方差的計算公式為
,其中x為樣本平均值,n為樣本的大小。
日期
標準普爾500指數X
均值M
離均差
(
離均差)^2=σ2
2018-9-10
2,877。13
2,902。46
(25。33)
64
1。51
2018-9-11
2,887。89
(14。57)
212。23
2018-9-12
2,888。92
(13。54)
183
。28
2018-9-13
2,904。18
1。72
2。97
2018-9-14
2,904。98
2。52
6。36
2018-9-17
2,888。80
(13。66)
186
。54
2018-9-18
2,904。31
1。85
3。43
2018-9-19
2,907。95
5。49
30。16
2018-9-20
2,930。75
28。29
800。44
2018-9-21
2,929。67
27。21
740。49
合計
29,024。58
2,807。4055
280.7405
有了方差,標準差就迎刃而解了,因為標準差=方差的平方根,用σ表示。因此,前面這組資料的標準差=(280。7405)^(1/2)=16。7553。
且慢。。。以上的計算過程是基於該組資料是樣本資料的總體這一前提假設,也就是說在標準普爾500指數的歷史上只有2018年9月10日至9月21日這10個交易日的收盤價。當然這是不可能,因為這些資料只是抽樣資料,是為了舉例說明而給定的樣本資料而不是資料的全部,因此需要對以上計算過程略作調整。上表中的和2,807。4055應除以(10-1)而不是10,方差的結果變成311。9339,同樣標準差也就變成=(311。9339)^(1/2)=17。6617:
標準差又名均方差,是離均差平方的算術平均數的平方根,可用來
衡量一組資料中各個數值與該組資料均值的離散程度
。標準差的計算公式為
,其中x為樣本平均值,n為樣本的大小。標準差越大,說明該組資料中大部分資料與均值的差異較大。均值相等的兩組資料,標準差卻未必相同。比如,有A、B兩組資料,如下表所示,這兩組資料的均值都等於5。
A
B
3
4。8
5
5。2
4
4。3
6
5。7
7
5
但各資料偏離均值的程度是有差異的。。。,可以看到均值相等的兩組資料中,A組中各個資料之間的差異程度要高於B組。
小結一下:
方差是標準差的平方,是離均差平方的和的均值。
透過以上的演示計算,可以看到離均差、方差、標準差衡量的都是某一組資料內部各數值偏離均值的程度,通俗地講是自己跟自己比。但下面介紹的協方差比較的是兩組資料之間的差異程度。協方差的計算公式為
其中
是兩個資料系列的樣本平均值,x、y為資料系列中的單個數據,n為樣本的大小。
如果用於比較的兩組資料完全相同,那麼其方差和協方差的計算結果是一致的,因此方差只是協方差的一個特例。
有了方差和協方差,下一步就可以計算相關係數了,公式為
其中是兩個資料系列的樣本平均值,x、y為資料系列中的單個數據,n為樣本的大小。
需要注意,如果用協方差計算相關係數,協方差中的x、y假設為全體資料,因此協方差公式中的標準差計算時,需要除以n而不是n-1。
以西德克薩斯輕質原油和標準普爾500指數為例,計算其收益率之間的相關係數,收盤價取值日期為2018年9月10日至9月21日。
分佈推導的結果與EXCEL自帶函式計算結果相符。