(一)抽樣分布的概念
統(tǒng)計量的分布稱為抽樣分布。為了說明抽樣分布概念,我們先考察下面的例子。
[例1.3-9] 圖1.3-7左側(cè)為一個總體,右側(cè)是從該總體隨機抽取的4個樣本,每個樣本均有5個觀測值。
從上面的例子可以看出:
(1)每一個統(tǒng)計量都有一個抽樣分布。
(2)不同的統(tǒng)計量可得不同的抽樣分布。
抽樣分布將是今后進行統(tǒng)計推斷的基礎,一些抽樣分布可通過上述抽樣方法獲得,但是,當樣本來自某個正態(tài)總體 時,其樣本均值 ,樣本方差 ,以及它們的某種組合的抽樣分布已在理論上被導出,我們將敘述其中三個,即 分布, 分布和F分布,號稱“三大抽樣分布”。在這之前,我們先回憶一下樣本均值 的分布。
(二)樣本均值 的抽樣分布
從抽樣分布角度看,中心極限定理一節(jié)告訴我們:
(1)當總體分布為正態(tài)分布 時,其樣本均值 的抽樣分布(精確地)為 , 的標準差 。
(2)當總體分布不為正態(tài)分布時,只要其總體均值 與總體方差 存在,則在n較大時,其樣本均值 的抽樣分布近似于 ,, 的標準差 。
[例1.3-10] 樣本均值 的抽樣分布的例子。
(1)設 是來自正態(tài)總體N(5,1)的一個樣本,則其樣本均值 ~N(5,O.2)。 .
(2)設 是來自參數(shù)為 的指數(shù)分布的一個樣本,若 =0.04,則該指數(shù)分布的均值與方差分別為:
而該樣本均值 ,其中符號“~”表示“近似服從”。
(3)設 是來自二點分布b(1,p)的一個樣本,若p=0.02,則該二點分布的均值與方差分別為:
E(x)=p=0.02
Var(x)=p(1-p)=0.02×0.98=0.0196
而其樣本均值 =N(0.02,0.01982)。
(4)設 是來自泊松分布P( )的一個樣本,則其樣本均值 。
(5)在例1.3-9中所涉總體是僅含20個數(shù)的有限總體,該總體可用如下隨機變量x及其分布表示
X 8 9 10 11 12 13
P
容易算出該總體的均值與方差,它們分別為
E(x)=10.3 Var(x)=1.81
若從該總體每次(可重復)取出樣本量為n的一個樣本,則樣本均值 近似服從N(10.3,1.81/n)。比如
n=5, ~N(10.3,0.362)
n=10, ~N(10.3,0.181)
(三)三大抽樣分布
(1)t分布
首先,我們應把注意力放在服從t分布的t變量的構(gòu)造上。
設 是來自正態(tài)總體 的一個樣本,則有:
對樣本均值 施行標準化變換,則有:
當用樣本標準差s代替上式中的總體標準差 ,則上式u變量改為t變量,標準正態(tài)分布N(0,1)也隨之改為“自由度為n-1的t分布”,記為t(n-1),即:
自由度為n-1的t分布的概率密度函數(shù)與標準正態(tài)分布N(0,1)的概率密度函數(shù)的圖形大致類似,均為對稱分布,但它的峰比N(0,1)的峰略低一些,而兩側(cè)尾部要比N(O,1)的兩側(cè)尾部略粗一點,參見圖1.3-8。當自由度超過30后,兩者區(qū)別已很小,這時可用N(0,1)代替t(n-1)。
(2) 分布
設 是來自正態(tài)總體 的一個樣本,則其樣本方差 的n-1倍(也即離差平方和 除以總體方差 的分布是自由度為n-1的 分布,記為 ,即:
自由度為n-1的 分布的概率密度函數(shù)在正半軸上呈偏態(tài)分布,參見圖1.3-9。
(3)F分布
設有兩個獨立的正態(tài)總體 和 ,它們的方差相等。又設 是來自 的一個樣本; 是來自 的一個樣本,兩個樣本相互獨立。它們的樣本方差比的分布是自由度為n-1和m-l的F分布:
其中n-1稱為分子自由度或第1自由度;m-1稱為分母自由度或第2自由度。F分布的概率密度函數(shù)在正半軸上呈偏態(tài)分布,參見圖1.3-10。中 華 考 試 網(wǎng)
來源:考試網(wǎng)-質(zhì)量工程師考試