第八講 統(tǒng)計(jì)量、抽樣分布
一、考試要求
1.掌握統(tǒng)計(jì)量的概念
2.掌握樣本均值和樣本中位數(shù)概念及其計(jì)算方法
3.掌握樣本極差、樣本方差、樣本標(biāo)準(zhǔn)差和樣本變異系數(shù)概念及計(jì)算方法
4.熟悉抽樣分布概念
5.熟悉t分布、 分布和F分布的由來
二、內(nèi)容講解
第三節(jié) 統(tǒng)計(jì)基礎(chǔ)知識(續(xù))
三、統(tǒng)計(jì)量
(一)統(tǒng)計(jì)量的概念
樣本來自總體,因此樣本中包含了有關(guān)總體的豐富信息。但是不經(jīng)加工的信息是零散的,為了把這些零散的信息集中起來反映總體的特征,需要對樣本進(jìn)行加工,圖與表是對樣本進(jìn)行加工的一種有效方法,另一種有效的辦法就是構(gòu)造樣本的函數(shù),不同的函數(shù)反映總體的不同的特征。
不含未知參數(shù)的樣本函數(shù)稱為統(tǒng)計(jì)量。
[例1.3-5] 從均值為 ,方差為 的總體中抽得一個樣本量為n的樣本 ,其中 與 均未知。
那么 ,max{ }是統(tǒng)計(jì)量,而 , 都不是統(tǒng)計(jì)量。。
根據(jù)統(tǒng)計(jì)量的定義可以構(gòu)造各種用途的統(tǒng)計(jì)量。其中有一部分是常用統(tǒng)計(jì)量,下面介紹描述樣本集中位置與樣本分散程度兩類常用統(tǒng)計(jì)量。
(二)描述樣本集中位置的統(tǒng)計(jì)量
對一組樣本數(shù)據(jù),可以用一些量來表示它們的集中位置。這些量中,常用的有樣本均值、樣本中位數(shù)和樣本眾數(shù)。
(1)樣本均值
樣本均值也稱樣本平均數(shù),記為 ,它是樣本數(shù)據(jù) 的算術(shù)平均數(shù):
(1.3-1)
[例1.3-6] 軸直徑的一個n=5的樣本觀測值(單位:cm)為:15.09,15.29,15.15,15.07,15.21,則樣本均值為:
對于n較大的分組數(shù)據(jù),可利用將每組的組中值 用頻率 加權(quán)計(jì)算近似的樣本均值:
(1.3-2)
[例1.3-7] 在例1.3-3中,100個罐頭的凈量的均值按分組計(jì)算為:
樣本均值是使用最為廣泛的反映數(shù)據(jù)集中位置的度量。它的計(jì)算比較簡單,但缺點(diǎn)是它受極端值的影響比較大。
2)樣本中位數(shù)
樣本中位數(shù)是表示數(shù)據(jù)集中位置的另一種重要的度量,用符號 或 表示。在確定樣本中位數(shù)時(shí),需要將所有樣本數(shù)據(jù)按其數(shù)值大小從小到大重新排列成以下的有序樣本:
其中: 分別是數(shù)據(jù)的最小值與最大值。
樣本中位數(shù)定義為有序樣本中位置居于中間的數(shù)值,具體地說:
(1.3-3)
與均值相比,中位數(shù)不受極端值的影響。因此在某些場合,中位數(shù)比均值更能代表一組數(shù)據(jù)的中心位置。
[例1.3-8] 對例1.3-6中的5個軸直徑數(shù)據(jù)進(jìn)行按從小到大的重新排序,得到如下有序樣本:
15.07,15.09,15.15,15.2l,15.29
這里n=5為奇數(shù),(n+1)/2=3,因而樣本中位數(shù)Me= =15.15。
注意,在此例中,中位數(shù)15.15與均值15.162很接近。
(3)樣本眾數(shù)
樣本眾數(shù)是樣本數(shù)據(jù)中出現(xiàn)頻率最高的值,常記為Mod。例如對例1.3-3中的罐頭凈量,100個數(shù)據(jù)中,344出現(xiàn)的次數(shù)最多,為12次,因此Mod=344。樣本眾數(shù)的主要缺點(diǎn)是受數(shù)據(jù)的隨機(jī)性影響比較大,有時(shí)也不惟一。當(dāng)n大時(shí),較多地采用分組數(shù)據(jù)。在本例中第5組(343.5,346.5)的頻率為0.30(見表1.3-3),是所有組中最高的,因而該組的組中值345可以作為眾數(shù)的估計(jì),注意到該數(shù)與前面定的344相差不大。
(三)描述樣本分散程度的統(tǒng)計(jì)量
一組數(shù)據(jù)內(nèi)部總是有差別的,對一組質(zhì)量特性數(shù)據(jù),大小的差異反映質(zhì)量的波動。也有一些用來表示數(shù)據(jù)內(nèi)部差異或分散程度的量,其中常用的有樣本極差、樣本方差、樣本標(biāo)準(zhǔn)差和樣本變異系數(shù)。
(1)樣本極差
樣本極差,就是樣本數(shù)據(jù)中最大值與最小值之差,用R表示。對于有序樣本,極差R為:
R= (1.3-4)
例如在例1.3-6,5個軸直徑數(shù)據(jù)的極差R=15.29-15.07=0.22。
樣本極差只利用了數(shù)據(jù)中兩個極端值,因此它對數(shù)據(jù)信息的利用不夠充分,極差常用于n不大的情況。
(2)樣本方差與樣本標(biāo)準(zhǔn)差
數(shù)據(jù)的分散程度可以用每個數(shù)據(jù) 偏離其均值 的差 來表示, 稱為 的離差。對離差不能直接取平均,因?yàn)殡x差有正有負(fù),取平均會正負(fù)相抵,無法反映分散的真實(shí)情況。當(dāng)然可以先將其取絕對值,再進(jìn)行平均,這就是平均絕對差:
(1.3-5)
但是由于對絕對值的研究較為困難,因此平均絕對差使用并不廣泛。使用最為廣泛的是用離差平方來代替離差的絕列值,因而數(shù)據(jù)的總波動用離差平方和
來表示,樣本方差定義為離差平方和除以n-1,用 表示:
(1.3-6)
因?yàn)閚個離差的總和必為0,所以對于n個獨(dú)立數(shù)據(jù),獨(dú)立的離差個數(shù)只有n-1個,稱n-1為離差平方和的自由度,因此樣本方差是用n-1而不是用n除離差平方和。
樣本方差的正算術(shù)平方根稱為樣本標(biāo)準(zhǔn)差,即:
(1.3-7)
注意標(biāo)準(zhǔn)差的量綱與數(shù)據(jù)的量綱一致,所以它使用頻繁,但其計(jì)算一般通過先計(jì)算樣本方差 獲得。
在具體計(jì)算時(shí),離差平方和也可用以下兩個簡便的公式:
來源:考試網(wǎng)-質(zhì)量工程師考試