一、抽樣推斷的一般概念
抽樣推斷是在根據(jù)隨機原則從總體中抽取部分實際數(shù)據(jù)的基礎(chǔ)上,運用數(shù)理統(tǒng)計方法,對總體某一現(xiàn)象的數(shù)量性作出具有一定可靠程度的估計判斷。
抽樣推斷具有這些特點:它是由部分推算整體的一種認(rèn)識方法;它是建立在隨機取樣的基礎(chǔ)上。它是運用概率估計的方法;抽樣推斷的誤差可以事先計算并加以控制。
抽樣推斷的主要內(nèi)容為:參數(shù)估計和假設(shè)檢驗www.examw.com
二、抽樣的基本概念
1、全及總體和樣本總體全及總體是我們所要研究的對象,而樣本總體則是我們所要觀察的對象,兩者是有區(qū)別而又有聯(lián)系的不同范疇。全及總體又稱母體,簡稱總體,它是指所要認(rèn)識的,具有某種共同性質(zhì)的許多單位的集合體。樣本總體又稱子樣,簡稱樣本,是從全及總體中隨機抽取出來,代表全及總體的那部分單位的集合體。樣本總體的單位數(shù)稱為樣本容量,通常用小寫英文字母n來表示。隨著樣本容量的增大,樣本對總體的代表性越來越高,并且當(dāng)樣本單位數(shù)足夠多時,樣本平均數(shù)愈接近總體平均數(shù)。
如果說對于一次抽樣調(diào)查,全及總體是唯一確定的,那么樣本總體就不是這樣,樣本是不確定的,一個全及總體可能抽出很多個樣本總體,樣本的個數(shù)和樣本的容量有關(guān),也和抽樣的方法有關(guān)。
2、全及指標(biāo)和抽樣指標(biāo)根據(jù)全及總體各個單位的標(biāo)志值或標(biāo)志屬性計算的,反映總體某種屬性或特征的綜合指示稱為全及指標(biāo)。常用的全及指標(biāo)有總體平均數(shù)(或總體成數(shù))、總體標(biāo)準(zhǔn)差(或總體方差 )。
由樣本總體各單位標(biāo)志值計算出來反映樣本特征,用來估計全及指標(biāo)的綜合指標(biāo)稱為統(tǒng)計量(抽樣指標(biāo))。統(tǒng)計量是樣本變量的函數(shù),用來估計總體參數(shù),因此與總體參數(shù)相對應(yīng),統(tǒng)計量有樣本平均數(shù)(或抽樣成數(shù))、樣本標(biāo)準(zhǔn)差(或樣本方差 )。
對于一個問題全及總體是唯一確定的,所以全及指標(biāo)也是唯一確定的,全及指標(biāo)也稱為參數(shù),它是待估計的數(shù)。而統(tǒng)計量則是隨機變量,它的取值隨樣本的不同而發(fā)生變化。
3、樣本容量和樣本個數(shù)樣本容量是指一個樣本所包含的單位數(shù)。通常將樣本單位數(shù)不少于30個的樣本稱為大樣本,不及30個的稱為小樣本。社會經(jīng)濟統(tǒng)計的抽樣調(diào)查多屬于大樣本調(diào)查。樣本個數(shù)又稱樣本可能數(shù)目。指從一個總體中可能抽取的樣本個數(shù)。一個總體有多少樣本,則樣本統(tǒng)計量就有多少種取值,從而形成該統(tǒng)計量的分布,此分布是抽樣推斷的基礎(chǔ)。
4、重復(fù)抽樣和不重復(fù)抽樣
三、抽樣誤差
抽樣誤差是指由于隨機抽樣的偶然因素使樣本各單位的結(jié)構(gòu)不足以代表總體各單位的結(jié)構(gòu),而引起抽樣指標(biāo)和全及指標(biāo)之間的絕對離差。因此,又稱為隨機誤差,它不包括登記誤差,也不包括系統(tǒng)性誤差。
影響抽樣誤差的因素有:總體各單位標(biāo)志值的差異程度;樣本的單位數(shù);抽樣的方法;抽樣調(diào)查的組織形式。
1、抽樣平均誤差。抽樣平均誤差是反映抽樣誤差一般水平的指標(biāo),它的實質(zhì)含義是指抽樣平均數(shù)(或成數(shù))的標(biāo)準(zhǔn)差。即它反映了抽樣指標(biāo)與總體指標(biāo)的平均離差程度。抽樣平均誤差的作用首先表現(xiàn)在它能夠說明樣本指標(biāo)代表性的大小。平均誤差大,說明樣本指標(biāo)對總體指標(biāo)的代表性低;反之,則說明樣本指標(biāo)對總體指標(biāo)的代表性高。其次,平均誤差還說明樣本指標(biāo)與總體指標(biāo)差別的一般范圍。這個范圍實際上就是抽樣極限誤差。
抽樣平均誤差的計算:外語學(xué)習(xí)網(wǎng)
重復(fù)抽樣:
不重復(fù)抽樣:
2、抽樣極限誤差。抽樣極限誤差是指用絕對值形式表示的樣本指標(biāo)與總體指標(biāo)偏差的可允許的最大范圍。它表明被估計的總體指標(biāo)有希望落在一個以樣本指標(biāo)為基礎(chǔ)的可能范圍。它是由抽樣指標(biāo)變動可允許的上限或下限與總體指標(biāo)之差的絕對值求得的。
由于總體平均數(shù)和總體成數(shù)是未知的,它要靠實測的抽樣平均數(shù)成數(shù)來估計。因而抽樣極限誤差的實際意義是希望總體平均數(shù)落在抽樣平均數(shù)的范圍內(nèi),總體成數(shù)落在抽樣成數(shù)的范圍內(nèi)。
基于理論上的要求,抽樣極限誤差需要用抽樣平均誤差μχ或μρ為標(biāo)準(zhǔn)單位來衡量。即把極限誤差△x或△p相應(yīng)除以μχ或μρ,得出相對的誤差程度t倍,t稱為抽樣誤差的概率度。于是有:
四、抽樣估計方法
抽樣估計就是利用實際調(diào)查計算的樣本指標(biāo)值來估計相應(yīng)的總體指標(biāo)數(shù)值。抽樣估計有點估計和區(qū)間估計兩種參數(shù)點估計的基本特點:根據(jù)總體指標(biāo)的結(jié)構(gòu)形式設(shè)計樣本指標(biāo)作為總體參數(shù)的估計量,并以樣本指標(biāo)的實際值直接作為相應(yīng)總體參數(shù)的估計值。點估計的優(yōu)良標(biāo)準(zhǔn)是無偏性、一致性和有效性。
抽樣估計的置信度是表明抽樣指標(biāo)和總體指標(biāo)的誤差不超過一定范圍的概率有多大。
參數(shù)區(qū)間估計的基本特點:根據(jù)給定的概率保證程度的要求,利用實際抽樣資料,指出總體被估計值的上限和下限,即指出總體參數(shù)可能存在的區(qū)間范圍,而不是直接給出總體參數(shù)的估計值?傮w參數(shù)區(qū)間估計根據(jù)給定的概率保證程度的要求,利用實際抽樣資料,指出被估計值的上限和下限,即指出總體參數(shù)可能存在的區(qū)間范圍?傮w參數(shù)區(qū)間估計必須同時具備估計值、抽樣誤差范圍和概率保證程度三個要素。
區(qū)間估計的內(nèi)容包括總體平均數(shù)和總體成數(shù)的估計。
來源:考試網(wǎng)-質(zhì)量工程師考試