四、 假設檢驗的基本思想和步驟
由于存在抽樣誤差,來自某一總體的隨機樣本其樣本均數(shù)與總體均數(shù)往往不等;從同一總體中抽取的兩個隨機樣本的樣本均數(shù)也往往不同。因此,在比較一個樣本均數(shù)與一個總體均數(shù)的差別,或比較兩個樣本均數(shù)的差別時,需要判斷這種差別的性質和意義,造成這種差別有兩種可能:
(1)總體均數(shù)不等(來自不同總體),有本質差別;
(2)總體均數(shù)相等(來自相同的總體),其差別由抽樣誤差所致,無本質差別。
要判斷屬于那種可能,需要通過假設檢驗來回答。
(二)假設檢驗原理(基本思想)
要檢驗兩指標的差別是由抽樣誤差引起的,還是由于總體均數(shù)不同所致,運用反證法。首先建立檢驗假設,假設樣本來自同一總體,在此假設的基礎上計算有關的統(tǒng)計量,根據(jù)統(tǒng)計量的大小來判斷假設成立的概率的大小。一般把概率P≤0.05的事件稱為小概率事件,小概率事件在一次觀察中可以認為是不會發(fā)生的,如與這原則不符,則認為原先的假設是不正確的,就是說“假設”不能成立,則拒絕 這個“假設”。 否則不拒絕 原來的“假設”。這就是假設檢驗的基本思想。
(三)假設檢驗的一般步驟
A.建立假設
兩種假設
(1)檢驗假設(無效假設)用H0表示: 即假設兩總體均數(shù)相等,差別僅僅由于抽樣誤差所致;
(2)備擇假設 用H1表示: 是與H0對立的假設,當H0 被拒絕,則接受H1。
2、確定單雙側檢驗(常用雙側檢驗)
根據(jù)研究目的和專業(yè)知識還要確定是雙側檢驗還是單側檢驗。若目的是推斷兩總體是否不等(如是否μ≠μ0),不管是μ>μ0還是μ<μ0,都是我們所關心的,則用雙側檢驗,此時H0 :μ=μ0,H1:μ≠μ0;若從專業(yè)知識已知不會μ<μ0(或不會μ>μ0),目的是推斷是否μ>μ0 (或μ<μ0),則用單側檢驗,此時H0:μ=μ0,H1:μ>μ0(或μ<μ0)。
注意:單側檢驗更容易得到有統(tǒng)計學意義的結果,因此,做單側檢驗要通過專業(yè)知識來確定,否則,一律做雙側檢驗,雙側檢驗更穩(wěn)妥。
3.確定檢驗水準
檢驗水準是拒絕或不拒絕H0的概率標準,也就是小概率事件標準,是人為選定的概率值,一般取α=0.05(根據(jù)需要也可取0.2、0.15、0.1、0.01等)。
B、選定檢驗方法和計算統(tǒng)計量
根據(jù)研究設計方案、資料類型、樣本含量大小及分析目的選用適當?shù)臋z驗方法,并根據(jù)樣本資料計算相應的檢驗統(tǒng)計量。不同的檢驗方法要用不同的公式計算現(xiàn)有樣本的檢驗統(tǒng)計量(t ,u,F(xiàn)值)。檢驗統(tǒng)計量是在H0成立的前提下計算出來。
C、確定P值
P值是指在H0所規(guī)定的總體中作隨機抽樣,獲得等于及大于(或等于及小于)現(xiàn)有樣本統(tǒng)計量的概率。P也可以通俗地說,P是指H0成立的概率大小。用計算所得的檢驗統(tǒng)計量(t、u值)與相應的界值比較,確定P值。
D、作出推斷結論
假設檢驗的結論:
(1)統(tǒng)計學結論(拒絕或接受H0 ,即有無統(tǒng)計學意義);
(2)專業(yè)結論。
2、推斷結論方法
(1) 當 P≤α時,結論是:拒絕H0,接受H1(差別有顯著意義或有統(tǒng)計學意義);
(2)當 P>α時, 結論是:不拒絕H0。(差別無顯著意義,或無統(tǒng)計學意義);
作出上述推斷的理由
(1) 如果P≤α,則按α水準拒絕H0 ,接受H1 。因為抽取一個樣本,僅代表一次試驗,現(xiàn)P≤α,為小概率事件,小概率事件在一次試驗中竟然發(fā)生,與概率理論的一個基本原則:小概率事件在一次試驗中不會發(fā)生產(chǎn)生矛盾,因此拒絕H0 。
(2) 如果P>α,則按α水準不拒絕H0 ,因為概率較大,沒有理由拒絕H0 ,認為其成立。所以,研究者只是在概率上從H0 與H1 兩者中選擇一個較為合理的判斷。
由此可見,假設檢驗所作出的結論是具有概率性質的,不是絕對的肯定或否定。不論拒絕或不拒絕H0 都可能發(fā)生錯誤。
拒絕實際上是成立的H0, 這類“棄真”的錯誤稱Ⅰ型錯誤或第一類錯誤。
不拒絕(接受)實際上是不成立的H0, 這類“存?zhèn)巍钡腻e誤稱Ⅱ型錯誤或第二類錯誤。
即拒絕H0,犯Ⅰ型錯誤;接受H1,犯Ⅱ型錯誤。
兩類錯誤的關系
第一類錯誤的概率為α,第二類錯誤的概率為β
α越大,β越小 , α越小,β越大。