二項分布和Poisson分布均是常見的離散型分布,在分類資料的統(tǒng)計推斷中有非常廣泛的應(yīng)用。 一、二項分布的概念及應(yīng)用條件
1. 二項分布的概念:
如某實驗中小白鼠染毒后死亡概率P為0.8,則生存概率為=1-P=0.2,故
對一只小白鼠進行實驗的結(jié)果為:死(概率為P)或生(概率為1-P)
對二只小白鼠(甲乙)進行實驗的結(jié)果為:甲乙均死(概率為P2)、甲死乙生[概率為P(1-P)]、乙死甲生[概率為(1-P)P]或甲乙均生[概率為(1-P)2],概率相加得P2+P(1-P)+(1-P)P+(1-P)2=[P+(1-P)]2
依此類推,對n只小白鼠進行實驗,所有可能結(jié)果的概率相加得Pn+cn1P(1-P)n-1+...+cnxPx(1-P)n-x+...+(1-P)x=[P+(1-P)]n 其中n為樣本含量,即事件發(fā)生總數(shù),x為某事件出現(xiàn)次數(shù),cnxPx(1-P)n-x為二項式通式,cnx=n!/x!(n-x)!, P為總體率。
因此,二項分布是說明結(jié)果只有兩種情況的n次實驗中發(fā)生某種結(jié)果為x次的概率分布。其概率密度為:
P(x)=cnxPx(1-P)n-x, x=0,1,...n。
2. 二項分布的應(yīng)用條件:
醫(yī)學(xué)領(lǐng)域有許多二分類記數(shù)資料都符合二項分布(傳染病和遺傳病除外),但應(yīng)用時仍應(yīng)注意考察是否滿足以下應(yīng)用條件:(1) 每次實驗只有兩類對立的結(jié)果;(2) n次事件相互獨立;(3) 每次實驗?zāi)愁惤Y(jié)果的發(fā)生的概率是一個常數(shù)。
3. 二項分布的累計概率
二項分布下最多發(fā)生k例陽性的概率為發(fā)生0例陽性、1例陽性、...、直至k例陽性的概率之和。至少發(fā)生k例陽性的概率為發(fā)生k例陽性、k+1例陽性、...、直至n例陽性的概率之和。
4. 二項分布的圖形
二項分布的圖形有如下特征:(1)二項分布圖形的形狀取決于P 和n 的大。(2) 當P=0.5時,無論n的大小,均為對稱分布;(3) 當P<>0.5 ,n較小時為偏態(tài)分布,n較大時逼近正態(tài)分布。
5. 二項分布的均數(shù)和標準差
二項分布的均數(shù)µ=np,當用率表示時µ=p
二項分布的標準差為np(1-p)的算術(shù)平方根,當用率表示時為p(1-p)的算術(shù)平方根。
二、二項分布的應(yīng)用
二項分布主要用于符合二項分布分類資料的率的區(qū)間估計和假設(shè)檢驗。當P=0.5或n較大,nP及n(1-P)均大于等于5時,可用(p-u0.05sp,p+u0.05sp)對總體率進行95%的區(qū)間估計。當總體率P接近0.5,陽性數(shù)x較小時,可直接計算二項分布的累計概率進行單側(cè)的假設(shè)檢驗。當P=0.5或n較大,nP及n(1-P)均大于等于5時,可用正態(tài)近似法進行樣本率與總體率,兩個樣本率比較的u檢驗。
三、Poisson分布的概念及應(yīng)用條件
1. Poisson分布的概念:
Poisson分布是二項分布n很大而P很小時的特殊形式,是兩分類資料在n次實驗中發(fā)生x次某種結(jié)果的概率分布。其概率密度函數(shù)為:P(x)=e-µ*µx/x! x=0,1,2...n,其中e為自然對數(shù)的底,µ為總體均數(shù),x為事件發(fā)生的陽性數(shù)。