1、統(tǒng)計分組的意義
根據(jù)統(tǒng)計研究任務的要求和研究現(xiàn)象總體的內在特點,把現(xiàn)象總體按某一標志劃分為若干性質不同但又有聯(lián)系的幾個部分稱統(tǒng)計分組。
總體的變異性是統(tǒng)計分組的客觀依據(jù)。統(tǒng)計分組是總體內進行的一種定性分類,它把總體劃分為一個個性質不同的范圍更小的總體。
2、統(tǒng)計分組的種類
、俳y(tǒng)計分組按其任務和作用不同,分為類型分組、結構分組和分析分組。類型分組的目的是劃分經濟類型,結構分類的目的是研究同質總體的構成,分析分組的目的是研究現(xiàn)象總體內部諸標志間的依從和制約關系。
、诮y(tǒng)計分組按分組標志的多少分為簡單分組和復合分組。/考*試*大/簡單分組是將總體按一個標志進行分組,復合分組是將總體按兩個或兩個以上的標志重疊起來進行分組。
、劢y(tǒng)計分組按分組標志的性質分為品質分組和變量分組。品質分組是將總體按品質標志進行分組,如企業(yè)按經濟成份、地理位置分組,職工按性別、文化程度分組等;變量分組是將總體按數(shù)量標志進行分組,如企業(yè)按職工人數(shù)、勞動生產率分組,職工按工齡、工資分組等。
3、分組體系與分組標志的選擇
、俜纸M體系統(tǒng)計分組后所形成的一系列互相聯(lián)系、互相補充的組的整體稱分組體系。分組體系有平行分組體系和復合分組體系兩種。平行分組體系是選擇兩個或兩個以上的標志對總體進行一次次簡單分組后所形成的體系;復合分組體系就是復合分組后形成的體系。
、诜纸M標志的選擇分組標志的選擇是統(tǒng)計分組的關鍵。分組標志,即將同質總體區(qū)分為不同組的標準或依據(jù)。分組標志一旦選定,就必然突出了總體在該標志下的性質差別,其他的差別看不見了。分組標志選擇不當,不但無法顯示現(xiàn)象的根本特征,甚至會混淆事物的性質,歪曲社會經濟的真實情況。
正確選擇分組標志,必須根據(jù)統(tǒng)計研究的任務目的,抓住反映現(xiàn)象本質區(qū)別和內在聯(lián)系的標志作為分組標志。
4、統(tǒng)計分組的方法
品質標志分組方法品質標志分組一般較簡單,分組標志一旦確定,組數(shù)、組名、組與組之間的界限也就確定。有些復雜的品質標志分組可根據(jù)統(tǒng)一規(guī)定的劃分標準和分類目錄進行。
數(shù)量標志分組方法按數(shù)量標志分組的目的并不是單純確定各組在數(shù)量上的差別,/考*試*大/而是要通過數(shù)量上的變化來區(qū)分各組的不同類型和性質。數(shù)量標志分組方法從以下幾個方面來說明:
①單項式分組和組距式分組對離散變量,如果變量值的變動幅度小,就可以一個變量值對應一組,稱單項式分組。如居民家庭按兒童數(shù)或人口數(shù)分組,均可采用單項式分組。
離散變量如果變量值的變動幅度很大,變量值的個數(shù)很多,則把整個變量值依次劃分為幾個區(qū)間,各個變量值則按其大小確定所歸并的區(qū)間,區(qū)間的距離稱為組距,這樣的分組稱為組距式分組。/考*試*大/
也就是說,離散變量根據(jù)情況既可用單項式分組,也可用組距式分組。在組距式分組中,相鄰組既可以有確定的上下限,也可將相鄰組的組限重疊。
連續(xù)變量由于不能一一列舉其變量值,只能采用組距式的分組方式,且相鄰的組限必須重疊。如以總產值、商品銷售額、勞動生產率、工資等為標志進行分組,就只能是相鄰組限重疊的組距式分組。
在相鄰組組限重疊的組距式分組中,若某單位的標志值正好等于相鄰兩組的上下限的數(shù)值時,一般把此值歸并到作為下限的那一組(適用于連續(xù)變量和離散變量)。
組距式分組使資料的真實性受到一定程度的損害。組距式分組的假定條件是:變量在各組內的分布都是均勻的(即各組標志值呈線性變化)。
通過組距式分組以后,把各組內部各單位的次要差異抽象去了,而把各組之間的主要差異突出出來,這樣,各組分配的規(guī)律性可以更容易顯示出來。根據(jù)這個道理,如組距太小,分組過細,容易將屬于同類的單位劃分到不同的組,因而顯示不出現(xiàn)象類型的特點;但如果組距太大,組數(shù)太少,會把不同性質的單位歸并到同一組中,失去區(qū)分事物的界限,達不到正確反映客觀事實的目的。因此,組距的大小、組數(shù)的確定應根據(jù)研究對象的經濟內容和標志值的分散程度等因素,不可強求一致。
、诘染喾纸M和不等距分組等距分組是各組保持相等的組距,也就是說各組標志值的變動都限于相同的范圍。不等距分組即各組組距不相等的分組。
統(tǒng)計分組時采用等距分組還是不等距分組,取決于研究對象的性質特點。在標志值變動比較均勻的情況下宜采用等距分組。等距分組便于各組單位數(shù)和標志值直接比較,也便于計算各項綜合指標。在標志值變動很不均勻的情況下宜采用不等距分組。不等距分組有時更能說明現(xiàn)象的本質特征。
考試網 、劢M限和組中值組距兩端的數(shù)值稱組限。/考*試*大/其中,每組的起點數(shù)值稱為下限,每組的終點數(shù)值稱為上限。上限和下限的差稱組距,表示各組標志值變動的范圍。
組中值是上下限之間的中點數(shù)值,以代表各組標志值的一般水平。組中值并不是各組標志值的平均數(shù),各組標志數(shù)的平均數(shù)在統(tǒng)計分組后很難計算出來,就常以組中值近似代替。組中值僅存在于組距式分組數(shù)列中,單項式分組中不存在組中值。
組中值的計算是有假定條件的,即假定各組標志值的變化是均勻的(與組距式分組的假定條件相同)。一般情況下,組中值=(上限+下限)÷2對于第一組是 “多少以下”,最后一組是“多少以上”的開口組,組中值的計算可參照鄰組的組距來決定。即:缺下限開口組組中值=上限-1/2鄰組組距,缺上限開口組組中值=下限+1/2鄰組組距。