二、頻數(shù) (頻率)直方圖
(一) 直方圖的作法
為研究一批產品的質量情況,需要研究它的某個質量特性 (這里為了敘述簡單起見,僅討論一個質量特性,有必要時也可以同時討論多個質量特性)X的變化規(guī)律。為此,從這批產品(總體)中抽取一個樣本 (設樣本量為n),對每個樣本產品進行該特性的測量 (觀測)后得到一組樣本觀測值,記為 ,這便是我們通常說的數(shù)據(jù)。
為了研究數(shù)據(jù)的變化規(guī)律,需要對數(shù)據(jù)進行一定的加工整理。直方圖是為研究數(shù)據(jù)變化規(guī)律而對數(shù)據(jù)進行加工整理的一種基本方法。下面用一個例子來說明直方圖的概念及其作法。
[例1.3-3] 食品廠用自動裝罐機生產罐頭食品,從一批罐頭中隨機抽取100個進行稱量,獲得罐頭的凈重數(shù)據(jù)如下:
342352346344343339336342347340
340350347336341349346348342346
347346346345344350348352340356
339348338342347347344343349341
348341340347342337344340344346
342344345338351348345339343345
346344344344343345345350353345
352350345343347354350343350344
351348352344345349332343340346
342335349348344347341346341342
為了解這組數(shù)據(jù)的分布規(guī)律,對數(shù)據(jù)作如下整理:
(1)找出這組數(shù)據(jù)中的最大值 ,及最小值 ,計算它們的差R= - ,R稱為極差,也就是這組數(shù)據(jù)的取值范圍。在本例中 =356, , =332,從而R=356-332=24。
(2)根據(jù)數(shù)據(jù)個數(shù),即樣本量n,決定分組數(shù)k及組距h。
一批數(shù)據(jù)究竟分多少組,通常根據(jù)n的多少而定,不過這也不是絕對的,表1.3-2是可以參考的分組數(shù)。
表1.3-2 直方圖分組組數(shù)選用表
樣本量推薦組數(shù)
50~100
101~250
250以上6~10
7~12
10~20
選擇k的原則是要能顯示出數(shù)據(jù)中所隱藏的規(guī)律,組數(shù)不能過多,但也不能太少。
每一組的區(qū)間長度,稱為組距。組距可以相等,也可以不相等。組距相等的情況用得比較多,不過也有不少情形在對應于數(shù)據(jù)最大及最小的一個或兩個組,使用與其他組不相等的組距。對于完全相等的組距,通常取組距h為接近R/k的某個整數(shù)值。
在本例中,n=100,取k=9,R/k=24/9=2.7,故取組距h=3。
(3)確定組限(即每個區(qū)間的端點)及組中值。為了避免一個數(shù)據(jù)可能同時屬于兩個組,因此通常將各組的區(qū)間確定為左開右閉的:
通常要求 , 。在等距分組時 ,而每一組的組中值 。
在本例中取 =331.5,則每組的組限及組中值見表1.3-3。
(4)計算落在每組的數(shù)據(jù)的頻數(shù)及頻率
確定分組后,統(tǒng)計每組的頻數(shù),即落在組中的數(shù)據(jù)個數(shù) 以及頻率 ,列出每組的頻數(shù)、頻率表,見表1.3-3。
(5)作頻數(shù)頻率直方圖
在橫軸上標上每個組的組限,以每一組的區(qū)間為底,以頻數(shù)(頻率)為高畫一個矩形,所得的圖形稱為頻數(shù) (頻率)直方圖,如圖1.3-4。在本例中頻數(shù)直方圖及頻率直方圖的形狀是完全一致的,這是因為分組是等距的。該圖特點是:中間高,兩邊低,左右基本對稱。這說明:這個樣本可能取自某正態(tài)總體。
在分組不完全等距的情形,在作頻率直方圖時,應當用每個組的頻率與組距的比值 為高作矩形,此時以每個矩形的面積表示頻率。
來源:考試網(wǎng)-質量工程師考試