考向1 抽樣方法
【典例1】 (1)(2014·湖南高考改編)對(duì)一個(gè)容量為N的總體抽取容量為n的樣本,當(dāng)選取簡(jiǎn)單隨機(jī)抽樣、系統(tǒng)抽樣和分層抽樣三種不同方法抽取樣本時(shí),總體中每個(gè)個(gè)體被抽中的概率分別為p1,p2,p3,則p1,p2,p3的大小關(guān)系為_(kāi)_______.
(2)(2014·湖北高考)甲、乙兩套設(shè)備生產(chǎn)的同類(lèi)型產(chǎn)品共4 800件,采用分層抽樣的方法從中抽取一個(gè)容量為80的樣本進(jìn)行質(zhì)量檢測(cè).若樣本中有50件產(chǎn)品由甲設(shè)備生產(chǎn),則乙設(shè)備生產(chǎn)的產(chǎn)品總數(shù)為_(kāi)_______件.
[解析] (1)不管用什么抽樣方法,每一個(gè)個(gè)體被抽到的機(jī)會(huì)都相等,p1=p2=p3.
(2)設(shè)乙設(shè)備生產(chǎn)的產(chǎn)品總數(shù)為x件,則甲設(shè)備生產(chǎn)的產(chǎn)品總數(shù)為(4 800-x)件.由分層抽樣特點(diǎn),結(jié)合題意可得=,解得x=1 800.
[答案] (1)p1=p2=p3 (2)1 800,【規(guī)律方法】
1.進(jìn)行分層抽樣時(shí)應(yīng)注意以下幾點(diǎn):
分層抽樣中分多少層,如何分層要視具體情況而定,總的原則是:層內(nèi)樣本的差異要求,兩層之間的樣本差異要大,且互不重疊;為了保證每個(gè)個(gè)體等可能入樣,所有層中每個(gè)個(gè)體被抽到的可能性相同;在每層抽樣時(shí),應(yīng)采用簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣的方法進(jìn)行抽樣;抽樣比==.
2.一般地,系統(tǒng)抽樣是等距離抽樣,若第一組抽取號(hào)碼a,然后以d為間距依次等距離抽取后面的編號(hào),抽出的所有號(hào)碼為a+dk(k=0,1,2,…,n-1),其中n是組數(shù).
【變式訓(xùn)練1】 (1)(2014·天津高考)某大學(xué)為了解在校本科生對(duì)參加某項(xiàng)社會(huì)實(shí)踐活動(dòng)的意向,擬采用分層抽樣的方法,從該校四個(gè)年級(jí)的本科生中抽取一個(gè)容量為300的樣本進(jìn)行調(diào)查,已知該校一年級(jí)、二年級(jí)、三年級(jí)、四年級(jí)的本科生人數(shù)之比為45∶5∶6,則應(yīng)從一年級(jí)本科生中抽取________名學(xué)生.
(2)(2013·江西高考改編)總體由編號(hào)為01,02,…,19,20的20個(gè)個(gè)體組成,利用下面的隨機(jī)數(shù)表選取5個(gè)個(gè)體,選取方法是從隨機(jī)數(shù)表第1行的第5列和第6列數(shù)字開(kāi)始由左到右依次選取兩個(gè)數(shù)字,則選出來(lái)的第5個(gè)個(gè)體的編號(hào)為_(kāi)_______.
7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481 [解析] (1)根據(jù)題意,應(yīng)從一年級(jí)本科生中抽取的人數(shù)為×300=60.
(2)由隨機(jī)數(shù)表法的隨機(jī)抽樣的過(guò)程可知選出的5個(gè)個(gè)體是08,02,14,07,01,所以第5個(gè)個(gè)體的編號(hào)是01.
[答案] (1)60 (2)01考向2 統(tǒng)計(jì)圖表
【典例2】 (1)(2014·江蘇高考改編)設(shè)抽測(cè)的樹(shù)木的底部周長(zhǎng)均在區(qū)間[80,130]上,其頻率分布直方圖如圖923所示,則在抽測(cè)的60株樹(shù)木中,有________株樹(shù)木的底部周長(zhǎng)小于100 cm.
(2)(2013·重慶高考)如圖924是某公司10個(gè)銷(xiāo)售店某月銷(xiāo)售某產(chǎn)品數(shù)量(單位:臺(tái))的莖葉圖,則數(shù)據(jù)落在區(qū)間[22,30)內(nèi)的頻率為_(kāi)_______.
圖924
[解析] (1)由題意在抽測(cè)的60株樹(shù)木中,底部周長(zhǎng)小于100 cm的株數(shù)為(0.015+0.025)×10×60=24.
頻率分布直方圖中的縱坐標(biāo)為,此處經(jīng)常誤認(rèn)為縱坐標(biāo)是頻率.
(2)由落在[22,30)內(nèi)的數(shù)據(jù)有4個(gè),且共有10個(gè)數(shù)據(jù),故頻率為=0.4.
[答案] (1)24 (2)0.4,【規(guī)律方法】
1.解決頻率分布直方圖的問(wèn)題,關(guān)鍵在于找出圖中數(shù)據(jù)之間的聯(lián)系.這些數(shù)據(jù)中,比較明顯的有組距、,間接的有頻率、小長(zhǎng)方形的面積,合理使用這些數(shù)據(jù),再結(jié)合兩個(gè)等量關(guān)系:小長(zhǎng)方形面積=組距×=頻率,小長(zhǎng)方形面積之和等于1,即頻率之和等于1.
2.明確莖葉圖的數(shù)據(jù)對(duì)處理樣本的數(shù)據(jù)特征顯得尤為重要,而方差可以衡量樣本數(shù)據(jù)的穩(wěn)定性.莖葉圖刻畫(huà)數(shù)據(jù)的優(yōu)點(diǎn):(1)所有數(shù)據(jù)信息都可用在莖葉圖中看到;(2)莖葉圖便于記錄和表示,且能夠展示數(shù)據(jù)的分布情況.
【變式訓(xùn)練2】 (1)
(2014·山東高考改編)為了研究某藥品的療效,選取若干名志愿者進(jìn)行臨床試驗(yàn),所有志愿者的舒張壓數(shù)據(jù)(單位:kPa)的分組區(qū)間為[12,13),[13,14),[14,15),[15,16),[16,17],將其按從左到右的順序分別編號(hào)為第一組,第二組,…,第五組,如圖925是根據(jù)試驗(yàn)數(shù)據(jù)制成的頻率分布直方圖.已知第一組與第二組共有20人,第三組中沒(méi)有療效的有6人,則第三組中有療效的人數(shù)為_(kāi)_______.
(2013·重慶高考改編)右面莖葉圖記錄了甲、乙兩組各五名學(xué)生在一次英語(yǔ)聽(tīng)力測(cè)試中的成績(jī)(單位:分).已知甲組數(shù)據(jù)的中位數(shù)為15,乙組數(shù)據(jù)的平均數(shù)為16.8,則x+y=________.
[解析] (1)依據(jù)頻率分布直方圖及頻率公式求解.志愿者的總?cè)藬?shù)為=50,所以第三組人數(shù)為50×0.36=18,有療效的人數(shù)為18-6=12.
(2)由于甲組數(shù)據(jù)的中位數(shù)為15=10+x,
x=5.
又乙組數(shù)據(jù)的平均數(shù)為=16.8,
y=8.
故x+y=5+8=13.
[答案] (1)12 (2)13考向3 樣本的數(shù)字特征(高頻考點(diǎn))
命題視角 求樣本的數(shù)字特征是統(tǒng)計(jì)中?嫉膬(nèi)容,主要命題角度有:
(1)求眾數(shù)、中位數(shù);
(2)求平均數(shù)、方差;
(3)由樣本的數(shù)字特征估計(jì)概率.
【典例3】 (2014·課標(biāo)全國(guó)卷)某市為了考核甲、乙兩部門(mén)的工作情況,隨機(jī)訪問(wèn)了50位市民.根據(jù)這50位市民對(duì)這兩部門(mén)的評(píng)分(評(píng)分越高表明市民的評(píng)價(jià)越高),繪制莖葉圖如下:
甲部門(mén) 乙部門(mén) 3 59 4 4 0448 97 5 122456677789 97665332110 6 011234688 98877766555554443332100 7 00113449 6655200 8 123345 632220 9 011456 10 000 (1)分別估計(jì)該市的市民對(duì)甲、乙兩部門(mén)評(píng)分的中位數(shù);
(2)分別估計(jì)該市的市民對(duì)甲、乙兩部門(mén)的評(píng)分高于90的概率;
(3)根據(jù)莖葉圖分析該市的市民對(duì)甲、乙兩部門(mén)的評(píng)價(jià).
[思路點(diǎn)撥] (1)把甲、乙兩部門(mén)的數(shù)據(jù)根據(jù)莖葉圖從小到大排列,可求出中位數(shù),再估計(jì)總體中位數(shù);(2)先分別計(jì)算甲、乙兩部門(mén)得分大于90的人數(shù),然后得出高于90的頻率,再估計(jì)總體;(3)根據(jù)莖葉圖估計(jì)它們的標(biāo)準(zhǔn)差,從而得出結(jié)論.
[解] (1)由所給莖葉圖知,50位市民對(duì)甲部門(mén)的評(píng)分由小到大排序,排在第25,26位的是75,75,故樣本中位數(shù)為75,所以該市的市民對(duì)甲部門(mén)評(píng)分的中位數(shù)的估計(jì)值是75.
50位市民對(duì)乙部門(mén)的評(píng)分由小到大排序后,排在第25,26位的是66,68,故樣本中位數(shù)為=67,所以該市的市民對(duì)乙部門(mén)評(píng)分的中位數(shù)的估計(jì)值是67.
(2)由所給莖葉圖知,50位市民對(duì)甲、乙兩部門(mén)的評(píng)分高于90的比率分別為=0.1,=0.16,故該市的市民對(duì)甲、乙兩部門(mén)的評(píng)分高于90的概率的估計(jì)值分別為0.1,0.16.
(3)由所給莖葉圖知,市民對(duì)甲部門(mén)的評(píng)分的中位數(shù)高于對(duì)乙部門(mén)的評(píng)分的中位數(shù),而且由莖葉圖可以大致看出對(duì)甲部門(mén)的評(píng)分的標(biāo)準(zhǔn)差要小于對(duì)乙部門(mén)的評(píng)分的標(biāo)準(zhǔn)差,說(shuō)明該市市民對(duì)甲部門(mén)的評(píng)價(jià)較高、評(píng)價(jià)較為一致,對(duì)乙部門(mén)的評(píng)價(jià)較低、評(píng)價(jià)差異較大.,【通關(guān)錦囊】
(1)眾數(shù)、中位數(shù)及平均數(shù)都是描述一組數(shù)據(jù)集中趨勢(shì)的量,平均數(shù)是最重要的量;
(2)由于平均數(shù)與每一個(gè)樣本數(shù)據(jù)有關(guān),所以任何一個(gè)樣本數(shù)據(jù)的改變都會(huì)引起平均數(shù)的改變.這是中位數(shù)、眾數(shù)都不具有的性質(zhì);
(3)眾數(shù)考查各數(shù)據(jù)出現(xiàn)的頻率,大小只與這組數(shù)據(jù)中的部分?jǐn)?shù)據(jù)有關(guān),當(dāng)一組數(shù)據(jù)中有不少數(shù)據(jù)多次重復(fù)出現(xiàn)時(shí),其眾數(shù)往往更能反映問(wèn)題;
(4)中位數(shù)僅與數(shù)據(jù)的排列位置有關(guān),某些數(shù)據(jù)的變動(dòng)對(duì)中位數(shù)沒(méi)有影響.中位數(shù)可能出現(xiàn)在所給數(shù)據(jù)中,也可能不在所給數(shù)據(jù)中.當(dāng)一組數(shù)據(jù)中的個(gè)別數(shù)據(jù)變動(dòng)較大時(shí),可用中位數(shù)描述其集中趨勢(shì);
(5)在實(shí)際問(wèn)題中求得的平均數(shù)、眾數(shù)和中位數(shù)應(yīng)帶上單位.
【變式訓(xùn)練3】 (2014·湖南高考)某企業(yè)有甲、乙兩個(gè)研發(fā)小組.為了比較他們的研發(fā)水平,現(xiàn)隨機(jī)抽取這兩個(gè)小組往年研發(fā)新產(chǎn)品的結(jié)果如下:(a,b),(a,),(a,b),(,b),(,),(a,b),(a,b),(a,),(,b),(a,),(,),(a,b),(a,),(,b),(a,b).其中a,分別表示甲組研發(fā)成功和失敗;b,分別表示乙組研發(fā)成功和失敗.
(1)若某組成功研發(fā)一種新產(chǎn)品,則給該組記1分,否則記0分.試計(jì)算甲、乙兩組研發(fā)新產(chǎn)品的成績(jī)的平均數(shù)和方差,并比較甲、乙兩組的研發(fā)水平;
(2)若該企業(yè)安排甲、乙兩組各自研發(fā)一種新產(chǎn)品,試估計(jì)恰有一組研發(fā)成功的概率.
[解] (1)甲組研發(fā)新產(chǎn)品的成績(jī)?yōu)?/P>
1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,
其平均數(shù)為
甲==;
方差為
s==.
乙組研發(fā)新產(chǎn)品的成績(jī)?yōu)?/P>
1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,
其平均數(shù)為
乙==;
方差為
s==.
因?yàn)榧?gt;乙,s