《高中數(shù)學(xué) 第三章 統(tǒng)計案例 階段復(fù)習(xí)課 第3課 統(tǒng)計案例學(xué)案 新人教A版選修23》由會員分享,可在線閱讀,更多相關(guān)《高中數(shù)學(xué) 第三章 統(tǒng)計案例 階段復(fù)習(xí)課 第3課 統(tǒng)計案例學(xué)案 新人教A版選修23(7頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、
第三課 統(tǒng)計案例
[核心速填]
(建議用時4分鐘)
1.分析判斷兩個變量相關(guān)關(guān)系常用的方法
(1)散點(diǎn)圖法:把樣本數(shù)據(jù)表示的點(diǎn)在直角坐標(biāo)系中標(biāo)出,得到散點(diǎn)圖,由散點(diǎn)圖的形狀分析.
(2)相關(guān)指數(shù)法:利用相關(guān)指數(shù)R2進(jìn)行檢驗,在確認(rèn)具有相關(guān)關(guān)系后,再求線性回歸方程.
2.求線性回歸方程的步驟
(1)畫散點(diǎn)圖:從直觀上觀察兩個變量是否線性相關(guān).
(2)計算:利用公式求回歸方程的系數(shù)的值.
==,=-.
(3)寫出方程:依據(jù)=+x,寫出回歸直線方程.
3.兩種特殊可線性化回歸模型的轉(zhuǎn)化
(1)將冪型函數(shù)y=axm(a為正的常數(shù),x,y取正值)化為線性函數(shù).
如果將y=a
2、xm兩邊同取以10為底的對數(shù),則有l(wèi)g y=mlg x+lg a.令u=lg y,v=lg x,lg a=b,代入上式,得u=mv+b,其中m,b是常數(shù).這是u,v的線性函數(shù).如果以u為縱坐標(biāo),v為橫坐標(biāo),則u=mv+b的圖象就是一直線.
(2)將指數(shù)型函數(shù)y=cax(a>0且a≠1,c>0且為常數(shù))化為線性函數(shù).
將y=cax兩邊同取以10為底的對數(shù),有l(wèi)g y=xlg a+lg c,令lg y=u,lg a=k,lg c=b,得u=kx+b,其中,k和b是常數(shù),與冪型函數(shù)不同的是x依然保持原來的,只是用y的對數(shù)lg y代替了y.
4.在實(shí)際問題中常用的三個數(shù)值
(1)當(dāng)K2>6.6
3、35時,表示有99%的把握認(rèn)為“事件A與B有關(guān)系”.
(2)當(dāng)K2>3.841時,表示有95%的把握認(rèn)為“事件A與B有關(guān)系”.
(3)當(dāng)K2≤3.841時,認(rèn)為事件A與B是無關(guān)的.
[體系構(gòu)建]
[題型探究]
線性回歸分析
回歸分析是對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的一種常用方法.根據(jù)兩個變量的一組觀測值,可以畫出散點(diǎn)圖或利用相關(guān)系數(shù)r,判斷兩個變量是否具有線性相關(guān)關(guān)系,若具有線性相關(guān)關(guān)系,可得出線性回歸直線方程.
利用公式求回歸直線方程時應(yīng)注意以下幾點(diǎn):
(1)求時,利用公式==,先求出=(x1+x2+x3+…+xn),=(y1+y2+y3+…+yn).再由=-
4、 求的值,并寫出回歸直線方程.
(2)回歸直線一定經(jīng)過樣本點(diǎn)的中心(,).
(3)回歸直線方程中的截距和斜率都是通過樣本估計得來的,存在誤差,這種誤差可能導(dǎo)致預(yù)報結(jié)果的偏差.
(4)回歸直線方程=+x中的表示x每增加1個單位時預(yù)報變量y的平均變化量,而表示預(yù)報變量y不隨x的變化而變化的部分.
以下是某地收集到的新房屋的銷售價格y和房屋的面積x的數(shù)據(jù):
房屋面積x/m2
115
110
80
135
105
銷售價格y/萬元
24.8
21.6
18.4
29.2
22
(1)畫出數(shù)據(jù)對應(yīng)的散點(diǎn)圖;
(2)若線性相關(guān),求線性回歸方程;
(3)根據(jù)(2)的結(jié)
5、果估計當(dāng)房屋面積為150 m2時的銷售價格.
【導(dǎo)學(xué)號:95032252】
[解] (1)數(shù)據(jù)對應(yīng)的散點(diǎn)圖如圖所示.
(2)由散點(diǎn)圖知y與x具有線性相關(guān)關(guān)系.由表中數(shù)據(jù)知=i=109,=i=23.2,=60 975,iyi=12 952.設(shè)所求回歸直線方程為=x+,則=≈0.196 2,=-≈1.814 2,故所求回歸直線方程為=0.196 2x+1.814 2.
(3)根據(jù)(2),當(dāng)x=150時,銷售價格的估計值為=0.1962150+1.814 2=31.244 2(萬元).
[規(guī)律方法] 在散點(diǎn)圖中樣本點(diǎn)大致分布在一條直線附近,則利用線性回歸模型進(jìn)行研究,可近似地利用回歸
6、直線方程=x+來預(yù)報,利用公式求出回歸系數(shù),,即可寫出回歸直線方程,并用回歸直線方程進(jìn)行預(yù)測說明.
[跟蹤訓(xùn)練]
1.已知某連鎖經(jīng)營公司的5個零售店某月的銷售額和利潤額資料如下表:
商店名稱
A
B
C
D
E
銷售額x(千萬元)
3
5
6
7
9
利潤額y(千萬元)
2
3
3
4
5
(1)畫出散點(diǎn)圖;
(2)根據(jù)如下的參考公式與參考數(shù)據(jù),求利潤額y與銷售額x之間的線性回歸方程;
(3)若該公司還有一個零售店某月銷售額為10千萬元,試估計它的利潤額是多少.
(參考公式:=,=-.
其中,iyi=112,=200)
[解] (1)散點(diǎn)圖.
7、
(2)由已知數(shù)據(jù)計算得n=5,==6,==3.4,==0.5,=3.4-0.56=0.4.
則線性回歸方程為=0.5x+0.4.
(3)將x=10代入線性回歸方程中得到=0.510+0.4=5.4(千萬元).
即估計該零售店的利潤額約為5.4千萬元.
回歸模型分析
對于建立的回歸模型,我們必須對模型的擬合效果進(jìn)行分析,也就是對利用回歸模型解決實(shí)際問題的效果進(jìn)行評價.一方面可以對比殘差或殘差平方和的大小,同時觀察殘差圖,進(jìn)行殘差分析;另一方面也可以研究數(shù)據(jù)的R2(相關(guān)系數(shù)r).對模型擬合效果的分析能夠幫助我們利用最優(yōu)化的模型來解決實(shí)際問題.
在研究彈簧伸長長度y(cm)
8、與拉力x(N)的關(guān)系時,對不同拉力的6根彈簧進(jìn)行測量,測得如下表中的數(shù)據(jù):
x/N
5
10
15
20
25
30
y/cm
7.25
8.12
8.95
9.90
10.9
11.8
若依據(jù)散點(diǎn)圖及最小二乘法求出的回歸直線方程為=0.18x+6.34,求R2,并結(jié)合殘差說明擬合效果.
【導(dǎo)學(xué)號:95032253】
[解] 列表求值如下:
xi
5
10
15
20
25
30
yi
7.25
8.12
8.95
9.90
10.9
11.8
xiyi
36.25
81.2
134.25
198
272.5
354
9、
x
25
100
225
400
625
900
yi-i
0.01
-0.02
-0.09
-0.04
0.06
0.06
yi-
-2.24
-1.37
-0.54
0.41
1.41
2.31
=17.5,≈9.49,iyi=1 076.2,=2 275,(yi-i)2=0.017 4,(yi-)2=14.678 4.
∴R2=1-≈0.998 81,回歸模型擬合效果較好.由表中數(shù)據(jù)可以看出殘差比較均勻地落在寬度不超過0.15的狹窄的水平帶狀區(qū)域中,說明選用的線性回歸模型的精度較高.
[規(guī)律方法] 在一元線性回歸模型中,相關(guān)指標(biāo)R2與相關(guān)
10、系數(shù)r都能刻畫線性回歸模型擬合數(shù)據(jù)的效果.|r|越大,R2就越大,用線性回歸模型擬合數(shù)據(jù)的效果就越好.
[跟蹤訓(xùn)練]
2.關(guān)于x與y有以下數(shù)據(jù):
x
2
4
5
6
8
y
30
40
60
50
70
已知x與y線性相關(guān),由最小二乘法得=6.5,
(1)求y與x的線性回歸方程;
(2)現(xiàn)有第二個線性模型:=7x+17,且R2=0.82.
若與(1)的線性模型比較,哪一個線性模型擬合效果比較好,請說明理由.
[解] (1)依題意設(shè)y與x的線性回歸方程為=6.5x+.
==5,
==50,
∴=6.5x+經(jīng)過(,),
∴50=6.55+,∴=17.5
11、,
∴y與x的線性回歸方程為=6.5x+17.5.
(2)由(1)的線性模型得yi-i與yi-的關(guān)系如下表:
yi-i
-0.5
-3.5
10
-6.5
0.5
yi-
-20
-10
10
0
20
所以(yi-i)2=(-0.5)2+(-3.5)2+(-10)2+(-6.5)2+0.52=155.
(yi-)2=(-20)2+(-10)2+102+02+202=1 000.
所以R=1-=1-=0.845.
由于R=0.845,R2=0.82知R>R2,
所以(1)的線性模型擬合效果比較好.
獨(dú)立性檢驗
獨(dú)立性檢驗是判斷兩個分類變量之間是否有
12、關(guān)系的一種方法.在判斷兩個分類變量之間是否有關(guān)系時,作出等高條形圖只能近似地判斷兩個分類變量是否有關(guān)系,而獨(dú)立性檢驗可以精確地得到可靠的結(jié)論.
為了調(diào)查胃病是否與生活規(guī)律有關(guān),在某地對540名40歲以上的人進(jìn)行了調(diào)查,結(jié)果是:患胃病者生活不規(guī)律的共60人,患胃病者生活規(guī)律的共20人,未患胃病者生活不規(guī)律的共260人,未患胃病者生活規(guī)律的共200人.
(1)根據(jù)以上數(shù)據(jù)列出22列聯(lián)表;
(2)判斷40歲以上的人患胃病與生活規(guī)律是否有關(guān).
【導(dǎo)學(xué)號:95032254】
[思路探究] (1)解決本題關(guān)鍵是首先弄清問題中的兩個分類變量及其取值分別是什么,其次掌握22列聯(lián)表的結(jié)構(gòu)特征.
13、(2)利用22列聯(lián)表計算K2的觀測值,再結(jié)合臨界值表來分析相關(guān)性的大?。?
[解] (1)由已知可列22列聯(lián)表如下:
患胃病
未患胃病
總計
生活規(guī)律
20
200
220
生活不規(guī)律
60
260
320
總計
80
460
540
(2)根據(jù)列聯(lián)表得K2的觀測值為
k=≈9.638.
因為9.638>7.879,
因此,我們在犯錯誤的概率不超過0.005的前提下認(rèn)為40歲以上的人患胃病和生活規(guī)律有關(guān).
[規(guī)律方法] 獨(dú)立性檢驗的一般步驟:
(1)根據(jù)樣本數(shù)據(jù)制成22列聯(lián)表.
(2)根據(jù)公式計算K2的觀測值k.
(3)比較k與臨界值的大小關(guān)系
14、作統(tǒng)計推斷.
[跟蹤訓(xùn)練]
3.為了解某班學(xué)生喜愛打籃球是否與性別有關(guān),對本班50人進(jìn)行問卷調(diào)查得到了如下的列聯(lián)表:
喜愛打籃球
不喜愛打籃球
總計
男生
5
女生
10
總計
50
已知在全部50人中隨機(jī)抽取1人抽到喜愛打籃球的學(xué)生的概率為0.6.
(1)請將上面的列聯(lián)表補(bǔ)充完整(不用寫計算過程);
(2)能否有99%的把握認(rèn)為喜愛打籃球與性別有關(guān)?說明你的理由.
(參考公式:K2=,
其中n=a+b+c+d)
[解] (1)依題意可知喜愛打籃球的學(xué)生的人數(shù)為500.6=30.
列聯(lián)表補(bǔ)充如下:
喜愛打籃球
不喜愛打籃球
總計
男生
20
5
25
女生
10
15
25
總計
30
20
50
(2)因為k=≈8.333>6.635,所以,有99%的把握認(rèn)為喜愛打籃球與性別有關(guān).
6EDBC3191F2351DD815FF33D4435F3756EDBC3191F2351DD815FF33D4435F3756EDBC3191F2351DD815FF33D4435F3756EDBC3191F2351DD815FF33D4435F3756EDBC3191F2351DD815FF33D4435F3756EDBC3191F2351DD815FF33D4435F375