《2017-2018版高中數(shù)學(xué) 第一章 統(tǒng)計(jì) 8 最小二乘估計(jì)學(xué)案 北師大版必修3》由會(huì)員分享,可在線閱讀,更多相關(guān)《2017-2018版高中數(shù)學(xué) 第一章 統(tǒng)計(jì) 8 最小二乘估計(jì)學(xué)案 北師大版必修3(8頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、
8 最小二乘估計(jì)
學(xué)習(xí)目標(biāo) 1.了解用最小二乘法建立線性回歸方程的思想,會(huì)用給出的公式建立線性回歸方程.2.理解回歸直線與觀測(cè)數(shù)據(jù)的關(guān)系,能用線性回歸方程進(jìn)行估計(jì)和預(yù)測(cè).
知識(shí)點(diǎn)一 最小二乘法
思考 具有線性相關(guān)關(guān)系的散點(diǎn)大致分布在一條直線附近.如何確定這條直線比較合理?
知識(shí)點(diǎn)二 線性回歸方程
思考 數(shù)學(xué)上的“回歸”是什么意思?
梳理 用最小二乘法得到的直線方程稱為_(kāi)_________,a,b是線性回歸方程的系數(shù).
如果用表示,用表示,則可以求得
b=
=.
a=________.
類型一 線性
2、回歸方程的求法
例1 下表為某地近幾年機(jī)動(dòng)車輛數(shù)與交通事故數(shù)的統(tǒng)計(jì)資料.
機(jī)動(dòng)車輛數(shù)x/千臺(tái)
95
110
112
120
129
135
150
180
交通事故數(shù)y/千件
6.2
7.5
7.7
8.5
8.7
9.8
10.2
13
(1)請(qǐng)判斷機(jī)動(dòng)車輛數(shù)與交通事故數(shù)之間是否具有線性相關(guān)關(guān)系,如果不具有線性相關(guān)關(guān)系,請(qǐng)說(shuō)明理由;
(2)如果具有線性相關(guān)關(guān)系,求出線性回歸方程.
反思與感悟 即使散點(diǎn)圖呈餅狀,也可利用公式求出線性回歸方程,但這種方程顯然沒(méi)什么價(jià)值.故應(yīng)先畫(huà)出散點(diǎn)圖,看是否呈直線
3、形,再求方程.
跟蹤訓(xùn)練1 以下是某地搜集到的新房屋的銷售價(jià)格y和房屋的面積x的數(shù)據(jù):
房屋面積x(m2)
115
110
80
135
105
銷售價(jià)格y(萬(wàn)元)
24.8
21.6
18.4
29.2
22
(1)畫(huà)出數(shù)據(jù)對(duì)應(yīng)的散點(diǎn)圖;
(2)求線性回歸方程,并在散點(diǎn)圖中加上回歸直線.
類型二 線性回歸方程的應(yīng)用
例2 有一個(gè)同學(xué)家開(kāi)了一個(gè)小賣部,他為了研究氣溫對(duì)熱飲銷售的影響,經(jīng)過(guò)統(tǒng)計(jì),得到一個(gè)賣出的熱飲杯數(shù)與當(dāng)天氣溫的對(duì)比表:
攝氏溫度/℃
-5
0
4
7
12
15
19
23
27
31
4、
36
熱飲杯數(shù)
156
150
132
128
130
116
104
89
93
76
54
(1)畫(huà)出散點(diǎn)圖;
(2)從散點(diǎn)圖中發(fā)現(xiàn)氣溫與熱飲銷售杯數(shù)之間有什么關(guān)系;
(3)求線性回歸方程;
(4)如果某天的氣溫是2℃,預(yù)測(cè)這天賣出的熱飲杯數(shù);
(5) 氣溫為2℃時(shí),小賣部一定能夠賣出143杯左右熱飲嗎?為什么?
反思與感悟 線性回歸方程主要用于預(yù)測(cè),但這種預(yù)測(cè)類似于天氣預(yù)報(bào),不一定與實(shí)際數(shù)據(jù)完全吻合.
跟蹤訓(xùn)練2 有人統(tǒng)計(jì)了同一個(gè)省的6個(gè)城市某一年的人均國(guó)民生產(chǎn)總值(即人均GDP)和這一年各城市患白血病的兒
5、童數(shù),如下表:
人均GDP/萬(wàn)元
10
8
6
4
3
1
患白血病的兒童數(shù)/人
351
312
207
175
132
180
(1)畫(huà)出散點(diǎn)圖,并判定這兩個(gè)變量是否具有線性相關(guān)關(guān)系;
(2)通過(guò)計(jì)算可知這兩個(gè)變量的線性回歸方程為y=23.25x+102.15,假如一個(gè)城市的人均GDP為12萬(wàn)元,那么可以斷言,這個(gè)城市患白血病的兒童一定超過(guò)380人,請(qǐng)問(wèn)這個(gè)斷言是否正確?
1.下列有關(guān)線性回歸的說(shuō)法,不正確的是( )
A.自變量取值一定時(shí),因變量的取值帶有一定隨機(jī)性的兩個(gè)變量之間的關(guān)系叫做相關(guān)關(guān)系
B.在平面直
6、角坐標(biāo)系中用描點(diǎn)的方法得到表示具有相關(guān)關(guān)系的兩個(gè)變量的一組數(shù)據(jù)的圖形叫作散點(diǎn)圖
C.線性回歸方程最能代表觀測(cè)值x、y之間的線性關(guān)系
D.任何一組觀測(cè)值都能得到具有代表意義的線性回歸方程
2.已知回歸直線的斜率的估計(jì)值是1.23,樣本點(diǎn)中心(即(,))為(4,5),( )
A.y=1.23x+4
B.y=1.23x+5
C.y=1.23x+0.08
D.y=0.08x+1.23
3.某產(chǎn)品的廣告費(fèi)用x與銷售額y的統(tǒng)計(jì)數(shù)據(jù)如下表:
廣告費(fèi)用x(萬(wàn)元)
4
2
3
5
銷售額y(萬(wàn)元)
49
26
39
54
根據(jù)上表可得線性回歸方程y=bx+a中的b為9
7、.4,據(jù)此模型預(yù)報(bào)廣告費(fèi)用為6萬(wàn)元時(shí)銷售額為( )
A.63.6萬(wàn)元
B.65.5萬(wàn)元
C.67.7萬(wàn)元
D.72.0萬(wàn)元
4.設(shè)某大學(xué)的女生體重y(單位:kg)與身高x(單位:cm)具有線性相關(guān)關(guān)系,根據(jù)一組樣本數(shù)據(jù)(xi,yi)(i=1,2,…,n),用最小二乘法建立的線性回歸方程為y=0.85x-85.71,則下列結(jié)論中不正確的是( )
A.y與x具有正的線性相關(guān)關(guān)系
B.回歸直線過(guò)樣本點(diǎn)的中心(,)
C.若該大學(xué)某女生身高增加1 cm,則其體重約增加0.85 kg
D.若該大學(xué)某女生身高為170 cm,則可判定其體重必為58.79 kg
1.求線性回歸方程時(shí)
8、應(yīng)注意的問(wèn)題
(1)知道x與y成線性相關(guān)關(guān)系,無(wú)需進(jìn)行相關(guān)性檢驗(yàn),否則應(yīng)首先進(jìn)行相關(guān)性檢驗(yàn),如果兩個(gè)變量之間本身不具有相關(guān)關(guān)系,或者說(shuō),它們之間的相關(guān)關(guān)系不顯著,即使求出線性回歸方程也是毫無(wú)意義的,而且用其估計(jì)和預(yù)測(cè)的量也是不可信的.
(2)用公式計(jì)算a、b的值時(shí),要先計(jì)算b,然后才能算出a.
2.利用線性回歸方程,我們可以進(jìn)行估計(jì)和預(yù)測(cè).若線性回歸方程為y=bx+a,則x=x0處的估計(jì)值為y0=bx0+a.
答案精析
問(wèn)題導(dǎo)學(xué)
知識(shí)點(diǎn)一
思考 應(yīng)該使散點(diǎn)整體上最接近這條直線.最小二乘法是一種求回歸直線的方法,用這種方法求得的回歸直線能使樣本數(shù)據(jù)的點(diǎn)到回歸直線的距離
9、
[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2最?。?
知識(shí)點(diǎn)二
思考 “回歸”一詞最早由英國(guó)統(tǒng)計(jì)學(xué)家(Francils Galton)提出的,本意是子女的身高會(huì)向一般人的均值靠攏.現(xiàn)在這個(gè)概念引伸到隨機(jī)變量有向回歸線集中的趨勢(shì).
梳理
線性回歸方程 -b
題型探究
例1 解 (1)在平面直角坐標(biāo)系中畫(huà)出數(shù)據(jù)的散點(diǎn)圖,如圖.
直觀判斷散點(diǎn)在一條直線附近,故具有線性相關(guān)關(guān)系.
(2)計(jì)算相應(yīng)的數(shù)據(jù)之和:
i=1 031,i=71.6,
=137 835,iyi=9 611.7,
=128.875,=8.95,
將它們代入公式計(jì)
10、算得b≈0.077 4,a≈-1.024 9,
所以,所求線性回歸方程為y=0.077 4x-1.024 9.
跟蹤訓(xùn)練1 解 (1)數(shù)據(jù)對(duì)應(yīng)的散點(diǎn)圖如圖所示:
(2)=i=109,=23.2,
=60 975,iyi=12 952.
設(shè)所求線性回歸方程為y=bx+a,
則b=≈0.196 2,
a=-b=23.2-109×0.196 2=1.814 2,
故所求線性回歸方程為y=0.196 2x+1.814 2.
回歸直線如(1)中圖所示.
例2 解 (1)散點(diǎn)圖如圖所示:
(2)從上圖看到,各點(diǎn)散布在從左上角到右下角的區(qū)域里,因此,氣溫與熱飲銷售杯數(shù)之間呈負(fù)相
11、關(guān),即氣溫越高,賣出去的熱飲杯數(shù)越少.
(3)從散點(diǎn)圖可以看出,這些點(diǎn)大致分布在一條直線的附近,因此,可用公式求出線性回歸方程的系數(shù).利用計(jì)算器容易求得線性回歸方程為y=-2.352x+147.767.
(4)當(dāng)x=2時(shí),y=143.063.因此,某天的氣溫為2℃時(shí),這天大約可以賣出143杯熱飲.
(5)小賣部不一定能夠賣出143杯左右熱飲,原因如下:①線性回歸方程中的截距和斜率都是通過(guò)樣本估計(jì)出來(lái)的,存在誤差,這種誤差可以導(dǎo)致預(yù)測(cè)結(jié)果的偏差.②即使截距和斜率的估計(jì)沒(méi)有誤差,也不可能百分之百地保證對(duì)應(yīng)于x的預(yù)報(bào)值,能夠與實(shí)際值y很接近.我們不能保證點(diǎn)(x,y)落在回歸直線上,甚至不能百分之百地保證它落在回歸直線的附近.
跟蹤訓(xùn)練2 解 (1)散點(diǎn)圖如下:
根據(jù)散點(diǎn)圖可以看出,在6個(gè)點(diǎn)中,雖然第一個(gè)點(diǎn)離這條直線較遠(yuǎn),但其余5個(gè)點(diǎn)大致分布在這條直線的附近,所以這兩個(gè)變量具有線性相關(guān)關(guān)系.
(2)斷言是錯(cuò)誤的,將x=12代入y=23.25x+102.15得y=23.25×12+102.15=381.15>380,但381.15是對(duì)該城市人均GDP為12萬(wàn)元的情況下所作的一個(gè)估計(jì),該城市患白血病的兒童可能超過(guò)380人,也可能低于380人.
當(dāng)堂訓(xùn)練
1.D 2.C 3.B 4.D
8