《新編【創(chuàng)新設計】高考數(shù)學北師大版一輪訓練:第9篇 第3講 相關性、最小二乘估計與統(tǒng)計案例》由會員分享,可在線閱讀,更多相關《新編【創(chuàng)新設計】高考數(shù)學北師大版一輪訓練:第9篇 第3講 相關性、最小二乘估計與統(tǒng)計案例(8頁珍藏版)》請在裝配圖網上搜索。
1、
第3講 相關性、最小二乘估計與統(tǒng)計案例
基礎鞏固題組
(建議用時:40分鐘)
一、選擇題
1.下列兩個變量之間的關系是相關關系的是 ( ).
A.速度一定時,位移與時間
B.單位面積的產量為常數(shù)時,土地面積與總產量
C.身高與體重
D.電壓一定時,電流與電阻
解析 A、B、D中兩個變量間的關系都是確定的,所以是函數(shù)關系;C中的兩個變量間是相關關系,對于身高一樣的人,體重仍可以不同,故選C.
答案 C
2.設(x1,y1),(x2,y2),…,(xn,yn)是變量x和y的n個樣本點,直線l是由這些樣本點通過最小二乘法得到的線性回歸直線(如圖),以下結論
2、正確的是
( ).
A.直線l過點(,)
B.x和y的相關系數(shù)為直線l的斜率
C.x和y的相關系數(shù)在0到1之間
D.當n為偶數(shù)時,分布在l兩側的樣本點的個數(shù)一定相同
解析 由樣本的中心(,)落在回歸直線上可知A正確;x和y的相關系數(shù)表示為x與y之間的線性相關程度,不表示直線l的斜率,故B錯;x和y的相關系數(shù)應在-1到1之間,故C錯;分布在回歸直線兩側的樣本點的個數(shù)并不絕對平均,即無論樣本點個數(shù)是奇數(shù)還是偶數(shù),故D錯.
答案 A
3.在一組樣本數(shù)據(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點圖中,若所有樣本點(xi,yi)
3、(i=1,2,…,n)都在直線y=x+1上,則這組樣本數(shù)據的樣本相關系數(shù)為 ( ).
A.-1 B.0
C. D.1
解析 所有點均在直線上,則樣本相關系數(shù)最大即為1,故選D.
答案 D
4.(20xx·九江模擬)對具有線性相關關系的變量x,y,測得一組數(shù)據如下
x
2
4
5
6
8
y
20
40
60
70
80
根據上表,利用最小二乘法得它們的回歸直線方程為y=10.5x+a,據此模型來預測當x=20時,y的估計值為( ).
A.210 B.210.5
C.211.5 D.212.5
解析 由數(shù)據中可知=5,=54,代入回歸直線方
4、程得a=1.5,所以y=10.5x+1.5,當x=20時,y=10.5×20+1.5=211.5.
答案 C
5.(20xx·延安模擬)某校為了研究學生的性別和對待某一活動的態(tài)度(支持與不支持)的關系,運用2×2列聯(lián)表進行獨立性檢驗,經計算χ2=7.069,則有多大把握認為“學生性別與支持該活動有關系”. ( ).
A.0.1% B.1%
C.99% D.99.9%
解析 因為χ2=7.069>6.635,所以P(χ2>6.635)=0.010,所以說有99%的把握認為“學生性別與支持該活動有關系”.
答案 C
二、填空題
6.已知施化肥量x與水稻產量y的試驗數(shù)據如下表,
5、則變量x與變量y是________相關(填“正”或“負”).
施化肥量x
15
20
25
30
35
40
45
水稻產量y
330
345
365
405
445
450
455
解析 因為散點圖能直觀地反映兩個變量是否具有相關關系,所以畫出散點圖如圖所示:
通過觀察圖像可知變量x與變量y是正相關.
答案 正
7.(20xx·濟南模擬)為了均衡教育資源,加大對偏遠地區(qū)的教育投入,調查了某地若干戶家庭的年收入x(單位:萬元)和年教育支出y(單位:萬元),調查顯示年收入x與年教育支出y具有線性相關關系,并由調查數(shù)據得到y(tǒng)對x的回歸直線方程:y=0.1
6、5x+0.2.由回歸直線方程可知,家庭年收入每增加1萬元,年教育支出平均增加________萬元.
解析 回歸直線的斜率為0.15,所以家庭年收入每增加1萬元,年教育支出平均增加0.15萬元.
答案 0.15
8.為了判斷高中三年級學生是否選修文科與性別的關系,現(xiàn)隨機抽取50名學生,得到如下2×2列聯(lián)表:
理科
文科
男
13
10
女
7
20
根據表中數(shù)據,得到χ2=≈4.844.
則認為選修文科與性別有關系的可能性約為________.
解析 ∵χ2≈4.844,根據假設檢驗的基本原理,應該斷定“是否選修文科與性別之間有關系”成立,并且這種判斷正確的可能性
7、約為95%.
答案 95%
三、解答題
9.某班主任對全班50名學生進行了作業(yè)量多少的調查.數(shù)據如下表:
認為作業(yè)多
認為作業(yè)不多
合計
喜歡玩游戲
18
9
不喜歡玩游戲
8
15
合計
(1)請完善上表中所缺的有關數(shù)據;
(2)試通過計算說明有多大把握認為喜歡玩游戲與作業(yè)量的多少有關系?
解 (1)
認為作業(yè)多
認為作業(yè)不多
合計
喜歡玩游戲
18
9
27
不喜歡玩游戲
8
15
23
合計
26
24
50
(2)將表中的數(shù)據代入公式χ2==≈5.059>3.841,
即說明有95%以上的把握
8、認為喜歡玩游戲與作業(yè)量的多少有關系.
10.下表提供了某廠節(jié)能降耗技術改造后生產甲產品過程中記錄的產量x(噸)與相應的生產能耗y(噸標準煤)的幾組對照數(shù)據.
x
3
4
5
6
y
2.5
3
4
4.5
(1)請畫出上表數(shù)據的散點圖;
(2)請根據上表提供的數(shù)據,用最小二乘法求出y關于x的線性回歸方程y=bx+a;
(3)已知該廠技改前生產100噸甲產品的生產能耗為90噸標準煤.試根據(2)求出的線性回歸方程,預測生產100噸甲產品的生產能耗比技改前降低多少噸標準煤?
(參考數(shù)值:3×2.5+4×3+5×4+6×4.5=66.5)
解 (1)由題設所給數(shù)據,可
9、得散點圖如圖所示.
(2)由對照數(shù)據,計算得:=86,
==4.5(噸),
==3.5(噸).
已知iyi=66.5,
所以,由最小二乘法確定的回歸方程的系數(shù)為:
b===0.7,
a=-b=3.5-0.7×4.5=0.35.
因此,所求的線性回歸方程為y=0.7x+0.35.
(3)由(2)的回歸方程及技改前生產100噸甲產品的生產能耗,得降低的生產能耗為:
90-(0.7×100+0.35)=19.65(噸標準煤).
能力提升題組
(建議用時:25分鐘)
一、選擇題
1.以下四個命題,其中正確的是 ( ).
①從勻速傳遞的產品生產流水線上,質檢員每
10、20分鐘從中抽取一件產品進行某項指標檢測,這樣的抽樣是分層抽樣;
②兩個隨機變量相關性越強,則相關系數(shù)的絕對值越接近于1;
③在線性回歸方程y=0.2x+12中,當解釋變量x每增加一個單位時,預報變量y平均增加0.2個單位;
④對分類變量X與Y,它們的隨機變量χ2值越小,“X與Y有關系”的把握程度越大.
A.①④ B.②④
C.①③ D.②③
解析 ①是系統(tǒng)抽樣;對于④,隨機變量χ2值越小,說明兩個相關變量有關系的把握程度越?。?
答案 D
2.變量X與Y相對應的一組數(shù)據為(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);變量U與V相對應的一組
11、數(shù)據為(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示變量Y與X之間的線性相關系數(shù),r2表示變量V與U之間的線性相關系數(shù),則 ( ).
A.r2<r1<0 B.0<r2<r1
C.r2<0<r1 D.r2=r1
解析 對于變量Y與X而言,Y隨X的增大而增大,故Y與X正相關,即r1>0;對于變量V與U而言,V隨U的增大而減小,故V與U負相關,即r2<0,所以選C.
答案 C
二、填空題
3.(20xx·江西重點中學聯(lián)考)某車間為了規(guī)定工時定額,需要確定加工零件所花費的時間,為此進行了5次試驗.根據收集到的數(shù)據(如下表),由最小二乘法求得回
12、歸方程y=0.67x+54.9.
零件數(shù)x(個)
10
20
30
40
50
加工時間y(min)
62
75
81
89
現(xiàn)發(fā)現(xiàn)表中有一個數(shù)據看不清,請你推斷出該數(shù)據的值為________.
解析 由已知可計算求出=30,而回歸直線方程必過點(,),則=0.67×30+54.9=75,設模糊數(shù)字為a,則
=75,計算得a=68.
答案 68
三、解答題
4.電視傳媒公司為了解某地區(qū)觀眾對某類體育節(jié)目的收視情況,隨機抽取了100名觀眾進行調查,其中女性有55名.下面是根據調查結果繪制的觀眾日均收看該體育節(jié)目時間的頻率分布直方圖:
將日均收看該體育節(jié)
13、目時間不低于40分鐘的觀眾稱為“體育迷”,已知“體育迷”中有10名女性.
(1)根據已知條件完成下面的2×2列聯(lián)表,并據此資料你是否認為“體育迷”與性別有關?
非體育迷
體育迷
合計
男
女
合計
(2)將日均收看該體育節(jié)目不低于50分鐘的觀眾稱為“超級體育迷”,已知“超級體育迷”中有2名女性.若從“超級體育迷”中任意選取2人,求至少有1名女性觀眾的概率.
解 (1)由所給的頻率分布直方圖知,
“體育迷”人數(shù)為100×(10×0.020+10×0.005)=25,
“非體育迷”人數(shù)為75,則據題意完成2×2列聯(lián)表:
非體育迷
14、
體育迷
合計
男
30
15
45
女
45
10
55
合計
75
25
100
將2×2列聯(lián)表的數(shù)據代入公式計算:
χ2==≈3.030.
因為3.030>2.706,
所以有90%的把握認為“體育迷”與性別有關.
(2)由所給的頻率分布直方圖知
“超級體育迷”人數(shù)為100×(10×0.005)=5,
記ai(i=1,2,3)表示男性,bj(j=1,2)表示女性,所有可能結果構成的基本事件空間為Ω={(a1,a2),(a1,a3),(a2,a3),(a1,b1),(a2,b1),(a3,b1),(a1,b2),(a2,b2),(a3,b2),(b1,b2)},共有10個基本事件組成,且每個基本事件出現(xiàn)是等可能的.用A表示事件“任選2人,至少1名女性”,
則A={(a1,b1),(a2,b1),(a3,b1),(a1,b2),(a2,b2),(a3,b2),(b1,b2)},共有7個基本事件組成,故任選2人,至少1名女性觀眾的概率為P(A)=.