2019-2020年高考數(shù)學大一輪復習 第十章 統(tǒng)計、統(tǒng)計案例與算法初步同步練習 文.doc
《2019-2020年高考數(shù)學大一輪復習 第十章 統(tǒng)計、統(tǒng)計案例與算法初步同步練習 文.doc》由會員分享,可在線閱讀,更多相關《2019-2020年高考數(shù)學大一輪復習 第十章 統(tǒng)計、統(tǒng)計案例與算法初步同步練習 文.doc(59頁珍藏版)》請在裝配圖網上搜索。
2019-2020年高考數(shù)學大一輪復習 第十章 統(tǒng)計、統(tǒng)計案例與算法初步同步練習 文 1.理解隨機抽樣的必要性和重要性. 2.會用簡單隨機抽樣方法從總體中抽取樣本,了解分層抽樣和系統(tǒng)抽樣方法. 三種抽樣方法 類別 共同點 各自特點 相互聯(lián)系 適用范圍 簡單隨 機抽樣 抽樣過程中每個個體被抽取的概率相等,均屬于不放回抽樣 從總體中逐個抽取 總體中的個體數(shù)較少 系統(tǒng) 抽樣 將總體均分成幾部分,按事先確定的規(guī)則在各部分中抽取 在起始部分抽樣時采用簡單隨機抽樣 總體中的個體數(shù)較多 分層 抽樣 將總體分成幾層,分層進行抽樣 各層抽樣時采用簡單隨機抽樣或系統(tǒng)抽樣 總體由差異明顯的幾部分組成 兩種抽樣的步驟 (1)系統(tǒng)抽樣的步驟 ①先將總體的N個個體編號; ②確定分段間隔k(k∈N*),對編號進行分段.當(n是樣本容量)是整數(shù)時,取k=; ③在第1段用簡單隨機抽樣確定第1個個體編號l(l≤k); ④按照一定的規(guī)則抽取樣本.通常是將l加上間隔k得到第2個個體編號(l+k),再加上k得到第3個個體編號(l+2k),依次進行下去,直到獲取整個樣本. (2)分層抽樣的步驟 ①分層:按某種特征將總體分成若干部分; ②按比例確定每層抽取個體的個數(shù); ③各層分別按簡單隨機抽樣或系統(tǒng)抽樣的方法抽取個體; ④綜合每層抽樣,組成樣本. 1.判斷下面結論是否正確(請在括號中打“√”或“”) (1)分層抽樣就是按比例抽樣.( ) (2)簡單隨機抽樣是一種不放回抽樣.( ) (3)簡單隨機抽樣每個個體被抽到的機會不一樣,與先后有關.( ) (4)系統(tǒng)抽樣在起始部分抽樣時采用簡單隨機抽樣.( ) (5)分層抽樣中,每個個體被抽到的可能性與層數(shù)及分層有關.( ) 答案: (1)√ (2)√ (3) (4)√ (5) 2.(xx江西卷)總體由編號為01,02,…,19,20的20個個體組成,利用下面的隨機數(shù)表選取5個個體,選取方法是從隨機數(shù)表第1行的第5列和第6列數(shù)字開始由左到右依次選取兩個數(shù)字,則選出來的第5個個體的編號為( ) 7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481 A.08 B.07 C.02 D.01 解析: 由隨機數(shù)表法的隨機抽樣的過程可知選出的5個個體是08,02,14,07,01,所以第5個個體的編號是01. 答案: D 3.(xx廣東卷)為了解1 000名學生的學習情況,采用系統(tǒng)抽樣的方法,從中抽取容量為40的樣本,則分段的間隔為( ) A.50 B.40 C.25 D.20 解析: 由=25,可得分段的間隔為25.故選C. 答案: C 4.(xx湖北卷)甲、乙兩套設備生產的同類型產品共4 800件,采用分層抽樣的方法從中抽取一個容量為80的樣本進行質量檢測.若樣本中有50件產品由甲設備生產,則乙設備生產的產品總數(shù)為________件. 解析: 設乙設備生產的產品總數(shù)為x件,則甲設備生產的產品總數(shù)為(4 800-x)件.由分層抽樣特點,結合題意可得=,解得x=1 800. 答案: 1 800 5.為了解1 200名學生對學校某項教改實驗的意見,打算從中抽取一個容量為30的樣本,考慮采取系統(tǒng)抽樣,則分段的間隔k為________. 解析: 在系統(tǒng)抽樣中,確定分段間隔k,對編號進行分段, k=(N為總體的容量,n為樣本的容量), ∴k===40. 答案: 40 簡單隨機抽樣 1.利用簡單隨機抽樣,從n個個體中抽取一個容量為10的樣本.若第二次抽取時,余下的每個個體被抽到的概率為,則在整個抽樣過程中,每個個體被抽到的概率為( ) A. B. C. D. 解析: 由題意知=,∴n=28.∴P==. 答案: B 2.下列抽取樣本的方式是簡單隨機抽樣的有________個. ①從無限多個個體中抽取50個個體作為樣本; ②箱子里有100支鉛筆,今從中選取10支進行檢驗.在抽樣操作時,從中任意拿出一支檢測后再放回箱子里; ③從50個個體中一次性抽取5個個體作為樣本. 解析:?、俨粷M足樣本的總體數(shù)較少的特點;②不滿足不放回抽取的特點;③不滿足逐個抽取的特點. 答案: 0 解決簡單隨機抽樣應注意的問題 (1)一個抽樣試驗能否用抽簽法,關鍵看兩點:一是抽簽是否方便;二是號簽是否易攪勻.一般地,當總體容量和樣本容量都較小時可用抽簽法. (2)在使用隨機數(shù)表時,如遇到三位數(shù)或四位數(shù)時,可從選擇的隨機數(shù)表中的某行某列的數(shù)字計起,每三個或四個作為一個單位,自左向右選取,有超過總體號碼或出現(xiàn)重復號碼的數(shù)字舍去. 系統(tǒng)抽樣 1.(xx湖南卷)對一個容量為N的總體抽取容量為n的樣本,當選取簡單隨機抽樣、系統(tǒng)抽樣和分層抽樣的三種不同方法抽取樣本時,總體中每個個體被抽中的概率分別為p1,p2,p3,則( ) A.p1=p2<p3 B.p2=p3<p1 C.p1=p3<p2 D.p1=p2=p3 解析: 根據(jù)抽樣方法的概念可知,簡單隨機抽樣、系統(tǒng)抽樣和分層抽樣三種抽樣,每個個體被抽到的概率都是p=,故p1=p2=p3,故選D. 答案: D 2.(xx陜西卷)某單位有840名職工,現(xiàn)采用系統(tǒng)抽樣方法抽取42人做問卷調查,將840人按1,2,…,840隨機編號,則抽取的42人中,編號落入?yún)^(qū)間[481,720]的人數(shù)為( ) A.11 B.12 C.13 D.14 解析: 抽樣間隔為=20.設在1,2,…,20中抽取號碼x0(x0∈[1,20]),在[481,720]之間抽取的號碼記為20k+x0,則481≤20k+x0≤720,k∈N*. ∴24≤k+≤36. ∵∈,∴k=24,25,26,…,35, ∴k值共有35-24+1=12(個),即所求人數(shù)為12. 答案: B 解決系統(tǒng)抽樣應注意的問題 (1)適合元素個數(shù)較多且均衡的總體; (2)各個個體被抽到的機會均等; (3)樣本的第一個個體用簡單隨機抽樣. 分層抽樣 1.(xx重慶卷)某中學有高中生3 500人,初中生1 500人,為了解學生的學習情況,用分層抽樣的方法從該校學生中抽取一個容量為n的樣本,已知從高中生中抽取70人,則n為( ) A.100 B.150 C.200 D.250 解析: 法一:由題意可得=,解得n=100,故選A. 法二:由題意,抽樣比為=,總體容量為3 500+1 500=5 000,故n=5 000=100. 答案: A 2.某高中在校學生有2 000人.為了響應“陽光體育運動”的號召,學校開展了跑步和登山比賽活動.每人都參與而且只參與其中一項比賽,各年級參與比賽的人數(shù)情況如下表: 高一年級 高二年級 高三年級 跑步 a b c 登山 x y z 其中a∶b∶c=2∶3∶5,全校參與登山的人數(shù)占總人數(shù)的.為了了解學生對本次活動的滿意程度,從中抽取一個200人的樣本進行調查,則從高二年級參與跑步的學生中應抽取( ) A.36人 B.60人 C.24人 D.30人 解析: 根據(jù)題意可知樣本中參與跑步的人數(shù)為200=120,所以從高二年級參與跑步的學生中應抽取的人數(shù)為120=36. 答案: A 分層抽樣問題的解題策略 (1)確定抽樣比.可依據(jù)各層總數(shù)與樣本數(shù)之比,確定抽樣比. (2)求某一層的樣本數(shù)或總體個數(shù).可依題意求出抽樣比,再由某層總體個數(shù)(或樣本數(shù))確定該層的樣本(或總體)數(shù). (3)求各層的樣本數(shù).可依據(jù)題意,求出各層的抽樣比,再求出各層樣本數(shù). A級 基礎訓練 1.(xx大連市第一次模擬)某學校禮堂有30排座位,每排有20個座位,一次心理講座時禮堂中坐滿了學生,會后為了了解有關情況,留下座位號是15的30名學生.這里運用的抽樣方法是( ) A.抽簽法 B.隨機數(shù)表法 C.系統(tǒng)抽樣 D.分層抽樣 解析: 抽30名學生分了30組(每排為一組),每組抽一個,符合系統(tǒng)抽樣的定義,故選C. 答案: C 2.某班級有男生20人,女生30人,從中抽取10人作為樣本,恰好抽到了4個男生、6個女生,則下列命題正確的是( ) A.該抽樣可能是簡單隨機抽樣 B.該抽樣一定不是系統(tǒng)抽樣 C.該抽樣中女生被抽到的概率大于男生被抽到的概率 D.該抽樣中女生被抽到的概率小于男生被抽到的概率 解析: 本題看似是一道分層抽樣的題,實際上每種抽樣方法都可能出現(xiàn)這個結果,故B不正確.根據(jù)抽樣的等概率性知C,D不正確. 答案: A 3.800名學生中抽50名學生做牙齒健康檢查.現(xiàn)將800名學生從1到800進行編號,求得間隔數(shù)k==16,即每16人抽取一個人.在1~16中隨機抽到一個數(shù),如果抽到的是7,則從33~48這16個數(shù)中應取的數(shù)是( ) A.40 B.39 C.38 D.37 解析: 按系統(tǒng)抽樣分組,33~48這16個數(shù)屬第3組,則這一組應抽到的數(shù)是7+216=39. 答案: B 4.交通管理部門為了解機動車駕駛員(簡稱駕駛員)對某新法規(guī)的知曉情況,對甲、乙、丙、丁四個社區(qū)做分層抽樣調查.假設四個社區(qū)駕駛員的總人數(shù)為N,其中甲社區(qū)有駕駛員96人.若在甲、乙、丙、丁四個社區(qū)抽取駕駛員的人數(shù)分別為12,21,25,43,則這四個社區(qū)駕駛員的總人數(shù)N為( ) A.101 B.808 C.1 212 D.2 012 解析: 由題意知抽樣比為,而四個社區(qū)一共抽取的駕駛員人數(shù)為12+21+25+43=101,故有=,解得N=808. 答案: B 5.(xx上海松江期末考試)某市共有400所學校,現(xiàn)要用系統(tǒng)抽樣的方法抽取20所學校作為樣本,調查學生課外閱讀的情況.把這400所學校編上1~400的號碼,再從1~20中隨機抽取一個號碼,如果此時抽得的號碼是6,則在編號為21到40的學校中,應抽取的學校的編號為( ) A.25 B.26 C.27 D.以上都不是 解析: 系統(tǒng)抽樣是把個體編號后,先抽取第一個,然后每次間隔相同的數(shù)依次抽取,本題中每次間隔20,第一個抽取的是6號,接下來應該抽取的是26號,故選B. 答案: B 6.(xx天津卷)某大學為了解在校本科生對參加某項社會實踐活動的意向,擬采用分層抽樣的方法,從該校四個年級的本科生中抽取一個容量為300的樣本進行調查.已知該校一年級、二年級、三年級、四年級的本科生人數(shù)之比為4∶5∶5∶6,則應從一年級本科生中抽取________名學生. 解析: 由分層抽樣的特點可得應該從一年級本科生中抽取300=60(名)學生. 答案: 60 7.(xx江蘇南通二調)從編號為0,1,2,…,79的80件產品中,采用系統(tǒng)抽樣的方法抽取容量是5的樣本,若編號為28的產品在樣本中,則該樣本中產品的最大編號為________. 解析: 根據(jù)系統(tǒng)抽樣的特點,共有80個產品,抽取5個樣品,則可得組距為=16,又其中有1個為28,則與之相鄰的為12和44,故所取5個依次為12,28,44,60,76,即最大的為76. 答案: 76 8.某市有A、B、C三所學校,共有高三文科學生1 500人,且A、B、C三所學校的高三文科學生人數(shù)成等差數(shù)列,在三月進行全市聯(lián)考后,準備用分層抽樣的方法從所有高三文科學生中抽取容量為n的樣本,進行成績分析,若從B校學生中抽取40人,則n=________. 解析: 設A、B、C三所學校學生人數(shù)分別為x、y、z,由題知x,y,z成等差數(shù)列,所以x+z=2y,又x+y+z=1 500,所以y=500,用分層抽樣方法抽取B校學生人數(shù)為500=40,得n=120. 答案: 120 9.某初級中學共有學生2 000名,各年級男、女生人數(shù)如下表: 初一年級 初二年級 初三年級 女生 373 x y 男生 377 370 z 已知在全校學生中隨機抽取1名,抽到初二年級女生的概率是0.19. (1)求x的值; (2)現(xiàn)用分層抽樣的方法在全校抽取48名學生,問應在初三年級抽取多少名? 解析: (1)∵=0.19,∴x=380. (2)初三年級人數(shù)為y+z=2 000-(373+377+380+370)=500, 現(xiàn)用分層抽樣的方法在全校抽取48名學生,應在初三年級抽取的人數(shù)為:500=12名. 10.一次數(shù)學模擬考試,共12道選擇題,每題5分,共計60分,每道題有四個可供選擇的答案,僅有一個是正確的.學生小張只能確定其中10道題的正確答案,其余2道題完全靠猜測回答. 小張所在班級共有40人,此次考試選擇題得分情況統(tǒng)計表如下: 得分(分) 40 45 50 55 60 百分率 15% 10% 25% 40% 10% 現(xiàn)采用分層抽樣的方法從此班級抽取20人的試卷進行選擇題質量分析. (1)應抽取多少張選擇題得60分的試卷? (2)若小張選擇題得60分,求他的試卷被抽到的概率. 解析: (1)得60分的人數(shù)為4010%=4. 設抽取x張選擇題得60分的試卷,則=, 則x=2,故應抽取2張選擇題得60分的試卷. (2)設小張的試卷為a1,另三名得60分的同學的試卷為a2,a3,a4,所有抽取60分試卷的方法為:(a1,a2),(a1,a3),(a1,a4),(a2,a3),(a2,a4),(a3,a4)共6種,其中小張的試卷被抽到的抽法共有3種,故小張的試卷被抽到的概率為P==. B級 能力提升 1.在某大學數(shù)學專業(yè)的160名學生中開展一項社會調查,先將學生隨機編號為01,02,03,…,160,采用系統(tǒng)抽樣的方法抽取樣本,已知抽取的學生中最小的兩個編號為07,23,那么抽取的學生中最大編號應該是( ) A.150 B.151 C.142 D.143 解析: 由最小的兩個編號為07,23可知,抽樣間距為16,因此抽取人數(shù)的比例為,即抽取10名學生,其編號構成首項為7,公差為16的等差數(shù)列,故抽取的學生中最大編號為7+916=151. 答案: B 2.一個總體中的80個個體編號為0,1,2,…,79,并依次將其分為8個組,組號為0,1,…,7,要用(錯位)系統(tǒng)抽樣的方法抽取一個容量為8的樣本.即規(guī)定先在第0組隨機抽取一個號碼,記為i,依次錯位地得到后面各組的號碼,即第k組中抽取個位數(shù)字為i+k(當i+k<10)或i+k-10(當i+k≥10)的號碼.在i=6時,所抽到的8個號碼是________. 解析: 由題意得,在第1組抽取的號碼的個位數(shù)字是6+1=7,故應選17;在第2組抽取的號碼的個位數(shù)字是6+2=8,故應選28,此次類推,應選39,40,51,62,73. 答案: 6,17,28,39,40,51,62,73 3.某公司有一批專業(yè)技術人員,對他們進行年齡狀況和接受教育程度(學歷)的調查,其結果(人數(shù)分布)如下表: 學歷 35歲以下 35~50歲 50歲以上 本科 80 30 20 研究生 x 20 y (1)用分層抽樣的方法在35~50歲年齡段的專業(yè)技術人員中抽取一個容量為5的樣本,將該樣本看成一個總體,從中任取2人,求至少有1人學歷為研究生的概率; (2)在這個公司的專業(yè)技術人員中按年齡狀況用分層抽樣的方法抽取N個人,其中35歲以下48人,50歲以上10人,再從這N個人中隨機抽取出1人,此人的年齡為50歲以上的概率為,求x,y的值. 解析: (1)用分層抽樣的方法在35~50歲中抽取一個容量為5的樣本,設抽取學歷為本科的人數(shù)為m,∴=,解得m=3. 抽取的樣本中有研究生2人,本科生3人,分別記作S1,S2;B1,B2,B3. 從中任取2人的所有等可能基本事件共有10個:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2),(B1,B2),(B1,B3),(B2,B3), 其中至少有1人的學歷為研究生的基本事件有7個:(S1,B1),(S1,B2),(S1,B3),(S2,B1),(S2,B2),(S2,B3),(S1,S2). ∴從中任取2人,至少有1人學歷為研究生的概率為. (2)由題意,得=,解得N=78. ∴35~50歲中被抽取的人數(shù)為78-48-10=20, ∴==,解得x=40,y=5. 即x,y的值分別為40,5. 4.某公路設計院有工程師6人,技術員12人,技工18人,要從這些人中抽取n個人參加市里召開的科學技術大會.如果采用系統(tǒng)抽樣和分層抽樣的方法抽取,不用剔除個體,如果參會人數(shù)增加1個,則在采用系統(tǒng)抽樣時,需要在總體中先剔除1個個體,求n. 解析: 總體容量為6+12+18=36. 當樣本容量是n時,由題意知,系統(tǒng)抽樣的間隔為,分層抽樣的比例是,抽取的工程師人數(shù)為6=,技術員人數(shù)為12=,技工人數(shù)為18=,所以n應是6的倍數(shù),36的約數(shù),即n=6,12,18.由條件增加1人時知,只有n=6符合. 第二節(jié) 用樣本估計總體 1.了解分布的意義與作用,能根據(jù)頻率分布表畫頻率分布直方圖、頻率折線圖、莖葉圖,體會它們各自的特點. 2.理解樣本數(shù)據(jù)標準差的意義和作用,會計算數(shù)據(jù)標準差. 3.能從樣本數(shù)據(jù)中提取基本的數(shù)字特征(如平均數(shù)、標準差),并做出合理的解釋. 4.會用樣本的頻率分布估計總體分布,會用樣本的基本數(shù)字特征估計總體的基本數(shù)字特征,理解用樣本估計總體的思想. 5.會用隨機抽樣的基本方法和樣本估計總體的思想解決一些簡單的實際問題. 1.統(tǒng)計圖表的含義 (1)頻率分布表 ①含義:把反映總體頻率分布的表格稱為頻率分布表. ②頻率分布表的畫法步驟: 第一步:求極差,決定組數(shù)和組距,組距=; 第二步:分組,通常對組內數(shù)值所在區(qū)間取左閉右開區(qū)間,最后一組取閉區(qū)間; 第三步:登記頻數(shù),計算頻率,列出頻率分布表. (2)頻率分布直方圖:能夠反映樣本的頻率分布規(guī)律的直方圖. (3)頻率分布折線圖:將頻率分布直方圖中各相鄰的矩形的上底邊的中點順次連接起來,就得到頻率分布折線圖. (4)總體密度曲線:如果將樣本容量取得足夠大,分組的組距足夠小,則相應的頻率折線圖將趨于一條光滑曲線,即總體密度曲線. (5)莖葉圖的畫法步驟 第一步:將每個數(shù)據(jù)分為莖(高位)和葉(低位)兩部分; 第二步:將最小莖與最大莖之間的數(shù)按大小次序排成一列; 第三步:將各個數(shù)據(jù)的葉依次寫在其莖的兩側. 2.樣本的數(shù)字特征 (1)眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個數(shù)據(jù),叫做這組數(shù)據(jù)的眾數(shù). (2)中位數(shù):把n個數(shù)據(jù)按大小順序排列,處于最中間位置的一個數(shù)據(jù)叫做這組數(shù)據(jù)的中位數(shù). (3)平均數(shù):把稱為a1,a2,…,an這n個數(shù)的平均數(shù). (4)標準差與方差:設一組數(shù)據(jù)x1,x2,x3,…,xn的平均數(shù)為,則這組數(shù)據(jù)的標準差和方差分別是 s= s2=[(x1-)2+(x2-)2+…+(xn-)2] 1.標準差和方差的異同 相同點:標準差和方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動的大小. 不同點:方差與原始數(shù)據(jù)的單位不同,且平方后可能夸大了偏差程度,標準差則不然. 2.眾數(shù)、中位數(shù)和平均數(shù)的異同 眾數(shù) 中位數(shù) 平均數(shù) 相同點 都是描述一組數(shù)據(jù)集中趨勢的量 不同點 與這組數(shù)據(jù)中的部分數(shù)據(jù)有關,出現(xiàn)在這些數(shù)據(jù)中 不一定在這些數(shù)據(jù)中出現(xiàn).奇數(shù)個時,在這組數(shù)值中出現(xiàn);偶數(shù)時,為中間兩數(shù)平均值 不一定在這些數(shù)值中出現(xiàn) 1.判斷下面結論是否正確(請在括號中打“√”或“”) (1)在頻率分布直方圖中,小矩形的高表示頻率.( ) (2)頻率分布直方圖中各個長方形的面積之和為1.( ) (3)莖葉圖一般左側的葉按從大到小的順序寫,右側的葉按從小到大的順序寫,相同的數(shù)據(jù)可以只記一次.( ) (4)莖葉圖只適用數(shù)據(jù)為兩位數(shù)字.( ) (5)平均數(shù)、眾數(shù)與中位數(shù)從不同的角度描述了一組數(shù)據(jù)的集中趨勢.( ) 答案: (1) (2)√ (3) (4) (5)√ 2.從一堆蘋果中任取10只,稱得它們的質量如下(單位:克): 125 120 122 105 130 114 116 95 120 134 則樣本數(shù)據(jù)落在[114.5,124.5)內的頻率為( ) A.0.2 B.0.3 C.0.4 D.0.5 解析: 落在[114.5,124.5)內的樣本數(shù)據(jù)為120,122,116,120,共4個,故所求頻率為==0.4. 答案: C 3.(xx廣東卷)已知某地區(qū)中小學生人數(shù)和近視情況分別如圖①和圖②所示.為了解該地區(qū)中小學生的近視形成原因,用分層抽樣的方法抽取2%的學生進行調查,則樣本容量和抽取的高中生近視人數(shù)分別為( ) A.200,20 B.100,20 C.200,10 D.100,10 解析: 該地區(qū)中小學生總人數(shù)為3 500+2 000+4 500=10 000,則樣本容量為10 0002%=200,其中抽取的高中生近視人數(shù)為2 0002%50%=20,故選A. 答案: A 4.甲、乙兩個班各隨機選出15名同學進行測驗,所得成績的莖葉圖如圖.從圖中看,________班的平均成績較高. 解析: 結合莖葉圖中成績的情況可知,乙班平均成績較高. 答案: 乙 5.某學員在一次射擊測試中射靶10次,命中環(huán)數(shù)如下: 7,8,7,9,5,4,9,10,7,4. 則:(1)平均命中環(huán)數(shù)為________; (2)命中環(huán)數(shù)的標準差為________. 解析: (1)==7. (2)s2=[(7-7)2+(8-7)2+(7-7)2+(9-7)2+(5-7)2+(4-7)2+(9-7)2+(10-7)2+(7-7)2+(4-7)2]=4,∴s=2. 答案: (1)7 (2)2 樣本的數(shù)字特征 1.某廠10名工人在一小時內生產零件的個數(shù)分別是15,17,14,10,15,17,17,16,14,12,設該組數(shù)據(jù)的平均數(shù)為a,中位數(shù)為b,眾數(shù)為c,則有( ) A.a>b>c B.b>c>a C.c>a>b D.c>b>a 解析: 把該組數(shù)據(jù)按從小到大的順序排列為10,12,14,14,15,15,16,17,17,17,其平均數(shù)a=(10+12+14+14+15+15+16+17+17+17)=14.7,中位數(shù)b==15,眾數(shù)c=17,則a<b<c. 答案: D 2.一個樣本a,3,5,7的平均數(shù)是b,且a,b是方程x2-5x+4=0的兩根,則這個樣本的方差是( ) A.3 B.4 C.5 D.6 解析: 由x2-5x+4=0兩根分別為1,4, ∴有或. 又a,3,5,7的平均數(shù)是b. 即=b,=b,a+15=4b, ∴符合題意,則方差s2=5,故選C. 答案: C 3.(xx陜西卷)某公司10位員工的月工資(單位:元)為x1,x2,…,x10,其均值和方差分別為和s2,若從下月起每位員工的月工資增加100元,則這10位員工下月工資的均值和方差分別為( ) A.,s2+1002 B.+100,s2+1002 C.,s2 D.+100,s2 解析: 法一:對平均數(shù)和方差的意義深入理解可巧解.因為每個數(shù)據(jù)都加上了100,故平均數(shù)也增加100,而離散程度應保持不變,故選D. 法二:由題意知x1+x2+…xn=n ,s2=[(x1-)2+(x2-)2+…+(xn-)2], 則所求均值=[(x1+100)+(x2+100)+…+(xn+100)]=(n +n100)=+100, 而所求方差t2=[(x1+100-)2+(x2+100-)2+…+(xn+100-)2]=[(x1-)2+(x2-)2+…+(xn-)2]=s2,故選D. 答案: D 眾數(shù)、中位數(shù)、平均數(shù)及方差的意義及計算方法 (1)平均數(shù)與方差都是重要的數(shù)字特征,是對總體的一種簡明地描述,平均數(shù)、中位數(shù)、眾數(shù)描述其集中趨勢,方差和標準差描述波動大?。? (2)平均數(shù)、方差的公式推廣 ①若數(shù)據(jù)x1,x2,…,xn的平均數(shù)為,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均數(shù)是m +a. ②數(shù)據(jù)x1,x2,…,xn的方差為s2. (ⅰ)數(shù)據(jù)x1+a,x2+a,…,xn+a的方差也為s2; (ⅱ)數(shù)據(jù)ax1,ax2,…,axn的方差為a2s2. (3)方差的簡化計算公式 s2=[(x+x+…+x)-n 2],或寫成s2=(x+x+…+x)-2,即方差等于原數(shù)據(jù)平方的平均數(shù)減去平均數(shù)的平方. 莖葉圖 (xx新課標全國卷Ⅰ)為了比較兩種治療失眠癥的藥(分別稱為A藥,B藥)的療效,隨機地選取20位患者服用A藥,20位患者服用B藥,這40位患者在服用一段時間后,記錄他們日平均增加的睡眠時間(單位:h).試驗的觀測結果如下: 服用A藥的20位患者日平均增加的睡眠時間: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4 服用B藥的20位患者日平均增加的睡眠時間: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5 (1)分別計算兩組數(shù)據(jù)的平均數(shù),從計算結果看,哪種藥的療效更好? (2)根據(jù)兩組數(shù)據(jù)完成下面莖葉圖,從莖葉圖看,哪種藥的療效更好? 解析: (1)設A藥觀測數(shù)據(jù)的平均數(shù)為,B藥觀測數(shù)據(jù)的平均數(shù)為. 由觀測結果可得 =(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3, =(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6. 由以上計算結果可得>,因此可看出A藥的療效更好. (2)由觀測結果可繪制莖葉圖如圖: 從以上莖葉圖可以看出,A藥療效的試驗結果有的葉集中在莖“2.”,“3.”上,而B藥療效的試驗結果有的葉集中在莖“0.”,“1.”上,由此可看出A藥的療效更好. 1.如圖是根據(jù)《山東統(tǒng)計年鑒xx》中的資料做成的xx年至xx我省城鎮(zhèn)居民百戶家庭人口數(shù)的莖葉圖.圖中左邊的數(shù)字從左到右分別表示城鎮(zhèn)居民百戶家庭人口數(shù)的百位數(shù)字和十位數(shù)字,右邊的數(shù)字表示城鎮(zhèn)居民百戶家庭人口數(shù)的個位數(shù)字.從圖中可以得到xx年至xx我省城鎮(zhèn)居民百戶家庭人口的平均數(shù)為( ) A.304.6 B.303.6 C.302.6 D.301.6 解析: 由莖葉圖可知,這一組數(shù)據(jù)的平均數(shù) ==303.6. 答案: B 2.(xx安徽省“江南十?!甭?lián)考)一次數(shù)學測驗后,從甲、乙兩班各抽取9名同學的成績進行統(tǒng)計分析,繪成莖葉圖如圖所示.據(jù)此估計兩個班成績的中位數(shù)的差的絕對值為( ) A.8 B.5 C.4 D.2 解析: 甲、乙兩班成績按大小順序排列,處在最中間的數(shù)分別為87、89,故它們之差的絕對值是2. 答案: D 莖葉圖的繪制需注意:(1)“葉”的位置只有一個數(shù)字,而“莖”的位置的數(shù)字位數(shù)一般不需要統(tǒng)一;(2)重復出現(xiàn)的數(shù)據(jù)要重復記錄,不能遺漏,特別是“葉”的位置的數(shù)據(jù). 頻率分布直方圖 (xx新課標全國卷Ⅰ)從某企業(yè)生產的某種產品中抽取100件,測量這些產品的一項質量指標值,由測量結果得如下頻數(shù)分布表: 質量指標值分組 [75,85) [85,95) [95,105) [105,115) [115,125) 頻數(shù) 6 26 38 22 8 (1)在下表作出這些數(shù)據(jù)的頻率分布直方圖: (2)估計這種產品質量指標值的平均數(shù)及方差(同一組中的數(shù)據(jù)用該組區(qū)間的中點值作代表); (3)根據(jù)以上抽樣調查數(shù)據(jù),能否認為該企業(yè)生產的這種產品符合“質量指標值不低于95的產品至少要占全部產品80%”的規(guī)定? 解析: (1)如圖所示: (2)質量指標值的樣本平均數(shù)為 =800.06+900.26+1000.38+1100.22+1200.08=100. 質量指標值的樣本方差為: s2=(-20)20.06+(-10)20.26+020.38+1020.22+2020.08=104. 所以這種產品質量指標值的平均數(shù)的估計值為100,方差的估計值為104. (3)質量指標值不低于95的產品所占比例的估計值為 0.38+0.22+0.08=0.68. 由于該估計值小于0.8,故不能認為該企業(yè)生產的這種產品符合“質量指標值不低于95的產品至少要占全部產品的80%”的規(guī)定. 1.(xx廣東卷)隨機觀測生產某種零件的某工廠25名工人的日加工零件數(shù)(單位:件),獲得數(shù)據(jù)如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36. 根據(jù)上述數(shù)據(jù)得到樣本的頻率分布表如下: (1)確定樣本頻率分布表中n1,n2,f1和f2的值; (2)根據(jù)上述頻率分布表,畫出樣本頻率分布直方圖; (3)根據(jù)樣本頻率分布直方圖,求在該廠任取4人,至少有1人的日加工零件數(shù)落在區(qū)間(30,35]的概率. 解析: (1)由所給數(shù)據(jù)知,落在區(qū)間(40,45]內的有7個,落在(45,50]內的有2個,故n1=7,n2=2, 所以f1===0.28,f2===0.08. (2)樣本頻率分布直方圖如圖. (3)根據(jù)樣本頻率分布直方圖,每人的日加工零件數(shù)落在區(qū)間(30,35]的概率為0.2,設所取的4人中,日加工零件數(shù)落在區(qū)間(30,35]的人數(shù)為ξ,則ξ~B(4,0.2),P(ξ≥1)=1-P(ξ=0)=1-(1-0.2)4=1-0.409 6=0.590 4,所以在該廠任取4人,至少有1人的日加工零件數(shù)落在區(qū)間(30,35]的概率為0.590 4. 2.(xx重慶卷)20名學生某次數(shù)學考試成績(單位:分)的頻率分布直方圖如下: (1)求頻率分布直方圖中a的值; (2)分別求出成績落在[50,60)與[60,70)中的學生人數(shù); (3)從成績在[50,70)的學生中任選2人,求此2人的成績都在[60,70)中的概率. 解析: (1)據(jù)直方圖知組距=10, 由(2a+3a+6a+7a+2a)10=1, 解得a==0.005. (2)成績落在[50,60)中的學生人數(shù)為20.0051020=2,成績落在[60,70)中的學生人數(shù)為30.0051020=3. (3)記成績落在[50,60)中的2人為A1,A2,成績落在[60,70)中的3人為B1,B2,B3,則從成績在[50,70)的學生中任選2人的基本事件共有10個: (A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3), 其中2人的成績都在[60,70)中的基本事件有3個: (B1,B2),(B1,B3),(B2,B3),故所求概率為P=. 3.(xx黑龍江大慶一中第二次階段考試)某班同學利用寒假在5個居民小區(qū)內選擇兩個小區(qū)逐戶進行一次“低碳生活習慣”的調查,以計算每戶的碳月排放量.若月排放量符合低碳標準的稱為“低碳族”,否則稱為“非低碳族”.若小區(qū)內有至少75%的住戶屬于“低碳族”,則稱這個小區(qū)為“低碳小區(qū)”,否則稱為“非低碳小區(qū)”.已知備選的5個居民小區(qū)中有三個非低碳小區(qū),兩個低碳小區(qū). (1)求所選的兩個小區(qū)恰有一個為“非低碳小區(qū)”的概率; (2)假定選擇的“非低碳小區(qū)”為小區(qū)A,調查顯示其“低碳族”的比例為,數(shù)據(jù)如圖1所示,經過同學們的大力宣傳,三個月后,又進行了一次調查,數(shù)據(jù)如圖2所示,問這時小區(qū)A是否達到“低碳小區(qū)”的標準? 解析: (1)設三個“非低碳小區(qū)”為B,C,D,兩個“低碳小區(qū)”為m,n,則從5個小區(qū)中任選兩個小區(qū),所有可能的結果有10種,它們是(B,C),(B,D),(B,m),(B,n),(C,D),(C,m),(C,n),(D,m),(D,n),(m,n),恰有一個為“非低碳小區(qū)”的結果有(B,m),(B,n),(C,m),(C,n),(D,m),(D,n),共6種,故所求概率為P==. (2)由題圖1可知月碳排放量不超過300千克的稱為“低碳族”. 由題圖2可知,三個月后的“低碳族”的比例為0.07+0.23+0.46=0.76>0.75,所以三個月后小區(qū)A達到了“低碳小區(qū)”的標準. 解決頻率分布直方圖問題時要抓?。? (1)直方圖中各小長方形的面積之和為1. (2)直方圖中縱軸表示,故每組樣本的頻率為組距,即矩形的面積. (3)直方圖中每組樣本的頻數(shù)為頻率總體數(shù). A級 基礎訓練 1.把樣本容量為20的數(shù)據(jù)分組,分組區(qū)間與頻數(shù)如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,則在區(qū)間[10,50)上的數(shù)據(jù)的頻率是( ) A.0.05 B.0.25 C.0.5 D.0.7 解析: 由題知,在區(qū)間[10,50)上的數(shù)據(jù)的頻數(shù)是2+3+4+5=14,故其頻率為=0.7. 答案: D 2.(xx山東卷)為了研究某藥品的療效,選取若干名志愿者進行臨床試驗.所有志愿者的舒張壓數(shù)據(jù)(單位:kPa)的分組區(qū)間為[12,13),[13,14),[14,15),[15,16),[16,17],將其按從左到右的順序分別編號為第一組,第二組,…,第五組.如圖是根據(jù)試驗數(shù)據(jù)制成的頻率分布直方圖.已知第一組與第二組共有20人,第三組中沒有療效的有6人,則第三組中有療效的人數(shù)為( ) A.6 B.8 C.12 D.18 解析: 由題圖可知,第一組和第二組的頻率之和為(0.24+0.16)1=0.40,故該試驗共選取的志愿者有=50人.所以第三組共有500.36=18人,其中有療效的人數(shù)為18-6=12. 答案: C 3.某地區(qū)為了解中學生的日平均睡眠時間(單位:h),隨機選擇了n位中學生進行調查,根據(jù)所得數(shù)據(jù)畫出樣本的頻率分布直方圖,如圖所示,且從左到右的第1個、第4個、第2個、第3個小長方形的面積依次構成公差為0.1的等差數(shù)列,又第一小組的頻數(shù)是10,則n等于( ) A.80 B.90 C.100 D.110 解析: 設第1個小長方形的面積為S, 則4個小長方形的面積之和為, 由題意知,4S+40.1=1, 故S=0.1,又因為=0.1,所以n=100. 答案: C 4.一個樣本容量為10的樣本數(shù)據(jù),它們組成一個公差不為0的等差數(shù)列{an},若a3=8,且a1,a3,a7成等比數(shù)列,則此樣本的平均數(shù)和中位數(shù)分別是( ) A.13,12 B.13,13 C.12,13 D.13,14 解析: 設等差數(shù)列{an}的公差為d(d≠0),a3=8,a1a7=(a3)2=64,(8-2d)(8+4d)=64,(4-d)(2+d)=8,2d-d2=0,又d≠0,故d=2,故樣本數(shù)據(jù)為:4、6、8、10、12、14、16、18、20、22,平均數(shù)為==13,中位數(shù)為=13. 答案: B 5.甲、乙兩名運動員在某項測試中的6次成績的莖葉圖如圖所示,1、2分別表示甲、乙兩名運動員這項測試成績的平均數(shù),s1、s2分別表示甲、乙兩名運動員這項測試成績的標準差,則有( ) A.1>2,s1<s2 B.1=2,s1=s2 C.1=2,s1<s2 D.1=2,s1>s2 解析: 1=15,2=15,s=,s=. 答案: C 6.在如圖所示的莖葉圖中,甲、乙兩組數(shù)據(jù)的中位數(shù)分別是________、________. 解析: 甲組數(shù)據(jù)為:28,31,39,42,45,55,57,58,66,中位數(shù)為45. 乙組數(shù)據(jù)為:29,34,35,42,46,48,53,55,67,中位數(shù)為46. 答案: 45 46 7.(xx江蘇卷)為了了解一片經濟林的生長情況,隨機抽測了其中60株樹木的底部周長(單位:cm),所得數(shù)據(jù)均在區(qū)間[80,130]上,其頻率分布直方圖如圖所示,則在抽測的60株樹木中,有________株樹木的底部周長小于100 cm. 解析: 由頻率分布直方圖可得樹木底部周長小于100 cm的頻率是(0.025+0.015)10=0.4,又樣本容量是60,所以頻數(shù)是0.460=24. 答案: 24 8.(xx湖北卷)從某小區(qū)抽取100戶居民進行月用電量調查,發(fā)現(xiàn)其用電量都在50至350度之間,頻率分布直方圖如圖所示. (1)直方圖中x的值為________; (2)在這些用戶中,用電量落在區(qū)間[100,250)內的戶數(shù)為________. 解析: (1)根據(jù)頻率和為1,得(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)50=1,解得x=0.004 4; (2)(0.003 6+0.006 0+0.004 4)50100=70. 答案: (1)0.004 4 (2)70 9.甲、乙兩名戰(zhàn)士在相同條件下各射靶10次,每次命中的環(huán)數(shù)分別是: 甲:8,6,7,8,6,5,9,10,4,7; 乙:6,7,7,8,6,7,8,7,9,5. (1)分別計算兩組數(shù)據(jù)的平均數(shù); (2)分別計算兩組數(shù)據(jù)的方差; (3)根據(jù)計算結果,估計一下兩名戰(zhàn)士的射擊水平誰更好一些. 解析: (1)甲=(8+6+7+8+6+5+9+10+4+7)=7, 乙=(6+7+7+8+6+7+8+7+9+5)=7. (2)由方差公式s2=[(x1-)2+(x2-)2+…+(xn-)2]可求得s=3.0,s=1.2. (3)由甲=乙,說明甲、乙兩戰(zhàn)士的平均水平相當; 又∵s>s,說明甲戰(zhàn)士射擊情況波動大,因此乙戰(zhàn)士比甲戰(zhàn)士射擊情況穩(wěn)定. 10.(xx北京卷)從某校隨機抽取100名學生,獲得了他們一周課外閱讀時間(單位:小時)的數(shù)據(jù),整理得到數(shù)據(jù)分組及頻數(shù)分布表和頻率分布直方圖: 組號 分組 頻數(shù) 1 [0,2) 6 2 [2,4) 8 3 [4,6) 17 4 [6,8) 22 5 [8,10) 25 6 [10,12) 12 7 [12,14) 6 8 [14,16) 2 9 [16,18) 2 合計 100 (1)從該校隨機選取一名學生,試估計這名學生該周課外閱讀時間少于12小時的概率; (2)求頻率分布直方圖中的a,b的值; (3)假設同一組中的每個數(shù)據(jù)可用該組區(qū)間的中點值代替,試估計樣本中的100名學生該周課外閱讀時間的平均數(shù)在第幾組.(只需寫出結論) 解析: (1)根據(jù)頻數(shù)分布表,100名學生中課外閱讀時間不少于12小時的學生共有6+2+2=10名,所以樣本中的學生課外閱讀時間少于12小時的頻率是1-=0.9. 從該校隨機選取一名學生,估計其課外閱讀時間少于12小時的概率為0.9. (2)課外閱讀時間落在組[4,6)的有17人,頻率為0.17,所以a===0.085. 課外閱讀時間落在組[8,10)的有25人,頻率為0.25,所以b===0.125. (3)樣本中的100名學生課外閱讀時間的平均數(shù)在第4組. B級 能力提升 1.在某次測量中得到的A樣本數(shù)據(jù)如下:42,43,46,52,42,50,若B樣本數(shù)據(jù)恰好是A樣本數(shù)據(jù)每個都減5后所得數(shù)據(jù),則A、B兩樣本的下列數(shù)字特征對應相同的是( ) A.平均數(shù) B.標準差 C.眾數(shù) D.中位數(shù) 解析: A樣本數(shù)據(jù)的平均數(shù)=,B樣本數(shù)據(jù)的平均數(shù)′=-5.A樣本數(shù)據(jù)的方差s2=[(42-)2+(43-)2+…+(50-)2],B樣本數(shù)據(jù)的方差s′2=[(42-)2+(43-)2+…+(50-)2],∴A、B兩樣本的標準差相同,故選B. 答案: B 2.將某選手的9個得分去掉1個最高分,去掉1個最低分,7個剩余分數(shù)的平均分為91,現(xiàn)場作的9個分數(shù)的莖葉圖后來有一個數(shù)據(jù)模糊,無法辨認,在圖中以x表示,則7個剩余分數(shù)的方差為________. 解析: 根據(jù)莖葉圖,去掉1個最低分87,1個最高分99, 則[87+94+90+91+90+(90+x)+91]=91, ∴x=4. ∴s2=[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=. 答案: 3.(xx通化模擬)某學科在市??己髲娜昙壋槌?00名學生的學科成績作為樣本進行分析,得到樣本頻率分布直方圖如圖所示. (1)利用組中值估計該次考試該學科的平均成績. (2)估計該學科成績在[100,130)之間的概率. (3)為詳細了解每題的答題情況,從樣本中成績在80~100之間的試卷中任選2份進行分析,求至少有1人成績在80~90之間的概率. 解析: (1)用每組的組中值作為該組的平均值,算得該次考試該學科的平均成績?yōu)?24.4分. (2)樣本中學生成績在[100,130)之間的頻率為0.58,故由頻率估計該學科成績在[100,130)之間的概率P1=0.58. (3)樣本中成績在80~90之間有2人,設其編號為①②;樣本中成績在90~100之間有4人,設其編號為③④⑤⑥.從上述6人中任取2人的所有選取可能為:①②,①③,①④,①⑤,①⑥,②③,②④,②⑤,②⑥,③④,③⑤,③⑥,④⑤,④⑥,⑤⑥. 故從樣本中成績在80~100之間任選2人所有可能結果數(shù)為15, 至少有1人成績在80~90之間可能結果數(shù)為9,因此,所求概率為P2=0.6. 4.(xx唐山調研)在數(shù)學趣味知識培訓活動中,甲、乙兩名學生的6次培訓成績如莖葉圖所示: (1)從甲、乙兩人中選擇一人參加數(shù)學趣味知識競賽,你會選哪位?請運用統(tǒng)計學的知識說明理由; (2)從乙的6次成績中隨機選擇2個成績,試求選到123分的概率. 解析: (1)甲==112, 乙==112, s=[(99-112)2+(107-112)2+(108-112)2+(115-112)2+(119-112)2+(124-112)2]=, s=[(102-112)2+(105-112)2+(112-112)2+(113-112)2+(117-112)2+(123-112)2]=, ∴甲=乙,s>s, 說明甲、乙的平均水平一樣,但乙的方差小,乙發(fā)揮更穩(wěn)定,則選擇乙同學. (2)從6個成績中隨機選擇2個,共有15個基本事件,分別是: {102,105},{102,112},{102,113},{102,117},{102,123},{105,112},{105,113},{105,117},{105,123},{112,113},{112,117},{112,123},{113,117},{113,123},{117,123},其中滿足條件的基本事件有5個,故所求概率P==. 第三節(jié) 變量間的相關關系、統(tǒng)計案例 1.會作兩個相關變量的數(shù)據(jù)的散點圖,會利用散點圖認識變量間的相關關系. 2.了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程. 3.了解獨立性檢驗(只要求22列聯(lián)表)的基本思想、方法及其簡單應用. 4.了解回歸分析的基本思想、方法及其簡單應用. 1.相關關系與回歸方程 (1)相關關系的分類: ①正相關:從散點圖上看,點散布在從左下角到右上角的區(qū)域內; ②負相關:從散點圖上看,點散布在從左上角到右下角的區(qū)域內. (2)線性相關關系: 從散點圖上看,如果這些點從整體上看大致分布在一條直線附近,則稱這兩個變量之間具有線性相關關系,這條直線叫回歸直線. (3)回歸方程: ①最小二乘法:使得樣本數(shù)據(jù)的點到回歸直線的距離的平方和最小的方法叫最小二乘法. ②回歸方程:兩個具有線性相關關系的變量的一組數(shù)據(jù):(x1,y1),(x2,y2),…,(xn,yn),其回歸方程為=x+,則==, =-,其中,是回歸方程的斜率,是在y軸上的截距. (4)樣本相關系數(shù): r=,用它來衡量兩個變量間的線性相關關系. ①當r>0時,表明兩個變量正相關; ②當r<0時,表明兩個變量負相關. ③r的絕對值越接近于1,表明兩個變量的線性相關性越強,r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關關系.通常當|r|大于0.75時,認為兩個變量有很強的線性相關性. 2.獨立性檢驗 (1)22列聯(lián)表 假設有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱22列聯(lián)表)為: y1 y2 總計 x1 a b a+b x2 c d c+d 總計 a+c b+d a+b+c+d (2)K2統(tǒng)計量: K2=.(其中n=a+b+c+d為樣本容量) 1.線性回歸直線方程的求法 求解回歸方程關鍵是確定回歸系數(shù),,因求解的公式計算量太大,一般題目中給出相關的量,如,,,等,便可直接代入求解.充分利用回歸直線過樣本中心點(,),即有= +,可確定. 2.獨立性檢驗思想的理解 獨立性檢驗的思想類似于反證法,即要確定“兩個變量X與Y有關系”這一結論成立的可信度,首先假設結論不成立,即它們之間沒有關系,也就是它們是相互獨立的,利用概率的乘法公式可推知,(ad-bc)接近于零,也就是隨機變量K2=應該很小,如果計算出來的K2的觀測值k不是很小,通過查表P(K2≥k0)的概率很?。指鶕?jù)小概率事件不可能發(fā)生,由此判斷假設不成立,從而可以肯定地斷言X與Y之間有關系. 1.判斷下面結論是否正確(請在括號中打“√”或“”) (1)相關關系與函數(shù)關系都是一種確定性的關系,也是一種因果關系.( ) (2)K2=.( ) (3)事件X,Y關系越密切,則由觀測數(shù)據(jù)計算得到的K2的觀測值越大.( ) (4)任何一組數(shù)據(jù)都對應著一個回歸直線方程.( ) 答案: (1) (2) (3)√ (4) 2.有關線性回歸的說法,不正確的是( ) A.具有相關關系的兩個變量是非確定關系 B.散點圖能直觀地反映數(shù)據(jù)的相關程度 C.回歸直線最能代表線性相關的兩個變量之間的關系 D.散點圖中的點越集中,兩個變量的相關性越強 答案: D 3.某校為了研究學生的性別和對待某一活動的態(tài)度(支持和不支持兩種態(tài)度)的關系,運用22列聯(lián)表進行獨立性檢驗,經計算K2=7.069,則所得到的統(tǒng)計學結論是:有多少的把握認為“學生性別與支持該活動有關系”.( ) 附: P(K2≥k0) 0.100 0.050 0.025 0.010 0.001 k0 2.706 3.841 5.024 6.635 10.828 A.0.1% B.1% C.99% D.99.9% 解析: 因為7.069與附表中的6.635最接近,所以得到的統(tǒng)計學結論是:有1-0.010=0.- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 2019-2020年高考數(shù)學大一輪復習 第十章 統(tǒng)計、統(tǒng)計案例與算法初步同步練習 2019 2020 年高 數(shù)學 一輪 復習 第十 統(tǒng)計 案例 算法 初步 同步 練習
裝配圖網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
鏈接地址:http://www.szxfmmzy.com/p-2535741.html