《高中數(shù)學 第三章 統(tǒng)計案例 3_2 獨立性檢驗的基本思想及其初步應用課件 新人教A版選修2-3》由會員分享,可在線閱讀,更多相關(guān)《高中數(shù)學 第三章 統(tǒng)計案例 3_2 獨立性檢驗的基本思想及其初步應用課件 新人教A版選修2-3(52頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、3.2獨立性檢驗的基本思想及其初步應用 自主學習 新知突破 1通過對實際問題的分析探究,了解獨立性檢驗(只要求22列聯(lián)表)的基本思想、方法及初步應用;了解獨立性檢驗的常用方法:等高條形圖及K2統(tǒng)計量法2通過典型案例的探究,了解實際推斷原理和假設檢驗的基本思想、方法及初步應用3理解獨立性檢驗的基本思想及實施步驟,能運用自己所學知識對具體案例進行檢驗 飲用水的質(zhì)量是人類普遍關(guān)心的問題據(jù)統(tǒng)計,飲用優(yōu)質(zhì)水的518人中,身體狀況優(yōu)秀的有466人,飲用一般水的312人中,身體狀況優(yōu)秀的有218人人的身體健康狀況與飲用水的質(zhì)量之間有關(guān)系嗎?提示人的身體健康狀況與飲用水的質(zhì)量之間有關(guān)系 1分類變量變量的不同“
2、值”表示個體所屬的_,像這樣的變量稱為分類變量2列聯(lián)表(1)定義:列出的兩個分類變量的_,稱為列聯(lián)表分類變量和列聯(lián)表不同類別頻數(shù)表 (2)22列聯(lián)表一般地,假設兩個分類變量X和Y,它們的取值分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(稱22列聯(lián)表)為:y1 y2總計x1 a b abx2 c d cd總計ac bd abcd 分類變量及其關(guān)系的分析的理解(1)這里的“變量”和“值”都應作為廣義的變量和值來理解,只要不屬于同種類別都是變量和值,并不一定是取具體的數(shù)值,如:男、女;上、下;左、右等(2)頻數(shù)分析是指用不同類別的事件發(fā)生的頻率的大小比較來分析分類變量是否有關(guān)聯(lián)關(guān)系(3)等高條形圖
3、更加形象直觀地反映兩個分類變量之間的差異,進而推斷它們之間是否具有關(guān)聯(lián)關(guān)系 1等高條形圖與表格相比,更能直觀地反映出兩個分類變量間是否_,常用等高條形圖展示列聯(lián)表數(shù)據(jù)的_2觀察等高條形圖發(fā)現(xiàn)_和_相差很大,就判斷兩個分類變量之間有關(guān)系等高條形圖相互影響頻率特征 繪制等高條形圖時,列聯(lián)表的行對應的是高度,兩行的數(shù)據(jù)不相等,但對應的條形圖的高度是相同的;兩列的數(shù)據(jù)對應不同的顏色 獨立性檢驗 獨立性檢驗思想的理解及常用的幾個數(shù)值(1)獨立性檢驗的基本思想類似于數(shù)學中的反證法,要確認兩個分類變量有關(guān)系這一結(jié)論成立的可信程度,首先假設該結(jié)論不成立,即假設結(jié)論“兩個分類變量沒有關(guān)系”成立,在該假設下我們構(gòu)
4、造的隨機變量K2應該很小,如果由觀測數(shù)據(jù)計算得到的K2的觀測值很大,則在一定程度上說明假設不合理,根據(jù)隨機變量K2的含義,可以通過P(K26.635)0.01來評價假設不合理的程度,由實際計算得K2的觀測值k6.635,說明假設不合理的程度約為99%,即兩個分類變量有關(guān)系這一結(jié)論成立的可信程度為99%. (2)在實際問題中要記住以下幾個常用值:若k6.635,則在犯錯誤的概率不超過0.01的前提下認為“X與Y有關(guān)系”;若k3.841,則在犯錯誤的概率不超過0.05的前提下認為“X與Y有關(guān)系”;若k2.706,則在犯錯誤的概率不超過0.1的前提下認為“X與Y有關(guān)系”;若k2.706,則認為沒有充
5、分證據(jù)顯示“X與Y有關(guān)系” 1觀察下列各圖,其中兩個分類變量x,y之間關(guān)系最強的是() 解析:在四幅圖中,D圖中兩個深色條的高相差最明顯,說明兩個分類變量之間關(guān)系最強答案:D 2下面是一個22列聯(lián)表:則表中a,b處的值分別為()A94,96B52,50C52,54 D54,52y1 y2總計x1 a 21 73x2 2 25 27總計b 46 3在吸煙與患肺病是否相關(guān)的判斷中,有下面的說法:若K2的觀測值k6.635,則在犯錯誤的概率不超過0.01的前提下,認為吸煙與患肺病有關(guān)系,那么在100個吸煙的人中必有99人患有肺?。粡莫毩⑿詸z驗可知在犯錯誤的概率不超過0.01的前提下,認為吸煙與患肺病
6、有關(guān)系時,若某人吸煙,則他有99%的可能患有肺??;從獨立性檢驗可知在犯錯誤的概率不超過0.05的前提下,認為吸煙與患肺病有關(guān)系時,是指有5%的可能性使得推斷錯誤其中說法正確的是_ 解析:K2是檢驗吸煙與患肺病相關(guān)程度的量,是相關(guān)關(guān)系,而不是確定關(guān)系,是反映有關(guān)和無關(guān)的概率,故說法不正確;說法中對“確定容許推斷犯錯誤概率的上界”理解錯誤;說法正確答案: 4為了解決高二年級統(tǒng)計案例入門難的問題,某校在高一年級的數(shù)學教學中設有試驗班,著重加強統(tǒng)計思想的滲透,下面是高二年級統(tǒng)計案例的測驗成績統(tǒng)計表(單位:分)的一部分,試分析實驗效果.70及70分以下70分以上總計對照班32 18 50試驗班12 38
7、 50總計 44 56 100 附:P(K2k0) 0.025 0.010 0.005k0 5.024 6.635 7.879 合作探究 課堂互動 利用等高條形圖判斷分類變量間的關(guān)系2012年5月1日起我國對醉駕列入法律,交通事故明顯降低,現(xiàn)從發(fā)生交通事故的司機中抽取2 000名司機的隨機樣本,根據(jù)他們血液中是否含有酒精以及他們是否對事故負有責任將數(shù)據(jù)整理如下:有責任無責任總計有酒精650 150 800無酒精700 500 1 200總計1 350 650 2 000 (1)試作出相應的等高條形圖;(2)結(jié)合等高條形圖分析血液中含有酒精與對事故負有責任是否有關(guān)系 思路點撥 (1)相應的等高條
8、形圖如圖: (2)圖中兩個深色條的高分別表示司機血液中有酒精和無酒精樣本中對事故負有責任的頻率,從圖中可以看出,司機血液中有酒精樣本中對事故負有責任的頻率明顯高于司機血液中無酒精樣本中對事故負有責任的頻率由此可以認為司機血液中含有酒精與對事故負有責任有關(guān)系 2分析分類變量關(guān)系的步驟:(1)作大量的調(diào)查、研究,統(tǒng)計出結(jié)果;(2)列出列聯(lián)表利用頻率粗略估計;(3)作出等高條形圖,從直觀上進一步判斷分類變量之間的關(guān)聯(lián)關(guān)系特別提醒:通過等高條形圖可以粗略地判斷兩個分類變量是否有關(guān)系,但無法精確地給出所得結(jié)論的可靠程度 1某校對學生課外活動進行調(diào)查,結(jié)果整理成下表:請根據(jù)數(shù)據(jù),利用圖形判斷:喜歡體育或喜
9、歡文娛是否與性別有關(guān)系體育文娛合計男生21 23 44女生6 29 35合計27 52 79 解析:其等高條形圖如圖所示由圖可以直觀地看出喜歡體育還是喜歡文娛與性別在某種程度上有關(guān)系 利用隨機變量K2判斷分類變量間的關(guān)系下表是某地區(qū)的一種傳染病與飲用水的調(diào)查表:得病不得病合計干凈水52 466 518不干凈水94 218 312合計146 684 830 (1)這種傳染病是否與飲用水的衛(wèi)生程度有關(guān),請說明理由;(2)若飲用干凈水得病5人,不得病50人,飲用不干凈水得病9人,不得病22人按此樣本數(shù)據(jù)分析這種疾病是否與飲用水有關(guān),并比較兩種樣本在反映總體時的差異思路點撥(1)根據(jù)表中的信息計算K2
10、的觀測值,并根據(jù)臨界值表來分析相關(guān)性的大小,對于(2)要列出22列聯(lián)表,方法同(1) 兩個樣本都能統(tǒng)計得到傳染病與飲用不干凈水有關(guān)這一相同結(jié)論,但(1)中我們在犯錯誤的概率不超過0.001的前提下肯定結(jié)論的正確性,(2)中我們在犯錯誤的概率不超過0.025的前提下肯定結(jié)論的正確性. 12分 規(guī)律方法利用K2公式判斷兩分類變量是否有關(guān)系的方法 2某電視臺聯(lián)合相關(guān)報社對“男女同齡退休”這一公眾關(guān)注的問題進行了民意調(diào)查,數(shù)據(jù)如下表所示:根據(jù)表中數(shù)據(jù),能否在犯錯誤的概率不超過0.001的前提下認為這一問題的看法與性別有關(guān)系?(P(K 210.828)0.001)贊同反對總計男198 217 415女4
11、76 109 585總計674 326 1 000 獨立性檢驗的綜合應用為了調(diào)查某生產(chǎn)線上質(zhì)量監(jiān)督員甲對產(chǎn)品質(zhì)量的好壞有無影響,現(xiàn)統(tǒng)計數(shù)據(jù)如下:甲在生產(chǎn)現(xiàn)場時,990件產(chǎn)品中有合格品982件,次品8件;甲不在生產(chǎn)現(xiàn)場時,510件產(chǎn)品中有合格品493件,次品17件試分別用列聯(lián)表、等高條形圖、獨立性檢驗的方法分析監(jiān)督員甲對產(chǎn)品質(zhì)量的好壞有無影響能否在犯錯誤的概率不超過0.001的前提下,認為質(zhì)量監(jiān)督員甲在不在生產(chǎn)現(xiàn)場與產(chǎn)品質(zhì)量的好壞有關(guān)系? 思路點撥 解析:(1)22列聯(lián)表如下:由列聯(lián)表可得|acbd|982174938|12 750,相差較大,可在某種程度上認為“質(zhì)量監(jiān)督員甲是否在生產(chǎn)現(xiàn)場與產(chǎn)品
12、質(zhì)量有關(guān)”合格品數(shù)次品數(shù)總計甲在生產(chǎn)現(xiàn)場982 8 990甲不在生產(chǎn)現(xiàn)場493 17 510總計1 475 25 1 500 (2)由等高條形圖可知:在某種程度上認為“質(zhì)量監(jiān)督員甲是否在生產(chǎn)現(xiàn)場與產(chǎn)品質(zhì)量有關(guān)系” 規(guī)律方法判斷兩個分類變量之間有無關(guān)系,可以用22列聯(lián)表、等高條形圖、獨立性檢驗等方法作出判斷,其中從列聯(lián)表和等高條形圖中只能粗略地進行估計,要進行精確的判斷,必須利用獨立性檢驗進行計算并與臨界值對比 3在調(diào)查的480名男人中有38名患有色盲,520名女人中有6名患有色盲,做出列聯(lián)表,試用獨立性檢驗的方法來判斷色盲與性別是否有關(guān)?你所得到的結(jié)論在什么范圍內(nèi)有效? 解析:根據(jù)題目所給的數(shù)據(jù)作出如下的列聯(lián)表:色盲不色盲總計男38 442 480女6 514 520總計44 956 1 000 為了研究男子的年齡與吸煙的關(guān)系,抽查了100個男子,按年齡超過和不超過40歲,吸煙量每天多于和不多于20支進行分組,數(shù)據(jù)如表,試問吸煙量與年齡是否有關(guān)?年齡合計不超過40歲超過40歲吸煙量不多于20支/天50 15 65吸煙量多于20支/天10 25 35合計60 40 100 提示由于對22列聯(lián)表中a,b,c,d的位置不確定,在代入公式時取錯了數(shù)值,導致計算結(jié)果的錯誤