高中數(shù)學(xué)《獨(dú)立性檢驗(yàn)》課件1(19張PPT)(北師大版選修1-2)
,歡迎進(jìn)入數(shù)學(xué)課堂,獨(dú)立性檢驗(yàn)的基本思想及初步應(yīng)用(1),問題:數(shù)學(xué)家龐加萊每天都從一家面包店買一塊1000g的面包,并記錄下買回的面包的實(shí)際質(zhì)量。一年后,這位數(shù)學(xué)家發(fā)現(xiàn),所記錄數(shù)據(jù)的均值為950g。于是龐加萊推斷這家面包店的面包分量不足。,假設(shè)“面包分量足”,則一年購(gòu)買面包的質(zhì)量數(shù)據(jù)的平均值應(yīng)該不少于1000g;“這個(gè)平均值不大于950g”是一個(gè)與假設(shè)“面包分量足”矛盾的小概率事件;這個(gè)小概率事件的發(fā)生使龐加萊得出推斷結(jié)果。,一:假設(shè)檢驗(yàn)問題的原理,假設(shè)檢驗(yàn)問題由兩個(gè)互斥的假設(shè)構(gòu)成,其中一個(gè)叫做原假設(shè),用H0表示;另一個(gè)叫做備擇假設(shè),用H1表示。,例如,在前面的例子中,原假設(shè)為:H0:面包分量足,備擇假設(shè)為H1:面包分量不足。這個(gè)假設(shè)檢驗(yàn)問題可以表達(dá)為:H0:面包分量足H1:面包分量不足,二:求解假設(shè)檢驗(yàn)問題,考慮假設(shè)檢驗(yàn)問題:H0:面包分量足H1:面包分量不足,在H0成立的條件下,構(gòu)造與H0矛盾的小概率事件;如果樣本使得這個(gè)小概率事件發(fā)生,就能以一定把握斷言H1成立;否則,斷言沒有發(fā)現(xiàn)樣本數(shù)據(jù)與H0相矛盾的證據(jù)。,求解思路:,三:二個(gè)概念,這種變量的不同取“值”表示個(gè)體所屬的不同類別,這類變量稱為分類變量,1.分類變量,對(duì)于性別變量,取值為:男、女,分類變量在現(xiàn)實(shí)生活中是大量存在的,如是否吸煙,是否患肺癌,宗教信仰,國(guó)別,年齡,出生月份等等。,利用隨機(jī)變量K2來(lái)確定在多大程度上可以認(rèn)為”兩個(gè)分類變量有關(guān)系”的方法稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn).(為假設(shè)檢驗(yàn)的特例),問題:,為了調(diào)查吸煙是否對(duì)肺癌有影響,某腫瘤研究所隨機(jī)地調(diào)查了9965人,得到如下結(jié)果(單位:人),列聯(lián)表,說(shuō)明:吸煙者和不吸煙者患肺癌的可能性存在差異,吸煙者患肺癌的可能性大,0.54%,2.28%,1)通過圖形直觀判斷兩個(gè)分類變量是否相關(guān):,三維柱狀圖,2)通過圖形直觀判斷兩個(gè)分類變量是否相關(guān):,二維條形圖,3)通過圖形直觀判斷兩個(gè)分類變量是否相關(guān):,患肺癌比例,不患肺癌比例,獨(dú)立性檢驗(yàn),H0:吸煙和患肺癌之間沒有關(guān)系H1:吸煙和患肺癌之間有關(guān)系,通過數(shù)據(jù)和圖表分析,得到結(jié)論是:吸煙與患肺癌有關(guān),結(jié)論的可靠程度如何?,用A表示“不吸煙”,B表示“不患肺癌”,則H0:吸煙和患肺癌之間沒有關(guān)系,“吸煙”與“患肺癌”獨(dú)立,即A與B獨(dú)立,等價(jià)于,等價(jià)于,獨(dú)立性檢驗(yàn),引入一個(gè)隨機(jī)變量,作為檢驗(yàn)在多大程度上可以認(rèn)為“兩個(gè)變量有關(guān)系”的標(biāo)準(zhǔn)。,設(shè)有兩個(gè)分類變量X和Y它們的值域分別為x1,x2和y1,y2其樣本頻數(shù)列表(稱為22列聯(lián)表)為,獨(dú)立性檢驗(yàn),通過公式計(jì)算,獨(dú)立性檢驗(yàn),已知在成立的情況下,,即在成立的情況下,K2大于6.635概率非常小,近似為0.01,現(xiàn)在的K2=56.632的觀測(cè)值遠(yuǎn)大于6.635,分類變量之間關(guān)系,條形圖,柱形圖,列聯(lián)表,獨(dú)立性檢驗(yàn),背景分析,例1.在某醫(yī)院,因?yàn)榛夹呐K病而住院的665名男性病人中,有214人禿頂,而另外772名不是因?yàn)榛夹呐K病而住院的男性病人中有175人禿頂.分別利用圖形和獨(dú)立性檢驗(yàn)方法判斷是否有關(guān)?你所得的結(jié)論在什么范圍內(nèi)有效?,例2.為考察高中生性別與是否喜歡數(shù)學(xué)課程之間的關(guān)系,在某城市的某校高中生中隨機(jī)抽取300名學(xué)生,得到如下列聯(lián)表:,性別與喜歡數(shù)學(xué)課程列聯(lián)表,由表中數(shù)據(jù)計(jì)算得,高中生的性別與是否喜歡數(shù)學(xué)課程之間是否有關(guān)系?為什么?,a,c,d,b,解:P111,獨(dú)立性檢驗(yàn)基本的思想類似反證法,(1)假設(shè)結(jié)論不成立,即“兩個(gè)分類變量沒有關(guān)系”.(2)在此假設(shè)下隨機(jī)變量K2應(yīng)該很能小,如果由觀測(cè)數(shù)據(jù)計(jì)算得到K2的觀測(cè)值k很大,則在一定程度上說(shuō)明假設(shè)不合理.(3)根據(jù)隨機(jī)變量K2的含義,可以通過評(píng)價(jià)該假設(shè)不合理的程度,由實(shí)際計(jì)算出的,說(shuō)明假設(shè)合理的程度為99.9%,即“兩個(gè)分類變量有關(guān)系”這一結(jié)論成立的可信度為約為99.9%.,同學(xué)們,來(lái)學(xué)校和回家的路上要注意安全,同學(xué)們,來(lái)學(xué)校和回家的路上要注意安全,