《新課標人教A版 選修2-3獨立性檢驗的基本思想及其初步應用(共計3課時)》由會員分享,可在線閱讀,更多相關《新課標人教A版 選修2-3獨立性檢驗的基本思想及其初步應用(共計3課時)(10頁珍藏版)》請在裝配圖網上搜索。
1、3.2 獨立性檢查的基本思想及其初步應用
(合計3學時)
授課類型:新授課
一、教學內容與教學對象分析
通過典型案例,學習下列某些常用的記錄措施,并能初步應用這些措施解決某些實際問題。
① 通過對典型案例(如“患肺癌與吸煙有關嗎”等)的探究。理解獨立性檢查(只規(guī)定2×2列聯(lián)表)的基本思想、措施及初步應用。
② 通過對典型案例(如“人的體重與身高的關系”等)的探究,理解回歸的基本思想、 措施及其初步應用。
二. 學習目的
1、知識與技能
通過本節(jié)知識的學習,理解獨立性檢查的基本思想和初步應用,能對兩個分類變量與否有關做出明確的判斷。明確對兩個分類變量的獨
2、立性檢查的基本思想具體環(huán)節(jié),會對具體問題作出獨立性檢查。
2、過程與措施
在本節(jié)知識的學習中,應使學生從具體問題中結識進行獨立性檢查的作用及必要性,樹立學好本節(jié)知識的信心,在此基本上學習三維柱形圖和二維柱形圖,并結識它們的基本作用和存在的局限性,從而為學習下面作好鋪墊,進而簡介K的平方的計算公式和K的平方的觀測值R的求法,以及它們的實際意義。從中得出判斷“X與Y有關系”的一般環(huán)節(jié)及運用獨立性檢查來考察兩個分類變量與否有關系,并能較精確地給出這種判斷的可靠限度的具體做法和可信限度的大小。最后簡介了獨立性檢查思想的綜合運用。
3、情感、態(tài)度與價值觀
通過本節(jié)知識的學習,一方面讓學生理解對兩
3、個分類博變量進行獨立性檢查的必要性和作用,并引導學生注意比較與觀測值之間的聯(lián)系與區(qū)別,從而引導學生去摸索新知識,培養(yǎng)學生全面的觀點和辨證地分析問題,不為假想所困惑,謀求問題的內在聯(lián)系,培養(yǎng)學生學習數(shù)學、應用數(shù)學的良好的數(shù)學品質。加強與現(xiàn)實生活相聯(lián)系,從對實際問題的分析中學會運用圖形分析、解決問題及用品體的數(shù)量來衡量兩個變量之間的聯(lián)系,學習用圖形、數(shù)據來對的描述兩個變量的關系。明確數(shù)學在現(xiàn)實生活中的重要作用和實際價值。教學中,應多給學生提供自主學習、獨立探究、合伙交流的機會。養(yǎng)成嚴謹?shù)膶W習態(tài)度及實事求是的分析問題、解決問題的科學世界觀,并會用所學到的知識來解決實際問題。
三.教學重點、難點
4、教學重點:理解獨立性檢查的基本思想;獨立性檢查的環(huán)節(jié)。
教學難點;1、理解獨立性檢查的基本思想;
2、理解隨機變量K2的含義;
3、獨立性檢查的環(huán)節(jié)。
四、教學方略
教學措施:誘思探究教學法
學習措施:自主探究、觀測發(fā)現(xiàn)、合伙交流、歸納總結。
教學手段:多媒體輔助教學
五、教學過程:
對于性別變量,其取值為男和女兩種.這種變量的不同“值”表達個體所屬的不同類別,像此類變量稱為分類變量.在現(xiàn)實生活中,分類變量是大量存在的,例如與否吸煙,宗教信奉,國籍,等等.在平常生活中,我們常常關懷兩個分類變量之間與否有關系.例如,吸煙與患肺癌與否有關系?性別對于與否喜歡數(shù)學課程有影響?
5、等等.
為調查吸煙與否對肺癌有影響,某腫瘤研究所隨機地調查了9965人,得到如下成果(單位:人)
表3-7 吸煙與肺癌列聯(lián)表
不患肺癌
患肺癌
總計
不吸煙
7775
42
7817
吸煙
2099
49
2148
總計
9874
91
9965
那么吸煙與否對患肺癌有影響嗎?
像表3一7 這樣列出的兩個分類變量的頻數(shù)表,稱為列聯(lián)表.由吸煙狀況和患肺癌狀況的列聯(lián)表可以粗略估計出:在不吸煙者中,有0.54 %患有肺癌;在吸煙者中,有2.28%患有肺癌.因此,直觀上可以得到結論:吸煙者和不吸煙者患肺癌的也許性存在差別.
與表格相比,三維柱形圖和二維條形圖
6、能更直觀地反映出有關數(shù)據的總體狀況.圖3. 2 一1 是列聯(lián)表的三維柱形圖,從中能清晰地看出各個頻數(shù)的相對大小.
圖3.2一2 是疊在一起的二維條形圖,其中淺色條高表達不患肺癌的人數(shù),深色條高表達患肺癌的人數(shù).從圖中可以看出,吸煙者中患肺癌的比例高于不吸煙者中患肺癌的比例.
為了更清晰地體現(xiàn)這個特性,我們還可用如下的等高條形圖表達兩種狀況下患肺癌的比例.如圖3.2一3 所示,在等高條形圖中,淺色的條高表達不患肺癌的比例;深色的條高表達患肺癌的比例.
通過度析數(shù)據和圖形,我們得到的直觀印象是“吸煙和患肺癌有關”.那么我們與否可以以一定的把握覺得“吸煙與患肺癌有關”呢?
為
7、了回答上述問題,我們先假設
H0:吸煙與患肺癌沒有關系.用A表達不吸煙, B表達不患肺癌,則“吸煙與患肺癌沒有關系”獨立”,即假設 H0等價于
PAB)=P(A)+P(B) .
把表3一7中的數(shù)字用字母替代,得到如下用字母表達的列聯(lián)表:
表3-8 吸煙與肺癌列聯(lián)表
不患肺癌
患肺癌
總計
不吸煙
a
b
a+b
吸煙
c
d
c+d
總計
a+c
b+d
a+b+c+d
在表3一8中,a正好為事件AB發(fā)生的頻數(shù);a+b 和a+c正好分別為事件A和B發(fā)生的頻數(shù).由于頻率近似于概率,因此在H0成立的條件下應當有
,
其中為樣本容量, (a+b+
8、c+d)≈(a+b)(a+c) ,
即ad≈bc.
因此,|ad-bc|越小,闡明吸煙與患肺癌之間關系越弱;|ad -bc|越大,闡明吸煙與患肺癌之間關系越強.
為了使不同樣本容量的數(shù)據有統(tǒng)一的評判原則,基于上面的分析,我們構造一種隨機變量
(1)
其中為樣本容量.
若 H0 成立,即“吸煙與患肺癌沒有關系”,則 K “應當很?。鶕?一7中的數(shù)據,運用公式(1)計算得到 K “的觀測值為
,
這個值究竟能告訴我們什么呢?
記錄學家通過研究后發(fā)現(xiàn),在 H0成立的狀況下,
.
9、 (2)
(2)式闡明,在H0成立的狀況下,的觀測值超過 6. 635 的概率非常小,近似為0 . 01,是一種小概率事件.目前的觀測值≈56.632 ,遠遠不小于6. 635,因此有理由斷定H0不成立,即覺得“吸煙與患肺癌有關系”.但這種判斷會出錯誤,出錯誤的概率不會超過0.01,即我們有99%的把握覺得“吸煙與患肺癌有關系” .
在上述過程中,事實上是借助于隨機變量的觀測值建立了一種判斷H0與否成立的規(guī)則:
如果≥6. 635,就判斷H0不成立,即覺得吸煙與患肺癌有關系;否則,就判斷H0成立,即覺得吸煙與患肺癌沒有關系.
在該規(guī)則下,
10、把結論“H0 成立”錯判成“H0 不成立”的概率不會超過
,
即有99%的把握覺得從不成立.
上面解決問題的想法類似于反證法.要確認與否能以給定的可信限度覺得“兩個分類變量有關系”,一方面假設該結論不成立,即
H0:“兩個分類變量沒有關系”
成立.在該假設下我們所構造的隨機變量應當很?。绻捎^測數(shù)據計算得到的的觀測值k很大,則在一定可信限度上闡明H0不成立,即在一定可信限度上覺得“兩個分類變量有關系”;如果k的值很小,則闡明由樣本觀測數(shù)據沒有發(fā)現(xiàn)反對H0 的充足證據.
如何判斷的觀測值 k 是大還是小呢?這僅需擬定一種正數(shù),當時就覺得 的觀測值k大.此時相應于的判斷規(guī)則為:
11、
如果,就覺得“兩個分類變量之間有關系”;否則就覺得“兩個分類變量之間沒有關系”.
我們稱這樣的為一種判斷規(guī)則的臨界值.按照上述規(guī)則,把“兩個分類變量之間沒有關系”錯誤地判斷為“兩個分類變量之間有關系”的概率為.
在實際應用中,我們把解釋為有的把握覺得“兩個分類變量之間有關系”;把解釋為不能以的把握覺得“兩個分類變量之間有關系”,或者樣本觀測數(shù)據沒有提供“兩個分類變量之間有關系”的充足證據.上面這種運用隨機變量來擬定與否能以一定把握覺得“兩個分類變量有關系”的措施,稱為兩個分類變量的獨立性檢查.
運用上面結論,你能從列表的三維柱形圖中看出兩個變量與否有關嗎?
一般地,假設
12、有兩個分類變量X和Y,它們的也許取值分別為{}和{}, 其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為:
表3一 9 2×2列聯(lián)表
總計
總計
若要推斷的論述為
Hl:X與Y有關系,
可以按如下環(huán)節(jié)判斷結論Hl 成立的也許性:
1.通過三維柱形圖和二維條形圖,可以粗略地判斷兩個分類變量與否有關系,但是這種判斷無法精確地給出所得結論的可靠限度.
① 在三維柱形圖中,主對角線上兩個柱形高度的乘積ad 與副對角線上的兩個柱形高度的乘積bc相差越大,H1成立的也許性就越大.
② 在二維條形圖中,可
13、以估計滿足條件X=的個體中具有Y=的個體所占的比例,也可以估計滿足條件X=的個體中具有Y=,的個體所占的比例.“兩個比例的值相差越大,Hl 成立的也許性就越大.
2.可以運用獨立性檢查來考察兩個分類變量與否有關系,并且能較精確地給出這種判斷的可靠限度.具體做法是:
① 根據實際問題需要的可信限度擬定臨界值;
② 運用公式( 1 ) ,由觀測數(shù)據計算得到隨機變量的觀測值;
③ 如果,就以的把握覺得“X與Y有關系”;否則就說樣本觀測數(shù)據沒有提供“X與Y有關系”的充足證據.
在實際應用中,要在獲取樣本數(shù)據之前通過下表擬定臨界值:
表3一10
0.50
0.40
14、
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
0.455
0.708
1.323
2.072
1.323
2.706
3.841
5.024
6.635
10.828
(四)、舉例:
例1.在某醫(yī)院,由于患心臟病而住院的 665 名男性病人中,有 214 人禿頂,而此外 772 名不是由于患心臟病而住院的男性病人中有 175 人禿頂.
(1)運用圖形判斷禿頂與患心臟病與否有關系.
(2)可以以 99 %的把握覺得禿頂與患心臟病有關系嗎?為什么?
解:根據題目
15、所給數(shù)據得到如下列聯(lián)表:
(1)相應的三維柱形圖如圖3.2一4所示.比較來說,底面副對角線上兩個柱體高度的乘積要大某些,可以在某種限度上覺得“禿頂與患心臟病有關”.
(2)根據列聯(lián)表3一11中的數(shù)據,得到
≈16.373>6 .
因此有 99 %的把握覺得“禿頂與患心臟病有關” .
例2.為考察高中生的性別與與否喜歡數(shù)學課程之間的關系,在某都市的某校高中生中隨機抽取300名學生,得到如下列聯(lián)表:
表3一12 性別與喜歡數(shù)學課程列聯(lián)表
喜歡數(shù)學課程
不喜歡數(shù)學課程
總計
男
37
85
122
女
35
143
16、
178
總計
72
228
300
由表中數(shù)據計算得的觀測值.可以以95%的把握覺得高中生的性別與與否喜歡數(shù)學課程之間有關系嗎?請具體闡明得出結論的根據.
解:可以有約95%以上的把握覺得“性別與喜歡數(shù)學課之間有關系”.作出這種判斷的根據是獨立性檢查的基本思想,具體過程如下:
分別用a , b , c , d 表達樣本中喜歡數(shù)學課的男生人數(shù)、不喜歡數(shù)學課的男生人數(shù)、喜歡數(shù)學課的女生人數(shù)、不喜歡數(shù)學課的女生人數(shù).如果性別與與否喜歡數(shù)學課有關系,則男生中喜歡數(shù)學課的比例與女生中喜歡數(shù)學課的人數(shù)比例應當相差諸多,即
應很大.
將上式等號右邊的式子乘以
17、常數(shù)因子
,
然后平方得
,
其中.因此越大,“性別與喜歡數(shù)學課之間有關系”成立的也許性越大.
另一方面,在假設“性別與喜歡數(shù)學課之間沒有關系”的前提下,事件A ={≥3. 841}的概率為P (≥3. 841) ≈0.05,
因此事件 A 是一種小概率事件.而由樣本數(shù)據計算得的觀測值k=4.514,即小概率事件 A發(fā)生.因此應當斷定“性別與喜歡數(shù)學課之間有關系”成立,并且這種判斷成果出錯的也許性約為5 %.因此,約有95 %的把握覺得“性別與喜歡數(shù)學課之間有關系”.
補充例題1:打鼾不僅影響別人休息,并且也許與患某種疾病有關,下表是一次調查所得的數(shù)據,試問:每一晚都打
18、鼾與患心臟病有關嗎?
患心臟病
未患心臟病
合計
每一晚都打鼾
30
224
254
不打鼾
24
1355
1379
合計
54
1579
1633
解:略。
補充例題2: 對196個接受心臟搭橋手術的病人和196個接受血管清障手術的病人進行3年跟蹤研究,調查她們與否又發(fā)作過心臟病,調查成果如下表所示:
又發(fā)作過心臟病
未發(fā)作過心臟病
合計
心臟搭橋手術
39
157
196
血管清障手術
29
167
196
合計
68
324
392
試根據上述數(shù)據比較兩種手術對病人又發(fā)作心臟病的影響有無差別。
解略
(四) 課堂小結
1.知識梳理
2.規(guī)律小結
(1)三維柱形圖與二維條形圖
(2)獨立性檢查的基本思想
(3)獨立性檢查的一般措施
(五) 作業(yè):
五 課后反思:
本節(jié)內容對獨立性檢查的探討過程學生基本沒什么困難,尚有學生提出了新的探討途徑和思想,學生思維活潑!對獨立性檢查的作用,本節(jié)課也作了系統(tǒng)總結比較。