《第二章 概率與分布》由會(huì)員分享,可在線閱讀,更多相關(guān)《第二章 概率與分布(6頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、第二章 概率與分布(35)(駱福添)聯(lián)系:對(duì)象在離散點(diǎn)或區(qū)間上分布分布特征數(shù)樣本數(shù)據(jù)頻數(shù)分布表頻數(shù)分布圖描述指標(biāo) () (p)隨機(jī)變量概率分布表概率分布圖總體參數(shù) () (p)2。 二項(xiàng)分布一、概率函數(shù) (概率分布表)名詞解釋:觀察結(jié)果二項(xiàng)、概率等于二項(xiàng)展開(kāi)式有放回地獨(dú)立重復(fù)摸球5次后黑球出現(xiàn)總次數(shù)X的概率函數(shù)。x 表2。1 例2。3中離散型隨機(jī)變量X的概率函數(shù)(n=)X的可能取值黑球數(shù)0345 概率P(x)0。00030640.05120.208.49.327這個(gè)概率函數(shù)值恰好對(duì)應(yīng)于下列二項(xiàng)展開(kāi)式的各個(gè)項(xiàng):(0.2+0。)5 (0.) +(08)(02)+(08)2 (0。) +(.8)3
2、(0.2) +(08)4 (0.2)+(0.8)5一般地,陽(yáng)性概率為p,次獨(dú)立、重復(fù)試驗(yàn)后該事件出現(xiàn)陽(yáng)性數(shù)為次的概率為, x=0, 1, , n(。1) 其中, 0!=1, k!=k(k1)(2)(1),k0 (2。3)式稱為二項(xiàng)分布的概率函數(shù),稱相應(yīng)的隨機(jī)變量X服從二項(xiàng)分布(binoildistribution), 記為X(p, n)至多出現(xiàn)x次數(shù)的概率為P=P()+P()P(x),簡(jiǎn)記為(2。) 這就是二項(xiàng)分布變量X的分布函數(shù).例23 現(xiàn)有5只動(dòng)物注射了半數(shù)致死量的毒物,試分別計(jì)算死亡動(dòng)物數(shù)X0, , 2, 3, 4, 的概率。(提示:p0)解 (0)=(0.5)5 (0.5) .12 P
3、(1)(0.5) (05)1015625 P(2)(。5)3(0)2 0。3250 P(3)=(0.5)2 (05) =0350 P(4)(0.)1(0.5) 0.1562 P(5)=(05)0(0.5)5 。0125二、分布圖形的特征 (概率分布圖)圖2.1p0。5時(shí),在橫軸的正方向拖一長(zhǎng)尾呈正偏峰(a)p0.時(shí), 在橫軸的負(fù)方向拖一長(zhǎng)尾呈負(fù)偏峰()p=0。5時(shí), 呈對(duì)稱(c)n相當(dāng)大,np和n(-p)都大于5,p=?,圖形也接近對(duì)稱(d)Pois01234500.10.20.30.40.5(a) p0.50 (負(fù)偏峰)圖2.1 若干二項(xiàng)分布的概率函數(shù)直條圖13012345678910111
4、200.10.20.30.4 (d) p0.50, n相當(dāng)大 (對(duì)稱、正態(tài))01234500.10.20.30.40.5(c) p=0.50 (對(duì)稱)三、總體均數(shù)與總體標(biāo)準(zhǔn)差 (平均水平與變異程度-分布參數(shù))推導(dǎo)過(guò)程:(下述黑體字公式,可忽略)(2。15)=(。6)(2。17)(218)(2。19)(2.20)=(.21)樣本頻率的總體均數(shù)、總體方差和總體標(biāo)準(zhǔn)差mx=np, mp=p ,(。22), 四、實(shí)例討論(略)第四節(jié) Poissn分布一、概率函數(shù)Pisn分布是()罕見(jiàn)的獨(dú)立事件陽(yáng)性數(shù)目的隨機(jī)分布(2)也可視為n很大,p很小時(shí)二項(xiàng)分布(p,n)的極限情形以放射性脈沖計(jì)數(shù)為例,sson分布
5、的前提條件:() (n足夠大),區(qū)間足夠小,以致每個(gè)區(qū)間陽(yáng)性數(shù)2(平穩(wěn)性)() 每個(gè)區(qū)間陽(yáng)性概率都是(重復(fù)、小概率)(3) 不同區(qū)間是否發(fā)生是統(tǒng)計(jì)獨(dú)立的(獨(dú)立性)數(shù)學(xué)上可以證明,當(dāng)n時(shí)P(x)的極限為(2.3)應(yīng)用:許多發(fā)病率很低的疾病(如腫瘤,不具傳染性、無(wú)永久免疫、無(wú)遺傳性),發(fā)病人數(shù)X近似地服從Poisson分布,其中二、分布圖形的特征例4 據(jù)報(bào)導(dǎo),新生兒染色體異常率為,試用兩種方法計(jì)算10名新生兒發(fā)生0, 1, 2例染色體異常的概率。解 利用二項(xiàng)分布和Poiss分布計(jì)算的結(jié)果如表。所示表2。2 用二項(xiàng)分布和PISSON分布計(jì)算染色體異常概率的比較P(x)(1, 00)(1)0(0。99
6、)10 (。0)0=0。660e ()0 /0!036791(099)00- (0。01)10.369-1 ()1 !=0。3(0。99)00-2 (0。01)0。491 ()2 /!=0。189oisson分布圖形:呈正偏峰不可能出現(xiàn)負(fù)偏峰的圖形f_3a三、總體均數(shù)和總體方差二項(xiàng)分布的總體均數(shù)和總體方差為 和ison分布的總體均數(shù)和總體方差為 和 即總體均數(shù)等于總體方差。這是oissn分布獨(dú)有的性質(zhì),可通過(guò)考察樣本均數(shù)是否接近樣本方差, 來(lái)判斷是否為Poisson分布四、可加性設(shè)X1(), 2 (2), 且互相獨(dú)立, 則X1X2 (1 +) 例如,假定每10分鐘內(nèi)記錄到的放射性脈沖數(shù)服從()
7、,獨(dú)立、重復(fù)2次,測(cè)定值為X1和X2 , 則它們之和服從(2).但須注意,設(shè)X(), 則2X并不服從(2),X/也不服從(2)。例如, 0分鐘內(nèi)測(cè)定的放射性脈沖數(shù)乘2后并不等于0分鐘內(nèi)的測(cè)定資料, 不能用(2)來(lái)描述; 10分鐘的測(cè)定值除以2后也不等于5分鐘內(nèi)的測(cè)定值, 也不能用(/2)來(lái)描述。第五節(jié) 正態(tài)分布一、概率密度函數(shù)實(shí)踐中許多連續(xù)型隨機(jī)變量的頻率密度直方圖形狀是中間高、兩邊低、左右對(duì)稱的, 為便于研究相應(yīng)的總體規(guī)律, 人們用概率密度函數(shù)(.24) f2_3 來(lái)描述這類隨機(jī)變量,并稱這樣的變量服從正態(tài)分布(nomal distributio)或高斯分布(Gauian dstbtion)
8、。 正態(tài)分布有兩個(gè)參數(shù)和。是總體均數(shù);是總體標(biāo)準(zhǔn)差(永遠(yuǎn)大于零)。這兩個(gè)參數(shù)可完全決定一個(gè)正態(tài)分布,故常簡(jiǎn)記為N(, 2)。當(dāng)0,1時(shí),概率密度函數(shù)和分布函數(shù)分別為密度函數(shù) 分布函數(shù) (25)這樣的正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布, 簡(jiǎn)記為(0, 1)。正態(tài)概率密度曲線圖性質(zhì):(1)關(guān)于對(duì)稱;(2)在處曲線最高;(3) 在處各有一個(gè)拐點(diǎn);(4) 曲線下面積為1;() 若固定, 隨值不同, 曲線位置不同, 故稱為位置參數(shù);(6) 若固定, 大時(shí),曲線矮而胖;小時(shí), 曲線瘦而高,故稱為形狀參數(shù)。 m-2s m-s m m+s m+2s -2 -1 0 1 2 xz (a) (b)圖2.3 正態(tài)概率密度圖
9、(a)一般形狀 (b)與m和s關(guān)系 m1 m2s2s1 s1t23正態(tài)曲線要點(diǎn):外觀(對(duì)稱 吊鐘)、參數(shù)(位置m 形狀s)、面積(1。45,1.9,58)t23二、正態(tài)概率密度曲線下的面積標(biāo)準(zhǔn)化變換:(22) 變換后的Z稱為標(biāo)準(zhǔn)化正態(tài)離差或稱值(Zve)正態(tài)變量的Z值服從標(biāo)準(zhǔn)正態(tài)分布N(0, 1)標(biāo)準(zhǔn)正態(tài)分布尾部面積a:f2_3表23 標(biāo)準(zhǔn)正態(tài)分布幾個(gè)重要的臨界值 雙側(cè)臨界值Za單側(cè)尾部面積雙側(cè)尾部面積1.6450。5011。960.050。2.5760。050.01三、參考范圍的確定方法:95參考值范圍(9%CI)(錯(cuò)誤概率a=.,把握度095)(16s, 1.96s) 或 9參考值范圍(5
10、I)(錯(cuò)誤概率a0.0,把握度=0。)(2.58s, 2.58) 或 四、二項(xiàng)分布和Psn分布的正態(tài)近似。 連續(xù)性校正離散型變量只能在, 1, 2, 等正整數(shù)取值,為了借用連續(xù)型變量的分布函數(shù)來(lái)計(jì)算概率,首先要把概率函數(shù)“連續(xù)化”,把概率函數(shù)圖中的“直條”改造成“直方” (a) 概率函數(shù)直條圖 (b) 連續(xù)性校正直方圖 (c) 正態(tài)近似圖圖2.4 二項(xiàng)分布連續(xù)性校正和正態(tài)近似示意圖表2.4二項(xiàng)分布概率的連續(xù)性校正和正態(tài)近似(1)(2)(3)(4)二項(xiàng)分布概率連續(xù)性校正后概率函數(shù)圖上長(zhǎng)方形所在的區(qū)間近似正態(tài)分布概率密度圖上曲線下圖形所在區(qū)間 概率近似公式:在相應(yīng)的區(qū)間上,近似正態(tài)分布概率密度曲線
11、下圖形的面積(Xk)(-0, k+0.5)(k-05, k0.5)P(X)(0, k+5)(,+.5)(X)(k-0。, )(-0。5, +)P(Xk2)(k10。, 2+。5)(k05,k2+0)2。 正態(tài)近似 理論上可以證明()二項(xiàng)分布X(p,n) XN(np, p(1p)近似 并且P= N(p, p(1-p)/) (2)Poisson分布則X N(, )例25 假定人群中某病患病概率為0.00,現(xiàn)對(duì)該人群中的1000人體檢, 試求檢出人數(shù)不少于5人的概率。解 可認(rèn)為檢出人數(shù)服從二項(xiàng)分布二項(xiàng)分布資料用oisn分布近似與正態(tài)近似比較直接計(jì)算正態(tài)近似相對(duì)誤差二項(xiàng)分布。2572。26161。7Poisson分布0。570。262。8%相對(duì)誤差0.3 計(jì)算過(guò)程:P(55)=0.57或據(jù)Poison分布,令參數(shù)10000。05=50,P(55)=0。57 計(jì)算繁雜.現(xiàn)采用正態(tài)近似,np=50,np(p)=500。995=49。5 利用二項(xiàng)分布正態(tài)近似公式P(x55)=0.2616 利用oiso分布的正態(tài)近似公式P(55)=。2624兩者與0。572的相對(duì)誤差均小于2%.結(jié)語(yǔ):對(duì)象在離散點(diǎn)或區(qū)間上分布分布特征數(shù)樣本數(shù)據(jù)頻數(shù)分布表頻數(shù)分布圖描述指標(biāo) () (p)隨機(jī)變量(誤差)概率分布表概率分布圖總體參數(shù) () (p)文中如有不足,請(qǐng)您見(jiàn)諒!6 / 6