第四章概率分布
《第四章概率分布》由會(huì)員分享,可在線閱讀,更多相關(guān)《第四章概率分布(8頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、第四章 概率分布 ? 在自然界或人類社會(huì)中發(fā)生的各種現(xiàn)象通??蓜澐譃閮深? ? 確定性現(xiàn)象(definite phenomena)—-一定條件下必然發(fā)生的現(xiàn)象; ? 隨機(jī)現(xiàn)象(random phenomena)—-一定條件下可能發(fā)生、但結(jié)果不止一個(gè)、哪個(gè)結(jié)果發(fā)生預(yù)先并不知道的。比如,拋擲一枚硬幣. ? 隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律-—隨機(jī)現(xiàn)象雖然表現(xiàn)為不確定性,但在大量重復(fù)試驗(yàn)觀測下,其結(jié)果會(huì)呈現(xiàn)出某種特定的規(guī)律,稱作隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律.如:擲一枚硬幣,{正面朝上}的頻率接近0。5。 ? 概率分布就是描述隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律。 ? 本章主要介紹:①事件和概率 ②二項(xiàng)分布和泊松分布 ③ 正態(tài)
2、分布 ④ 抽樣分布 ? 第一節(jié) 事件和概率 ? 一、事件 ? 1、隨機(jī)試驗(yàn) ? 滿足下述三個(gè)條件的試驗(yàn)稱為隨機(jī)試驗(yàn)(random experiment): ? ①試驗(yàn)可在相同條件下重復(fù)進(jìn)行; ? ②試驗(yàn)的所有可能結(jié)果是明確可知的,并且不止一個(gè); ? ③每次試驗(yàn)總是恰好出現(xiàn)這些可能結(jié)果中的一個(gè),但在試驗(yàn)之前卻不能肯定會(huì)出現(xiàn)哪一個(gè)結(jié)果. ? 在統(tǒng)計(jì)學(xué)里隨機(jī)試驗(yàn)可簡稱為試驗(yàn)。 ? 2、事件 (event)——試驗(yàn)中所觀察到的結(jié)果。 ? 3、 基本事件 ? 隨機(jī)試驗(yàn)的每一個(gè)可能結(jié)果,稱為基本事件(elementary event)或簡單事件(simple event),不可再
3、分。 ? 4、復(fù)合事件 ? 由若干個(gè)基本事件組合而成的事件,稱復(fù)合事件(compound event),也稱作復(fù)雜事件 ? 5、必然事件——每次試驗(yàn)中一定發(fā)生的結(jié)果稱作必然事件(certain event) ,用Ω表示。 ? 6、不可能性事件——在任何一次試驗(yàn)中都不可能發(fā)生的結(jié)果稱作不可能事件(impossible event).用Φ表示. ? 7、隨機(jī)事件——每次試驗(yàn)中可能發(fā)生也可能不發(fā)生的結(jié)果稱作隨機(jī)事件(random event)。用A、B、C等表示。 二、 事件之間的關(guān)系和運(yùn)算 ? 1、包含 ? 若事件A的發(fā)生必導(dǎo)致事件B發(fā)生,則稱事件B包含事件A,
4、 。 ? 2、相等 ? 則稱事件A等于事件B,記作A=B。 ? 3、和 ? 若事件A與事件B至少一個(gè)發(fā)生某事件就發(fā)生,則某事件稱作A與B的和事件,簡稱為和,記作 ? (讀作A并B),或A+B(讀作A加B). ? 推廣到n個(gè)事件的和: ? 4、積 ? 若事件A與事件B同時(shí)發(fā)生某事件才發(fā)生,則稱某事件為A與B的積事件,簡稱為積,記作 ,讀作A交B)或AB(讀作A乘B)。 ? 推廣到個(gè)n個(gè)事件的積: ? 5、差
5、 ? 稱事件A發(fā)生但事件B不發(fā)生的事件為A減B的差事件,簡稱為差,記為A-B. ? 6、互斥 ? 若事件A與事件B不能同時(shí)發(fā)生,則稱A與B互斥或互不相容?;コ獍ǚ谴思幢说那樾?,但互斥不一定是非此即彼,事件關(guān)系滿足 。 ? 7、對(duì)立 ? 稱事件A不發(fā)生就發(fā)生的事件為A的對(duì)立事件,記為 。事件的發(fā)生非此即彼,顯然 ? 8、獨(dú)立 ? 若事件A發(fā)生的概率不影響事件B發(fā)生的概率,則稱事件A與事件B相互獨(dú)立,反之亦然,A與B是一對(duì)彼此獨(dú)立的事件。 ? 注意獨(dú)立與互斥、對(duì)立的區(qū)別,互斥指兩事件不能同時(shí)發(fā)生,滿足 ;
6、獨(dú)立指一事件發(fā)生的概率與另一事件發(fā)生的概率無關(guān) ,對(duì)立事件互斥但不獨(dú)立,因?yàn)樗鼈儩M足 9、完備事件系 若n個(gè)A1、 A2、… An事件兩兩互斥,且滿足下式: ? 則稱該個(gè)事件為一個(gè)完備事件系。注意,概率之和等于1并且兩兩互斥的事件系才是完備事件系,兩個(gè)條件缺一不可。 ? 〔例4.1〕用“集合圖”描述事件之間的關(guān)系和運(yùn)算,并理解和掌握它們的實(shí)際意義。 ? 圖4.1 事件之間的關(guān)系和運(yùn)算 三、 概率 ? 用于度量事件發(fā)生可能性大小的數(shù)值稱作事件的概率(probability)。通常用P(A)、
7、P(B)等表示。事件的概率具有下述性質(zhì): ? ①設(shè)A為任一事件,則0≤ P(A) ≤ 1; ? ②必然事件的概率為1,P(W)=1??; ? ③不可能事件的概率為0,P(F)=0 . ? 2、概率的統(tǒng)計(jì)定義 ? 若在相同條件下將試驗(yàn)重復(fù)n 次,且事件A出現(xiàn)了nA(yù)次,則事件的頻率(frequency)定義為 ? 如果隨著試驗(yàn)重復(fù)次數(shù)n的增大,事件A的頻率越來越穩(wěn)定地在某一常數(shù)附近擺動(dòng),則稱常數(shù)為事件A的概率(probability),即 ? 這就是統(tǒng)計(jì)意義上的概率定義(statistical probability)。 ? 歷史上曾有幾個(gè)著名的拋一枚均質(zhì)硬幣試驗(yàn) (見教材) ?
8、許多情況下p很難準(zhǔn)確獲得.通常以n充分大時(shí)事件A出現(xiàn)的頻率作為它的概率的估計(jì)值,即: ? 四、 概率計(jì)算法則 ? 1、對(duì)立事件和互斥事件的加法公式 ? 若A和 為對(duì)立事件: ? 若A和B為互斥事件: P(A+B) = P(A)+ P(B) ? 2、獨(dú)立事件的乘法 若A、B為相互獨(dú)立事件: P(AB) = P(B)P(A) ? 若A1、 A2、… An為獨(dú)立事件系: ? P(A1、 A2、… An) =P(A1)( A2)… P(An) 第二節(jié) 隨機(jī)變量及其分布 ? 一、 隨機(jī)變量 ? 在隨機(jī)試驗(yàn)中,被測定的量是可取不同值的變量,且其取值具有隨機(jī)性
9、,這樣的變量稱為隨機(jī)變量,用X表示. X的某次取值記作小寫的x,此時(shí)就稱X作隨機(jī)變量(random variable),就稱x作隨機(jī)變量的一個(gè)觀察值(observed value)或簡稱觀測(observation)?!? ? 間斷性(internal variable )或稱為離散?。╠iscrete variable)隨機(jī)變量——如果隨機(jī)變數(shù)只有有限個(gè)可能的取值,并在試驗(yàn)中以確定的概率來取這些數(shù)值,就稱它為間斷性(或離散)隨機(jī)變量 。質(zhì)量性狀和計(jì)數(shù)的數(shù)量性狀的試驗(yàn)結(jié)果常常是間斷性隨機(jī)變量。 ? 連續(xù)性隨機(jī)變量(continuous variable )-—如果隨機(jī)變數(shù)可能的取值充滿一個(gè)區(qū)
10、間,并且試驗(yàn)結(jié)果落在任意區(qū)間內(nèi)的概率是確定的,就稱它為連續(xù)性隨機(jī)變量。計(jì)量性狀的試驗(yàn)結(jié)果通常是連續(xù)性隨機(jī)變量。 ? 二、 隨機(jī)變量的概率分布 ? 隨機(jī)變數(shù)可能的取值或取值區(qū)間的概率反映了隨機(jī)變數(shù)的統(tǒng)計(jì)規(guī)律性,稱為概率分布。 ? 1、離散(間斷性)隨機(jī)變量的概率分布 ? 所謂離散隨機(jī)變量的概率分布,就是指概率函數(shù)f(x)和分布函數(shù)F(x)兩個(gè)基本函數(shù),它們提供了概率分布規(guī)律的完整信息。 ? ①概率函數(shù)(probability function) f(x) ? 設(shè)隨機(jī)變數(shù)X可能的取值為x1,x2,……,xk,每個(gè)取值對(duì)應(yīng)的概率P(X=xi)為p1,p2,……,pk, 為離散(
11、間斷性)隨機(jī)變量的概率函數(shù) 表4.1 間斷性隨機(jī)變量的概率分布列 ? 〔例4。2〕轉(zhuǎn)基因桑樹植株抗病性檢驗(yàn)(邱健德,2006),參試植株分兩組,即轉(zhuǎn)基因組和一般桑樹組,將病級(jí)分為0,1,2,3,4,5級(jí),觀測發(fā)病的植株數(shù)。由于觀測數(shù)量足夠多,故發(fā)病的概率近似等于頻率,試以此概率為基礎(chǔ)求解隨機(jī)變量的概率函數(shù)和分布函數(shù)。 表4.2 桑樹植株發(fā)病級(jí)的概率函數(shù)和分布函數(shù) 2、連續(xù)隨機(jī)變量的分布 連續(xù)性隨機(jī)變量一般用分布函數(shù)F(x)和概率密度函數(shù)f(x) 來表示其概率分布規(guī)律 ①分布函數(shù)(概率累積函數(shù)) F(X) 若X為一連續(xù)隨機(jī)變量, x (-∞,+∞)為任意實(shí)
12、數(shù),則X的分布函數(shù)或概率累積函數(shù)為: F(X)=P(X≤x) 分布函數(shù)F(x)的直觀意義就是隨機(jī)點(diǎn)X落在區(qū)間(-∞,x]上的概率。 ②概率密度函數(shù)f(x) 如果存在非負(fù)函數(shù)f(x) ,使 則稱f(x)為連續(xù)隨機(jī)變量的概率密度函數(shù),簡稱概率密度(probability density),亦稱密度函數(shù)(density function)或分布密度(distribution density)。 ? ③連續(xù)隨機(jī)變量在給定區(qū)間取值的概率 ? 對(duì)于連續(xù)隨機(jī)變量x,若已知它的分布函數(shù)F(X),則x的觀察值屬于任一區(qū)間(x1,x2]的概率可由下式求得: 三、大數(shù)定律及小概
13、率事件原理 ? 1、大數(shù)定律 ? 相同條件下大量重復(fù)的試驗(yàn),事件發(fā)生的頻率隨試驗(yàn)次數(shù)的無限增大而趨于事件的概率,這是最早的一個(gè)大數(shù)定律(law of large number).一般的大數(shù)定律,研究隨機(jī)變量n次觀測的平均數(shù)隨n無限增大是否趨向某定值的問題,稱作平均數(shù)的穩(wěn)定性。如果“n無限增大平均數(shù)就趨于一個(gè)定值”,此時(shí)稱平均數(shù)具有穩(wěn)定性。 ? 大數(shù)定律是許多統(tǒng)計(jì)方法賴以成立的理論依據(jù). ? 稱其為統(tǒng)計(jì)估計(jì)?!按髷?shù)”就是所謂的“足夠多". 2、小概率事件原理 ? 依據(jù)大數(shù)定律,概率很小的事件其頻率也很小,若只做一次試驗(yàn),該事件實(shí)際上應(yīng)當(dāng)不會(huì)發(fā)生。因此,人們常常
14、認(rèn)為那些概率很小的事件實(shí)際上是不可能發(fā)生的,此原理稱之為“小概率事件的實(shí)際不可能原理”,簡稱作“小概率事件原理" .一般認(rèn)為概率小于0.05或小于0.01的事件為小概率事件,0。05和0.01稱為小概率事件的臨界概率.對(duì)于其它特殊場合,規(guī)定的臨界概率值可根據(jù)事件的性質(zhì)合理確定。 第三節(jié) 二項(xiàng)分布和泊松分布 ? 一、 0-1分布(二項(xiàng)總體分布) ? 有些總體的各個(gè)個(gè)體的某種性狀,只能發(fā)生非此即彼兩種結(jié)果,“此”和“彼”是對(duì)立事件,如,種子的發(fā)芽和不發(fā)芽等,這種由非此即彼事件構(gòu)成的總體,叫做二項(xiàng)總體。 ? 為便 于研究,將這類的試驗(yàn)結(jié)果數(shù)量化,“此”事件設(shè)為1,具概
15、率p ,“彼”事件設(shè)為0,具概率q,因而,二項(xiàng)總體又稱為0—1總體,其概率關(guān)系顯然為: p + q = 1 q = 1 – p 表4.3 二項(xiàng)總體的概率分布列 (0-1分布) 圖4。4 0-1分布的概率函數(shù) ? [例4。3]以某試驗(yàn)地的5株蔬菜為總體調(diào)查蚜蟲為害情況。令x=1代表受害,x=0代表未受害,5株的觀察結(jié)果為0,1,0,1,0。試求危害率的數(shù)學(xué)期望m和方差s2. ? 說明該試驗(yàn)地蚜蟲的平均危害率為0.4,危害率變異的方差為0.24。此例也說明了二項(xiàng)總
16、體的平均數(shù)為m = p,方差為 s2 =?。穑? ? 二、二項(xiàng)分布 ? 從二項(xiàng)總體中,每次以樣本容量n抽樣,將會(huì)有n+1種可能的結(jié)果,這n+1種可能的結(jié)果有它各自的概率而組成一種分布,就叫二項(xiàng)概率分布,簡稱二項(xiàng)分布(binomial distribution) 。又稱貝努利分布 。 v 二項(xiàng)展開式 三、計(jì)算二項(xiàng)分布概率的方法 [例4.4]在一批發(fā)芽率為0。9的種子里取5粒進(jìn)行發(fā)芽試驗(yàn)。以x為發(fā)芽粒數(shù),試做出試驗(yàn)結(jié)果X的概率分布列。 v 四、二項(xiàng)分布的形狀和參數(shù) u 圖4.5表示表4.4的概率分布列。這是一個(gè)偏態(tài)的概率分布,因?yàn)槠鋚≠q且n較小。 u 如果p=q則二項(xiàng)分布是
17、對(duì)稱的,見圖4。6。 u 理論分析和實(shí)踐結(jié)果都表明當(dāng)n很大時(shí),即使p≠q的二項(xiàng)分布其圖形也接近對(duì)稱,見圖4.7。 圖4.5 表4.4的概率分布圖 [例4.5] 某玉米種子發(fā)芽率為0.6,今按設(shè)計(jì)株距穴播,若每穴播4粒,預(yù)計(jì)田間保苗率是多少? 首先考慮,這里的田間保苗率實(shí)際上是每穴有種子發(fā)芽的概率,這是一個(gè)和事件,可計(jì)算為 可知此時(shí),田間預(yù)計(jì)保苗率為97.44% v 〔例4。6〕在已往大規(guī)模田間播種作業(yè)中,已觀測到種子的出苗概率為0。6。①若每穴播10粒,試確定播種作業(yè)的穴粒數(shù)分布,②求出在此出苗概率(0。6)下,田間保苗率〉95%的最少穴粒數(shù)。 v 解:設(shè)出苗種子數(shù)
18、X為隨機(jī)變量,服從二項(xiàng)分布。其概率函數(shù)為 表4.5 田間播種作業(yè)穴粒數(shù)的概率函數(shù)和分布函數(shù)(×10—3) ? 設(shè):田間保苗率大于95%時(shí),最少穴粒數(shù)為每穴n粒。 ? 與上題相同,田間保苗率實(shí)際上是每穴有種子發(fā)芽的概率,因此:至少一粒種子出苗的概率如下: ? 由此可見,穴粒數(shù)達(dá)4粒以上就可基本保證每穴必出苗,最佳穴粒數(shù)定為4。 五、泊松分布 當(dāng)n較大,p或q較小,np或nq≤5時(shí),二項(xiàng)分布將為泊松分布(Poisson distribution)所接近。令l=np,則泊松分布的概率分布為 v 記作X~p(l)。泊松分布的概率函數(shù)僅含一個(gè)參數(shù),意味著只要獲知l ,概率函數(shù)就被完全
19、確定。 v 泊松分布的期望和方差相等且均為l,這是泊松分布所特有的性質(zhì)。如果試驗(yàn)次數(shù)很大,某事件出現(xiàn)的次數(shù)很小,那么此事件的出現(xiàn)次數(shù)將服從泊松分布。 v 泊松分布的概率函數(shù)圖形見圖4。11。 圖4.9 泊松分布的概率函數(shù) v 〔例4.11〕為考察果樹品種A和B的幼苗在某栽植地區(qū)的抗寒力及分布,設(shè)置200個(gè)面積相等且足夠大的抽樣小區(qū),觀測小區(qū)寒害株數(shù)(小區(qū)內(nèi)遭受寒害的株數(shù)),觀測結(jié)果為0,1,2,3,4和5.統(tǒng)計(jì)寒害株數(shù)相同的小區(qū)數(shù)(小區(qū)寒害次數(shù)),計(jì)算小區(qū)寒害率(小區(qū)寒害次數(shù)與觀測小區(qū)總數(shù)之比),結(jié)果見表4。6。試用泊松分布預(yù)測小區(qū)寒害率并與觀測結(jié)果比較,同時(shí)考察兩品種
20、抗寒力的差異。 表4.6 兩果樹品種的小區(qū)寒害株數(shù)、次數(shù)和寒害率的觀測結(jié)果 v 品種A: v 品種B: v 品種A的泊松分布概率函數(shù) v 品種B的泊松分布概率函數(shù) v 圖4。11 品種B小區(qū)寒害率的觀察值與泊松預(yù)測值 v 一批種子中不合格種子占0.005,從中抽取800粒,試求其中不合格種子恰有10粒和不多于5粒的概率。 v 因?yàn)椋睿?00,p=0。005,np=4<5,所以可按泊松分布來計(jì)算。 v 后者也可以在泊松分布累積函數(shù)表中查出。 第四節(jié) 正態(tài)分布 v 正態(tài)分布是田間試驗(yàn)與統(tǒng)計(jì)分析中最重要的一種分布: v ①生物科學(xué)的許多隨機(jī)變量均服從正態(tài)分布,比如
21、產(chǎn)量、株高、生物量等; v ②n趨于無窮大,任意分布平均數(shù)的分布均趨于正態(tài)分布,這意味著n足夠大時(shí)可用正態(tài)分布近似平均數(shù)的分布; v ③n趨于無窮大,二項(xiàng)分布、泊松分布等許多分布都趨于正態(tài)分布,這意味著n足夠大時(shí)可用正態(tài)分布近似這些分布; v ④三大抽樣分布t、c2和F均源于正態(tài)分布總體的抽樣,而它們又是形成統(tǒng)計(jì)方法的基礎(chǔ)。 一、正態(tài)總體分布 ? 隨機(jī)變數(shù)X服從正態(tài)分布記為X~N(m,s2) s2) ? 正態(tài)分布的概率密度函數(shù)為 ? 正態(tài)分布的概率累積函數(shù)為 二、正態(tài)分布曲線的性質(zhì) 1、正態(tài)分布曲線以總體平均數(shù)m為中心,向左右兩側(cè)對(duì)稱分布. 2、正態(tài)分布曲線是一單
22、峰曲線,總體平均m對(duì)應(yīng)的概率密度最大,左右兩側(cè)離m越遠(yuǎn)對(duì)應(yīng)的概率密度越小。 3、總體平均數(shù)m決定曲線的中心位置,標(biāo)準(zhǔn)差s決定曲線的變化率。 m和s不同的總體其正態(tài)分布曲線的位置和形狀各異,因此正態(tài)分布曲線是以參數(shù)m和s的不同而變化的曲線系統(tǒng)。 4、正態(tài)分布曲線在m ±1s處有拐點(diǎn),兩尾向左右無限延伸,以橫軸為漸近線,全距為—∞至∞。 5、無論m和s為多少,正態(tài)分布曲線與橫軸間的總面積都等于1,意為隨機(jī)變數(shù)X的取值位于-∞至∞之間的概率為1,即 6、無論m和s為多少,隨機(jī)變數(shù)的取值落在任意區(qū)間(a,b)的概率為直線x=a和x=b與正態(tài)分布曲線和橫軸間的面積,即: 表4.7 幾個(gè)常見區(qū)間
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 6.煤礦安全生產(chǎn)科普知識(shí)競賽題含答案
- 2.煤礦爆破工技能鑒定試題含答案
- 3.爆破工培訓(xùn)考試試題含答案
- 2.煤礦安全監(jiān)察人員模擬考試題庫試卷含答案
- 3.金屬非金屬礦山安全管理人員(地下礦山)安全生產(chǎn)模擬考試題庫試卷含答案
- 4.煤礦特種作業(yè)人員井下電鉗工模擬考試題庫試卷含答案
- 1 煤礦安全生產(chǎn)及管理知識(shí)測試題庫及答案
- 2 各種煤礦安全考試試題含答案
- 1 煤礦安全檢查考試題
- 1 井下放炮員練習(xí)題含答案
- 2煤礦安全監(jiān)測工種技術(shù)比武題庫含解析
- 1 礦山應(yīng)急救援安全知識(shí)競賽試題
- 1 礦井泵工考試練習(xí)題含答案
- 2煤礦爆破工考試復(fù)習(xí)題含答案
- 1 各種煤礦安全考試試題含答案