《概率分布》PPT課件
《《概率分布》PPT課件》由會(huì)員分享,可在線閱讀,更多相關(guān)《《概率分布》PPT課件(88頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、作者 賈俊平,統(tǒng) 計(jì) 學(xué)(第三版),2008,2008年8月,數(shù)學(xué)定律不能百分之百確切地用在 現(xiàn)實(shí)生活里;能百分之百確切地用 數(shù)學(xué)定律描述的,就不是現(xiàn)實(shí)生活 Alber Einstein,統(tǒng)計(jì)名言,第 4 章 概率分布,4.1 度量事件發(fā)生的可能性 3.2 隨機(jī)變量概率分布 3.3 由正態(tài)分布導(dǎo)出的幾個(gè)重要分布 3.4 樣本統(tǒng)計(jì)量的概率分布,,2008年8月,學(xué)習(xí)目標(biāo),度量事件發(fā)生的可能性概率 離散型概率分布 二項(xiàng)分布,泊松分布,超幾何分布 連續(xù)型概率分布 正態(tài)分布 由正態(tài)分布導(dǎo)出的幾個(gè)重要分布 c2-分布, t-分布, F-分布 樣本統(tǒng)計(jì)量的概率分布,2008年8月,中獎(jiǎng)的可能性有多大?,很
2、多想在彩票市場(chǎng)上賺大錢(qián),這可以理解,但贏得大獎(jiǎng)的人總是少數(shù)。山東的一打工者為了碰運(yùn)氣,半個(gè)小時(shí)花去了1000元錢(qián),買(mǎi)了500張即開(kāi)型福利彩票,結(jié)果也沒(méi)撞上大獎(jiǎng)。有人曾做過(guò)統(tǒng)計(jì),最賺錢(qián)的彩票,中彩的概率最高是500萬(wàn)分之一,有的達(dá)到1000萬(wàn)分之一甚至更低 假定每張彩票面值是2元,大獎(jiǎng)的獎(jiǎng)金額是500萬(wàn)元,中將概率是500萬(wàn)分之一,你花掉1000萬(wàn)元購(gòu)買(mǎi)500萬(wàn)張彩票,即使中了500萬(wàn)的大獎(jiǎng),你仍然虧損500萬(wàn)。況且,從概率的意義上看,即使你購(gòu)買(mǎi)500萬(wàn)張彩票,也不能肯定就中大獎(jiǎng) 法國(guó)人就有這樣的俗語(yǔ):“中彩的機(jī)會(huì)比空難還少?!睂?duì)于多數(shù)人來(lái)說(shuō),彩票只是一種數(shù)字游戲,是社會(huì)籌集閑散資金的一種方式,
3、而不是一種投資,更不是賭博。相信有了本章介紹的概率方面的知識(shí),你就不會(huì)再跟彩票較勁,4.1 度量事件發(fā)生的可能性 概率是什么? 怎樣獲得概率? 怎樣理解概率?,第 4 章 概率分布,,2008年8月,什么是概率?(probability),概率是對(duì)事件發(fā)生的可能性大小的度量 明天降水的概率是80%。這里的80%就是對(duì)降水這一事件發(fā)生的可能性大小的一種數(shù)值度量 你購(gòu)買(mǎi)一只股票明天上漲的可能性是30%,這也是一個(gè)概率 一個(gè)介于0和1之間的一個(gè)值 事件A的概率記為P(A),2008年8月,怎樣獲得概率?,重復(fù)試驗(yàn)獲得概率 當(dāng)試驗(yàn)的次數(shù)很多時(shí),概率P(A)可以由所觀察到的事件A發(fā)生次數(shù)(頻數(shù))的比例來(lái)
4、逼近 在相同條件下,重復(fù)進(jìn)行n次試驗(yàn),事件A發(fā)生了m次,則事件A發(fā)生的概率可以寫(xiě)為,用類似的比例來(lái)逼近 一家餐館將生存5年的概率,可以用已經(jīng)生存了5年的類似餐館所占的比例作為所求概率一個(gè)近似值,主觀概率,4.2 隨機(jī)變量的概率分布 4.2.1 隨機(jī)變量及其概括性度量 4.2.2 離散型概率分布 4.2.3 連續(xù)型概率分布,第 4 章 概率分布,,4.2.1 隨機(jī)變量及其概括性度量,4.2 隨機(jī)變量的概率分布,,2008年8月,什么是隨機(jī)變量?(random variables),,事先不知道會(huì)出現(xiàn)什么結(jié)果 投擲兩枚硬幣出現(xiàn)正面的數(shù)量 一座寫(xiě)字樓,每平方米的出租價(jià)格 一個(gè)消費(fèi)者對(duì)某一特定品牌飲料
5、的偏好 一般用 X,Y,Z 來(lái)表示 根據(jù)取值情況的不同分為離散型隨機(jī)變量和連續(xù)型隨機(jī)變量,2008年8月,,離散型隨機(jī)變量(discrete random variables),,隨機(jī)變量 X 取有限個(gè)值或所有取值都可以逐個(gè)列舉出來(lái) x1 , x2, 以確定的概率取這些不同的值 離散型隨機(jī)變量的一些例子,2008年8月,,連續(xù)型隨機(jī)變量(continuous random variables),,可以取一個(gè)或多個(gè)區(qū)間中任何值 所有可能取值不可以逐個(gè)列舉出來(lái),而是取數(shù)軸上某一區(qū)間內(nèi)的任意點(diǎn) 連續(xù)型隨機(jī)變量的一些例子,2008年8月,離散型隨機(jī)變量的期望值(expected value),,描述離
6、散型隨機(jī)變量取值的集中程度 離散型隨機(jī)變量X的所有可能取值xi與其取相對(duì)應(yīng)的概率 pi 乘積之和 記為 或E(X),計(jì)算公式為,2008年8月,離散型隨機(jī)變量的方差(variance),,隨機(jī)變量X的每一個(gè)取值與期望值的離差平方和的數(shù)學(xué)期望,記為 2 或D(X) 描述離散型隨機(jī)變量取值的分散程度 計(jì)算公式為 方差的平方根稱為標(biāo)準(zhǔn)差,記為 或D(X),,2008年8月,,離散型數(shù)學(xué)期望和方差 (例題分析),【例】一家電腦配件供應(yīng)商聲稱,他所提供的配件100個(gè)中擁有次品的個(gè)數(shù)及概率如下表。求該供應(yīng)商次品數(shù)的數(shù)學(xué)期望和標(biāo)準(zhǔn)差,2008年8月,連續(xù)型隨機(jī)變量的期望和方差,,連續(xù)型隨機(jī)變量的期望值 方差
7、,4.2.2 離散型概率分布,4.2 隨機(jī)變量的概率分布,,2008年8月,,離散型隨機(jī)變量的概率分布,,列出離散型隨機(jī)變量X的所有可能取值 列出隨機(jī)變量取這些值的概率 通常用下面的表格來(lái)表示,P(X =xi)=pi稱為離散型隨機(jī)變量的概率函數(shù) pi0 ; 常用的有二項(xiàng)分布、泊松分布、超幾何分布等,2008年8月,,離散型隨機(jī)變量的概率分布 (例題分析),【例】一部電梯在一周內(nèi)發(fā)生故障的次數(shù)X及相應(yīng)的概率如下表,(1) 確定的值 (2) 求正好發(fā)生兩次故障的概率 (3) 求故障次數(shù)多于一次的概率 (4) 最多發(fā)生一次故障的概率,2008年8月,離散型隨機(jī)變量的概率分布 (例題分析)
8、,解:(1) 由于0.10+0.25+0.35+ =1 所以, =0.30 (2) P(X=2)=0.35 (3) P(X 2)=0.10+0.25+0.35=0.70 (4) P(X1)=0.35+0.30=0.65,2008年8月,二項(xiàng)試驗(yàn)(Bernoulli試驗(yàn)),,二項(xiàng)分布建立在Bernoulli試驗(yàn)基礎(chǔ)上 貝努里試驗(yàn)滿足下列條件 一次試驗(yàn)只有兩個(gè)可能結(jié)果,即“成功”和“失敗” “成功”是指我們感興趣的某種特征 一次試驗(yàn)“成功”的概率為p ,失敗的概率為q =1- p,且概率p對(duì)每次試驗(yàn)都是相同的 試驗(yàn)是相互獨(dú)立的,并可以重復(fù)進(jìn)行n次 在n次試驗(yàn)中,“成功”的次數(shù)對(duì)應(yīng)一個(gè)
9、離散型隨機(jī)變量X,2008年8月,二項(xiàng)分布(Binomial distribution),,重復(fù)進(jìn)行 n 次試驗(yàn),出現(xiàn)“成功”的次數(shù)的概率分布稱為二項(xiàng)分布,記為XB(n,p) 設(shè)X為 n 次重復(fù)試驗(yàn)中出現(xiàn)成功的次數(shù),X 取 x 的概率為,2008年8月,二項(xiàng)分布 (例題分析),【例】已知一批產(chǎn)品的次品率為4%,從中任意有放回地抽 取5個(gè)。求5個(gè)產(chǎn)品中 (1) 沒(méi)有次品的概率是多少? (2) 恰好有1個(gè)次品的概率是多少? (3) 有3個(gè)以下次品的概率是多少?,2008年8月,二項(xiàng)分布 (用Excel計(jì)算概率),第1步:在Excel表格界面,直接點(diǎn)擊【fx】(插入函數(shù))命令 第2
10、步:在【選擇類別】中點(diǎn)擊【統(tǒng)計(jì)】,并在【選擇函數(shù)】 中點(diǎn)擊【BINOMDIST】,然后單擊【確定】 第3步:在【Number_s】后填入試驗(yàn)成功次數(shù)(本例為1) 在【Trials】后填入總試驗(yàn)次數(shù)(本例為5) 在【Probability_s】后填入試驗(yàn)的成功概率(本例為 0.04) 在【Cumulative】后填入0(或FALSE),表示計(jì)算成 功次數(shù)恰好等于指定數(shù)值的概率(填入1或TRUE表示 計(jì)算成功次數(shù)小于或等于指定數(shù)值的累積概率值), 用Excel計(jì)算二項(xiàng)分布的概率,2008年8月,泊松分布(Poisson distribution),,183
11、7年法國(guó)數(shù)學(xué)家泊松(D.Poisson,17811840)首次提出 用于描述在一指定時(shí)間范圍內(nèi)或在一定的長(zhǎng)度、面積、體積之內(nèi)每一事件出現(xiàn)次數(shù)的分布 泊松分布的例子 一定時(shí)間段內(nèi),某航空公司接到的訂票電話數(shù) 一定時(shí)間內(nèi),到車(chē)站等候公共汽車(chē)的人數(shù) 一定路段內(nèi),路面出現(xiàn)大損壞的次數(shù) 一定時(shí)間段內(nèi),放射性物質(zhì)放射的粒子數(shù) 一匹布上發(fā)現(xiàn)的疵點(diǎn)個(gè)數(shù) 一定頁(yè)數(shù)的書(shū)刊上出現(xiàn)的錯(cuò)別字個(gè)數(shù),2008年8月,泊松分布(概率分布函數(shù)),, 給定的時(shí)間間隔、長(zhǎng)度、面 積、體積內(nèi)“成功”的平均數(shù) e = 2.71828 x 給定的時(shí)間間隔、長(zhǎng)度、面 積、體積內(nèi)“成功”的次數(shù),2008年8月,泊松分布 (例題分析),
12、【例】假定某航空公司預(yù)訂票處平均每小時(shí)接到42次訂票電話,那么10分鐘內(nèi)恰好接到6次電話的概率是多少?,解:設(shè)X=10分鐘內(nèi)航空公司預(yù)訂票處接到的電話次數(shù),2008年8月,泊松分布 (用Excel計(jì)算概率),第1步:在Excel表格界面,直接點(diǎn)擊【fx】(插入函數(shù))命令 第2步:在【選擇類別】中點(diǎn)擊【統(tǒng)計(jì)】,并在【選擇函數(shù)】 中點(diǎn)擊【POISSON 】,然后單擊【確定】 第3步:在【X】后填入事件出現(xiàn)的次數(shù)(本例為6) 在【Means】后填入泊松分布的均值(本例為7) 在【Cumulative】后填入0(或FALSE),表示計(jì)算成 功次數(shù)恰好等于指定數(shù)值的概率(填入1或
13、TRUE表示 計(jì)算成功次數(shù)小于或等于指定數(shù)值的累積概率值), 用Excel計(jì)算泊松分布的概率,2008年8月,超幾何分布(hypergeometric distribution),,采用不重復(fù)抽樣,各次試驗(yàn)并不獨(dú)立,成功的概率也互不相等 總體元素的數(shù)目N很小,或樣本容量n相對(duì)于N來(lái)說(shuō)較大時(shí),樣本中“成功”的次數(shù)則服從超幾何概率分布 概率分布函數(shù)為,2008年8月,超幾何分布 (例題分析),【例】假定有10支股票,其中有3支購(gòu)買(mǎi)后可以獲利,另外7支購(gòu)買(mǎi)后將會(huì)虧損。如果你打算從10支股票中選擇4支購(gòu)買(mǎi),但你并不知道哪3支是獲利的,哪7支是虧損的。求 (1)有3支能獲利的股票都被你選中的概率
14、有多大? (2)3支可獲利的股票中有2支被你選中的概率有多大?,解:設(shè)N=10,M=3,n=4,2008年8月,超幾何分布 (用Excel計(jì)算概率),第1步:在Excel表格界面,直接點(diǎn)擊【fx】(插入函數(shù))命令 第2步:在【選擇類別】中點(diǎn)擊【統(tǒng)計(jì)】,并在【選擇函數(shù)】 中點(diǎn)擊【 HYPGEOMDIST】,然后單擊【確定】 第3步:在【Sample_s 】后填入樣本中成功的次數(shù)x(本例為3) 在【Number_sample】后填入樣本容量n(本例為4) 在【Population_s】后填入總體中成功的次數(shù)M(本例 為3) 在【Number_pop】后填入總體中的個(gè)體總數(shù)N
15、 (本例為10), 用Excel計(jì)算超幾何分布的概率,4.2.3 連續(xù)型概率分布,4.2 隨機(jī)變量的概率分布,,2008年8月,連續(xù)型隨機(jī)變量的概率分布,,連續(xù)型隨機(jī)變量可以取某一區(qū)間或整個(gè)實(shí)數(shù)軸上的任意一個(gè)值 它取任何一個(gè)特定的值的概率都等于0 不能列出每一個(gè)值及其相應(yīng)的概率 通常研究它取某一區(qū)間值的概率 用概率密度函數(shù)的形式和分布函數(shù)的形式來(lái)描述,2008年8月,,常用連續(xù)型概率分布,2008年8月,正態(tài)分布(normal distribution),由C.F.高斯(Carl Friedrich Gauss,17771855)作為描述誤差相對(duì)頻數(shù)分布的模型而提出 描述連續(xù)型隨機(jī)變量的最重
16、要的分布 許多現(xiàn)象都可以由正態(tài)分布來(lái)描述 可用于近似離散型隨機(jī)變量的分布 例如: 二項(xiàng)分布 經(jīng)典統(tǒng)計(jì)推斷的基礎(chǔ),2008年8月,概率密度函數(shù),f(x) = 隨機(jī)變量 X 的頻數(shù) = 正態(tài)隨機(jī)變量X的均值 = 正態(tài)隨機(jī)變量X的方差 = 3.1415926; e = 2.71828 x = 隨機(jī)變量的取值 (- < x < +),2008年8月,正態(tài)分布函數(shù)的性質(zhì),圖形是關(guān)于x=對(duì)稱鐘形曲線,且峰值在x= 處 均值和標(biāo)準(zhǔn)差一旦確定,分布的具體形式也惟一確定,不同參數(shù)正態(tài)分布構(gòu)成一個(gè)完整的“正態(tài)分布族” 均值可取實(shí)數(shù)軸上的任意數(shù)值,決定正態(tài)曲線的具體位置;標(biāo)準(zhǔn)差決定曲線的“陡峭”或“扁平”程度。越大
17、,正態(tài)曲線扁平;越小,正態(tài)曲線越高陡峭 當(dāng)X的取值向橫軸左右兩個(gè)方向無(wú)限延伸時(shí),曲線的兩個(gè)尾端也無(wú)限漸近橫軸,理論上永遠(yuǎn)不會(huì)與之相交 正態(tài)隨機(jī)變量在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出,而且其曲線下的總面積等于1,2008年8月, 和 對(duì)正態(tài)曲線的影響,,2008年8月,標(biāo)準(zhǔn)正態(tài)分布(standardize normal distribution),標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù),隨機(jī)變量具有均值為0,標(biāo)準(zhǔn)差為1的正態(tài)分布 任何一個(gè)一般的正態(tài)分布,可通過(guò)下面的線性變換轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布,標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù),2008年8月,正態(tài)分布 (用Excel計(jì)算正態(tài)分布的概率),第1步:在Excel
18、表格界面中,點(diǎn)擊“fx ”(插入函數(shù))命令 第2步:在【選擇類別】中點(diǎn)擊【統(tǒng)計(jì)】,并在【選擇函數(shù)】 中點(diǎn)擊【NORMDIST】,然后單擊【確定】 第3步:在【X】后輸入正態(tài)分布函數(shù)計(jì)算的區(qū)間點(diǎn)(即x值) 在【Mean】后輸入正態(tài)分布的均值 在【Standard_dev】后輸入正態(tài)分布的標(biāo)準(zhǔn)差 在【Cumulative】后輸入1(或TRUE)表示計(jì)算事件出 現(xiàn)次數(shù)小于或等于指定數(shù)值的累概率 單擊【確定】,2008年8月,正態(tài)分布 (計(jì)算標(biāo)準(zhǔn)正態(tài)分布的概率和反函數(shù)值),第1步:在Excel表格界面中,點(diǎn)擊“fx ”(插入函數(shù))命令 第2步:在【選擇類別】中點(diǎn)擊【
19、統(tǒng)計(jì)】,并在【選擇函數(shù)】中點(diǎn)擊 【NORMSDIST】,單擊【確定】 第3步:在【Z】后輸入Z的值。單擊【確定】 第1步:在Excel表格界面中,點(diǎn)擊“fx ”(插入函數(shù))命令 第2步:在【選擇類別】中點(diǎn)擊【統(tǒng)計(jì)】,并在【選擇函數(shù)】中點(diǎn)擊 【NORMSINV】,然后單擊【確定】 第3步:在【Probability】后輸入給定的概率值。單擊【確定】,計(jì)算概率,計(jì)算z值,2008年8月,正態(tài)分布(例題分析),【例】計(jì)算以下概率 (1) XN(50,102),求 和 (2) ZN(0,1),求 和 (3)正態(tài)分布概率為 0.05 時(shí),求標(biāo)準(zhǔn)正態(tài)累積分布函數(shù)
20、 的反函數(shù)值 z, 用Excel正態(tài)分布的計(jì)算概率,,,2008年8月,數(shù)據(jù)正態(tài)性的評(píng)估,對(duì)數(shù)據(jù)畫(huà)出頻數(shù)分布的直方圖或莖葉圖 若數(shù)據(jù)近似服從正態(tài)分布,則圖形的形狀與上面給出的正態(tài)曲線應(yīng)該相似 繪制正態(tài)概率圖。有時(shí)也稱為分位數(shù)分位數(shù)圖或稱Q-Q圖或稱為P-P圖 用于考察觀測(cè)數(shù)據(jù)是否符合某一理論分布,如正態(tài)分布、指數(shù)分布、t分布等等 P-P圖是根據(jù)觀測(cè)數(shù)據(jù)的累積概率與理論分布(如正態(tài)分布)的累積概率的符合程度繪制的 Q-Q圖則是根據(jù)觀測(cè)值的實(shí)際分位數(shù)與理論分布(如正態(tài)分布)的分位數(shù)繪制的 使用非參數(shù)檢驗(yàn)中的Kolmogorov-Smirnov檢驗(yàn)(K-S檢驗(yàn)),2008年8月,正態(tài)概率圖的繪制(n
21、ormal probability plots), 正態(tài)概率圖可以在概率紙上繪制,也可以在普通紙上繪制。在普通紙上繪制正態(tài)概率圖的步驟 第1步:將樣本觀察值從小到大排列 第2步:求出樣本觀察值的標(biāo)準(zhǔn)正態(tài)分?jǐn)?shù)zi 。標(biāo)準(zhǔn)正 態(tài)分?jǐn)?shù)滿足 第3步:將zi作為縱軸,xi作為橫軸,繪制圖形,即為 標(biāo)準(zhǔn)正態(tài)概率圖,,2008年8月,正態(tài)概率圖的繪制 (例題分析),【例】在一家保險(xiǎn)公司中隨機(jī)抽取10名銷(xiāo)售人員,他們的年銷(xiāo)售(單位:萬(wàn)元)分別為176,191,214,220,205,192,201,190,183,185。繪制正態(tài)概率圖,判斷銷(xiāo)售額數(shù)據(jù)是否服從正態(tài)分布,2008年8月,用SPSS繪
22、制正態(tài)概率圖,第1步:選擇【Graphs】下拉菜單,并選擇【P-P】 或 【Q-Q】選項(xiàng)進(jìn)入主對(duì)話框 第2步:在主對(duì)話框中將變量選入【Variables】 ,點(diǎn)擊【OK】, 用SPSS繪制正態(tài)概率圖,2008年8月,,正態(tài)概率圖的繪制 (例題分析),P-P圖 Q-Q圖,2008年8月,正態(tài)概率圖的分析(normal probability plots),實(shí)際應(yīng)用中,只有樣本數(shù)據(jù)較多時(shí)正態(tài)概率圖的效果才比較好。當(dāng)然也可以用于小樣本,但此時(shí)可能會(huì)出現(xiàn)與正態(tài)性有較大偏差的情況 在分析正態(tài)概率圖時(shí),最好不要用嚴(yán)格的標(biāo)準(zhǔn)去衡量數(shù)據(jù)點(diǎn)是否在一條直線上,只要近似在一條直線上
23、即可 對(duì)于樣本點(diǎn)中數(shù)值最大或最小的點(diǎn)也可以不用太關(guān)注,除非這些點(diǎn)偏離直線特別遠(yuǎn),因?yàn)檫@些點(diǎn)通常會(huì)與直線有偏離。如果某個(gè)點(diǎn)偏離直線特別遠(yuǎn),而其他點(diǎn)又基本上在直線上時(shí),這個(gè)點(diǎn)可能是離群點(diǎn),可不必考慮,,4.3 由正態(tài)分布導(dǎo)出的幾個(gè)重要分布 4.3.1 2 分布 4.3.2 t 分布 4.3.3 F 分布,第 4 章 概率分布,,4.3.1 2 分布,4.3 由正態(tài)分布導(dǎo)出的幾個(gè)重要分布,,2008年8月,由阿貝(Abbe) 于1863年首先給出,后來(lái)由海爾墨特(Hermert)和卡皮爾遜(KPearson) 分別于1875年和1900年推導(dǎo)出來(lái) 設(shè) ,則 令 ,則 y 服從自由度為1
24、的2分布,即 對(duì)于n個(gè)正態(tài)隨機(jī)變量y1 ,y2 ,yn,則隨機(jī)變量 稱為具有n個(gè)自由度的2分布,記為,c2-分布(2-distribution),2008年8月,分布的變量值始終為正 分布的形狀取決于其自由度n的大小,通常為不對(duì)稱的正偏分布,但隨著自由度的增大逐漸趨于對(duì)稱 期望為:E(2)=n,方差為:D(2)=2n(n為自由度) 可加性:若U和V為兩個(gè)獨(dú)立的2分布隨機(jī)變量,U2(n1),V2(n2),則U+V這一隨機(jī)變量服從自由度為n1+n2的2分布,c2-分布(性質(zhì)和特點(diǎn)),2008年8月,,不同自由度的c2-分布,2008年8月,c2-分布(用Excel計(jì)算c2分布的概率),利
25、用Excel提供的【CHIDIST】統(tǒng)計(jì)函數(shù),計(jì)算c2分布右單尾的概率值 語(yǔ)法:CHIDIST(x,degrees_freedom) ,其中df為自由度,x,是隨機(jī)變量的取值 利用【CHIINV】函數(shù)則可以計(jì)算給定右尾概率和自由度時(shí)相應(yīng)的反函數(shù)值 語(yǔ)法:CHIINV(probability,degrees_freedom), 用Excel計(jì)算c2 分布的概率,4.3.2 t 分布,4.3 由正態(tài)分布導(dǎo)出的幾個(gè)重要分布,,2008年8月,,t-分布 (t-distribution),提出者是William Gosset,也被稱為學(xué)生分布(students t) t 分布是類似正態(tài)分布的一種對(duì)稱分
26、布,通常要比正態(tài)分布平坦和分散。一個(gè)特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布,2008年8月,t-分布(用Excel計(jì)算t分布的概率和臨界值),利用Excel中的【TDIST】統(tǒng)計(jì)函數(shù),可以計(jì)算給定值和自由度時(shí)分布的概率值 語(yǔ)法:TDIST(x,degrees_freedom,tails) 利用【TINV】函數(shù)則可以計(jì)算給定概率和自由度時(shí)的相應(yīng) 語(yǔ)法:TINV(probability,degrees_freedom), 用Excel計(jì)算t分布的臨界值,4.3.3 F 分布,4.3 由正態(tài)分布導(dǎo)出的幾個(gè)重要分布,,2008年8月,為紀(jì)念統(tǒng)計(jì)學(xué)家費(fèi)希爾(R.A.
27、Fisher) 以其姓氏的第一個(gè)字母來(lái)命名則 設(shè)若U為服從自由度為n1的2分布,即U2(n1),V為服從自由度為n2的2分布,即V2(n2),且U和V相互獨(dú)立,則 稱F為服從自由度n1和n2的F分布,記為,F-分布(F distribution),2008年8月,,不同自由度的F分布,2008年8月,F-分布(用Excel計(jì)算F分布的概率和臨街值),利用Excel提供的【FDIST】統(tǒng)計(jì)函數(shù),計(jì)算分布右單尾的概率值 語(yǔ)法:FDIST(x,degrees_freedom1,degrees_freedom2) 利用【FINV】函數(shù)則可以計(jì)算給定單尾概率和自由度時(shí)的相應(yīng) 語(yǔ)法: FINV(pr
28、obability,degrees_freedom1,degrees_freedom2), 用Excel計(jì)算F分布的概率,4.4 樣本統(tǒng)計(jì)量的概率分布 4.4.1 統(tǒng)計(jì)量及其分布 4.4.2 樣本均值的分布 4.4.3 其他統(tǒng)計(jì)量的分布 4.4.4 統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤差,第 4 章 概率分布,,4.4.1 統(tǒng)計(jì)量及其分布,4.4 樣本統(tǒng)計(jì)量的概率分布,,2008年8月,參數(shù)和統(tǒng)計(jì)量,參數(shù)(parameter) 描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值 一個(gè)總體的參數(shù):總體均值()、標(biāo)準(zhǔn)差()、總體比例();兩個(gè)總體參數(shù):(1 -2)、(1-2)、(1/2) 總體參數(shù)通常用希
29、臘字母表示 統(tǒng)計(jì)量(statistic) 用來(lái)描述樣本特征的概括性數(shù)字度量,它是根據(jù)樣本數(shù)據(jù)計(jì)算出來(lái)的一些量,是樣本的函數(shù) 一個(gè)總體參數(shù)推斷時(shí)的統(tǒng)計(jì)量:樣本均值(x)、樣本標(biāo)準(zhǔn)差(s)、樣本比例(p)等兩個(gè)總體參數(shù)推斷時(shí)的統(tǒng)計(jì)量: (x1-x2)、(p1-p2)、(s1/s2) 樣本統(tǒng)計(jì)量通常用小寫(xiě)英文字母來(lái)表示,,2008年8月,樣本統(tǒng)計(jì)量的概率分布,是一種理論分布 在重復(fù)選取容量為n的樣本時(shí),由該統(tǒng)計(jì)量的所有可能取值形成的相對(duì)頻數(shù)分布 隨機(jī)變量是 樣本統(tǒng)計(jì)量 樣本均值, 樣本比例,樣本方差等 結(jié)果來(lái)自容量相同的所有可能樣本 提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推
30、斷科學(xué)性的重要依據(jù),抽樣分布 (sampling distribution),4.4.2 樣本均值的分布,4.4 樣本統(tǒng)計(jì)量的概率分布,,2008年8月,在重復(fù)選取容量為n的樣本時(shí),由樣本均值的所有可能取值形成的相對(duì)頻數(shù)分布 一種理論概率分布 推斷總體均值的理論基礎(chǔ),樣本均值的分布,2008年8月,樣本均值的分布(例題分析),【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體) ,即總體單位數(shù)N=4。4 個(gè)個(gè)體分別為x1=1,x2=2,x3=3,x4=4 ??傮w的均值、方差及分布如下,均值和方差,2008年8月,樣本均值的分布 (例題分析), 現(xiàn)從總體中抽取n2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=1
31、6個(gè)樣本。所有樣本的結(jié)果為,2008年8月,樣本均值的分布 (例題分析), 計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布,2008年8月,,樣本均值的分布與總體分布的比較 (例題分析), = 2.5 2 =1.25,總體分布,樣本均值分布,2008年8月,,樣本均值的分布與中心極限定理,當(dāng)總體服從正態(tài)分布N(,2)時(shí),來(lái)自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x 的期望值為,方差為2/n。即xN(,2/n),2008年8月,,中心極限定理(central limit theorem),從均值為,方差為 2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近
32、似服從均值為、方差為2/n的正態(tài)分布,2008年8月,,中心極限定理 (central limit theorem),x 的分布趨于正態(tài)分布的過(guò)程,,2008年8月,,抽樣分布與總體分布的關(guān)系,總體分布,,,,,,,,正態(tài)分布,非正態(tài)分布,,大樣本,小樣本,樣本均值 正態(tài)分布,,樣本均值 正態(tài)分布,樣本均值 非正態(tài)分布,2008年8月,樣本均值的分布 樣本均值的期望值和方差,樣本均值的分布(數(shù)學(xué)期望與方差),,4.4.3 其他統(tǒng)計(jì)量的分布,4.4 樣本統(tǒng)計(jì)量的概率分布,,2008年8月,總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比 不同性別的人與全部人數(shù)之比 合格品(或不合格品) 與全
33、部產(chǎn)品總數(shù)之比 總體比例可表示為 樣本比例可表示為,樣本比例的分布(proportion),2008年8月,在重復(fù)選取容量為n的樣本時(shí),由樣本比例的所有可能取值形成的相對(duì)頻數(shù)分布 一種理論概率分布 當(dāng)樣本容量很大時(shí),樣本比例的抽樣分布可用正態(tài)分布近似,即,樣本比例的分布,,2008年8月,樣本方差的分布,在重復(fù)選取容量為n的樣本時(shí),由樣本方差的所有可能取值形成的相對(duì)頻數(shù)分布 對(duì)于來(lái)自正態(tài)總體的簡(jiǎn)單隨機(jī)樣本,則比值 的抽樣分布服從自由度為 (n -1) 的2分布,即,2008年8月,樣本方差的分布,在重復(fù)選取容量為n的樣本時(shí),由樣本方差的所有可能取值形成的相對(duì)頻數(shù)分布 對(duì)于來(lái)自正態(tài)總體的簡(jiǎn)單隨
34、機(jī)樣本,則比值 的抽樣分布服從自由度為 (n -1) 的2分布,即,4.4.4 統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤差,4.4 樣本統(tǒng)計(jì)量的概率分布,,2008年8月,統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤差 (standard error),樣本統(tǒng)計(jì)量的抽樣分布的標(biāo)準(zhǔn)差,稱為統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤,也稱為標(biāo)準(zhǔn)誤差 衡量統(tǒng)計(jì)量的離散程度,測(cè)度了用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的精確程度 樣本均值和樣本比例的標(biāo)準(zhǔn)誤差分別為,2008年8月,估計(jì)的標(biāo)準(zhǔn)誤差 (standard error of estimation),當(dāng)計(jì)算標(biāo)準(zhǔn)誤時(shí)涉及的總體參數(shù)未知時(shí),用樣本統(tǒng)計(jì)量代替計(jì)算的標(biāo)準(zhǔn)誤,稱為估計(jì)的標(biāo)準(zhǔn)誤 以樣本均值為例:當(dāng)總體標(biāo)準(zhǔn)差未知時(shí),可用樣本標(biāo)準(zhǔn)差s代替
35、,則在重復(fù)抽樣條件下,樣本均值的估計(jì)標(biāo)準(zhǔn)誤為,2008年8月,Excel中的統(tǒng)計(jì)函數(shù),BINOMDIST計(jì)算二項(xiàng)分布的概率 POISSON計(jì)算泊松分布的概率 HYPGEOMDIST計(jì)算超幾何分布的概率 NORMDIST計(jì)算正態(tài)分布的概率 NORMINV計(jì)算正態(tài)分布的區(qū)間點(diǎn)(臨界值) NORMSDIST 計(jì)算標(biāo)準(zhǔn)正態(tài)分布的概率 NORMSINV計(jì)算標(biāo)準(zhǔn)正態(tài)分布的區(qū)間點(diǎn)(分位數(shù)) CHIDIST計(jì)算c2分布的右尾概率 CHIINV計(jì)算給定c2分布的右尾概率的臨界值 FDIST 計(jì)算F分布的右尾概率 FINV 計(jì)算給定F右尾概率的臨界 TDIST計(jì)算給定t值的分布概率 TINV計(jì)算給定概率的t值,2008年8月,本章小結(jié),度量事件發(fā)生的可能性概率 離散型概率分布 二項(xiàng)分布,泊松分布,超幾何分布 連續(xù)型概率分布 正態(tài)分布 由正態(tài)分布導(dǎo)出的幾個(gè)重要分布 c2-分布, t-分布, F-分布 樣本統(tǒng)計(jì)量的概率分布,結(jié) 束,THANKS,
- 溫馨提示:
1: 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。