《《元方差分析》PPT課件.ppt》由會員分享,可在線閱讀,更多相關(guān)《《元方差分析》PPT課件.ppt(50頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、二、二元方差分析,一 、一元方差分析,第六章,方差分析,二、統(tǒng)計分析,一 、總平方和的分解,第一節(jié),單因素試驗的方差分析,例1 假定某型號的電子管的使用壽命服從正態(tài)分布,并且原料差異只影響平均壽命,不影響方差 。現(xiàn)用三種不同來源的材料各試生產(chǎn)了一批電子管。從每批中各抽取若干只做壽命實(shí)驗,得數(shù)據(jù)如下表。,試問測試結(jié)果是否說明這批電子管的壽命有明顯差異?,1.引例,三個水平,因素,試驗指標(biāo),例2 設(shè)對四種玉米品種進(jìn)行對比實(shí)驗,每個品種都在同一塊田的五個小區(qū)各做一次實(shí)驗,實(shí)驗結(jié)果如下表所示。試問不同品種對玉米的平均產(chǎn)量是否有顯著影響?,水平,因素,試驗指標(biāo),設(shè)在試驗中,因素A有m個不同水平,在水平下
2、的試驗結(jié)果,其中 和 是未知參數(shù)。在水平 下作 次獨(dú)立實(shí)驗,其結(jié)果如表1所示。,2. 數(shù)學(xué)模型,表1,是來自總體 的容量為 的 一個 樣本,其觀察值為,(1),由于 相互獨(dú)立,且,若記,則,且相互獨(dú)立,要判斷因素的各水平間是否有顯著差異,也就是要 判斷各正態(tài)總體的均值是否相等,即檢驗假設(shè),(2),其中 與 均為未知參數(shù)。 式(2)稱為單因素方差分析的數(shù)學(xué)模型。,(3),再令,(5),則是各水平下總體均值的加權(quán)平均,稱為總平均值;,代表了第i水平下的總體均值與平均值的差異,這個差異稱為 的效應(yīng),,(4),由式(2),(3)可以得到單因素方差分析的等價數(shù)學(xué)模型,它滿足,式(5)表明:樣本由總平均值
3、 因素的水平效應(yīng) 隨機(jī)誤差三部分疊加而成。 因而式(5)也稱為線性可加模型。,(5),由于當(dāng) 為真時,,=各水平的效應(yīng),=統(tǒng)計假設(shè)模型(1)等價于,(6),基本任務(wù):根據(jù)樣本提供的信息,對假設(shè) (6)進(jìn)行檢驗,并估計未知參數(shù),檢驗此假設(shè)的方法就是方差分析,3. 總離差平方和的分解:,樣本總平均,通過分解,構(gòu)造統(tǒng)計量,組內(nèi)平均,(7),(8),兩者間的關(guān)系,稱為總離差平方和。,引入記號,(10),總離差平方和分解,全部數(shù)據(jù)與總平均之間的差異,又叫總變差,其中,為各水平下的樣本與該水平下樣本均值的離差平方和,反映了各水平下樣本值的隨機(jī)波動情況,稱為組內(nèi)平方和。 它是由試驗的隨機(jī)誤差引起的,故又稱誤
4、差平方和。,為各水平下的樣本均值與樣本總均值的(加權(quán))離差平方和,反映了各水平間的樣本值的差異,稱為組間平方和。 形成它的主要原因是因素A的各水平下的不同效應(yīng),故又稱為效應(yīng)平方和。,常見統(tǒng)計量,1、樣本均值,2、樣本方差,設(shè),是來自總體X的一個樣本,,常用來估計EX.,復(fù)習(xí),結(jié)論:設(shè) 為來自總體 的一個樣本,,4. SE,SA的統(tǒng)計特性,故,(12),(13),記,(14),(15),的均方,的均方,4. SE,SA的統(tǒng)計特性,(14),(15),(14)及(15)兩式表明:,是 的無偏估計,,僅當(dāng),成立時才是 的無偏估計,,否則它的期望值要大于,在 成立時應(yīng)接近于1,,而當(dāng) H1成立時總有偏
5、大的傾向。,如果比值,比1大得多,就應(yīng)拒絕假設(shè),為此,我們采用,(16),作為檢驗統(tǒng)計量。,當(dāng) 成立時,,與,相互獨(dú)立,且分別服從自由度,(n-m),(m-1)的 分布,故,復(fù)習(xí):F 分布的分位點(diǎn),對于給定的正數(shù),稱滿足條件,的點(diǎn),為,分位點(diǎn),分布的上,對給定的顯著性水平 ,由,得檢驗問題(1.1)或(1.6)的拒絕域為,(17),上述分析的結(jié)果可排列成表2的形式稱為方差分析表,在實(shí)際計算時,通常使用下列公式,其中,例1,設(shè)對四種玉米品種進(jìn)行對比實(shí)驗,每個品種都在同一塊田的五個小區(qū)各做一次實(shí)驗,實(shí)驗結(jié)果如下表所示。試問不同品種對玉米的平均產(chǎn)量是否有顯著影響?(=0.01),解,分別以 表示不同
6、品種玉米平均產(chǎn)量總體的均值,按題意需檢驗假設(shè),品種,地塊,產(chǎn)量,1 32.3 33.3 30.8 29.3,172.1 173.9 168.5 141.9 656.4,5 36.5 34.5 35.8 28.8,4 35.0 36.8 32.3 28.0,3 34.3 36.3 35.3 29.8,2 34.0 33.0 34.3 26.0,5923.682 6048.242 5678.45 4027.122 21677.50,29618.41 30241.21 28392.25 20135.61,5933.03 6060.07 5696.15 4035.97 21725.22,注意到,可得方
7、差分析表,方差分析表,方差來源,誤差E,因素A,總和,均 方,自由度,平方和,顯著性,F 比,當(dāng) 時,,由F分布表可查得,由于,故拒絕,即認(rèn)為,這四個品種對玉米平均產(chǎn)量的影響高度顯著。,3,19,16,若檢驗結(jié)果為原假設(shè)H0不成立,,有時需要對,則 的置信度為1 的置信區(qū)間為,由上面討論,可得未知參數(shù),的估計,是 的無偏估計。,5.未知參數(shù)的估計,如果檢驗結(jié)果為拒絕 ,,即,不全相等。,有時需要對第i個水平及第k個水平均值差 作出區(qū)間估計。,為此,我們可以取,作為 的點(diǎn)估計,,注意到,又,是 的無偏估計,,而,可以證明 與 相互獨(dú)立。,的置信度為 的置信區(qū)間為,求例2中未知參數(shù) 的點(diǎn)估計及均值
8、差的置信度為0.95的區(qū)間估計。,解,的點(diǎn)估計為,及 的無偏估計分別為,例2,當(dāng),時,,的置信度為0.95的置信,區(qū)間分別為,因素A分3個水平,對每個水平進(jìn)行4次試驗,結(jié)果如下表:,假定樣本都是從同方差的正態(tài)總體中抽取的。,(1)在顯著性水平 下,檢驗假設(shè),組均值相等。,(2)求未知參數(shù),及,的點(diǎn)估計以及均值差的置信區(qū)間(置信度為95%),例3,解,(1)用下表進(jìn)行計算,方差分析表,查表得,拒絕,即在顯著性水平 下,可以認(rèn)為組平,均值在整體上是有顯著差異的。,(2),查表,的置信度為95%的置信區(qū)間分別為,一共進(jìn)行了13次試驗,假設(shè)樣本都是從同方差的正態(tài)總體中抽取的,試驗結(jié)果如下表:,(1)在顯著性水平 下檢驗假設(shè),(2)求 及 的點(diǎn)估計及均值,差的95%置信區(qū)間。,例4,解,用下表進(jìn)行計算,得,方差分析表,(1)查表得,拒絕,在顯著性水平 下,,可以認(rèn)為3個水平下的期望有顯著差異。,(2),又,由,得,的置信區(qū)間為,即 (67.1, 7.1)。,由,可得,的置信區(qū)間為,即 (78.6, 7.4)。,由,可得,的置信區(qū)間為,即 (38.9,26.9)。,