《判別分析(第1、2節(jié)緒論、距離判別法).ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《判別分析(第1、2節(jié)緒論、距離判別法).ppt(16頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、第一節(jié)引言,,■什么是判別分析?,,,,,在我們的日常生活和工作實(shí)踐中,常常會(huì)遇到判別分析問題,即根據(jù)歷史上劃分類別的有關(guān)資料和某種最優(yōu)準(zhǔn)則,確定一種判別方法,判定一個(gè)新的樣品歸屬哪一類。例如,在醫(yī)學(xué)診斷中,一個(gè)病人肺部有陰影,醫(yī)生要判斷該病人患的是肺結(jié)核、肺部良性腫瘤還是肺癌?這里三種病人的集合體可看做是三個(gè)總體,病人是來源于三個(gè)總體之一的樣本。判別分析的目的是通過檢測(cè)病人的一些指標(biāo)(如陰影大小、邊緣的光滑度、體溫等)來判定該病人應(yīng)屬于那個(gè)總體.又如,在天氣預(yù)報(bào)中,我們有一段較長(zhǎng)時(shí)間關(guān)于某地區(qū)每天氣象的記錄資料(晴陰雨、氣溫、氣壓、濕度等),現(xiàn)在想建立一種用連續(xù)五天的氣象資料來預(yù)報(bào)第六天是什
2、么天氣的方法。這些問題都可以應(yīng)用判別分析方法予以解決。,第一節(jié)引言,,,,,,,,,,這類問題可用數(shù)學(xué)語言來表達(dá)如下:設(shè)有n個(gè)樣品,對(duì)每個(gè)樣品測(cè)得p項(xiàng)指標(biāo)(變量)的數(shù)據(jù),已知每個(gè)樣品屬于k個(gè)類別(或總體)G1,G2,…,Gk中的某一類,且它們的分布函數(shù)分別為F1(x),F(xiàn)2(x),…,F(xiàn)k(x)。我們希望利用這些數(shù)據(jù),找出一種判別函數(shù)(或判別準(zhǔn)則),使得這一函數(shù)具有某種最優(yōu)性質(zhì),能把屬于不同類別的樣本點(diǎn)盡可能地區(qū)別開來,并對(duì)測(cè)得同樣p項(xiàng)指標(biāo)(變量)數(shù)據(jù)的一個(gè)新樣品(待判樣品),能判定這個(gè)樣品歸屬于哪一類。,直觀上講,判別分析是用來判別樣品所屬類型的一種多元統(tǒng)計(jì)分析方法。,第二節(jié)距離判別法,,,
3、,,,,,,,,□馬氏距離,,,,第二節(jié)距離判別法,,,,,,,,,,,,,,第二節(jié)距離判別法,,,,,,,,,,,,,更一般地,設(shè)總體G1的分布為,設(shè)總體G2的分布為,則利用統(tǒng)計(jì)距離,可以找出分界點(diǎn),且不妨設(shè),所以若令,按這種距離最近的判別準(zhǔn)則:,第二節(jié)距離判別法,,,,,,,,,,,,,,,,因?yàn)槭菃沃笜?biāo)的問題,這時(shí)判別函數(shù)設(shè)為:,在此例中因,故判。,下面給出對(duì)于m元總體的這種相對(duì)距離—即所謂的馬氏距離定義,第二節(jié)距離判別法,,,,,,,,,,,,,,,,1、兩個(gè)總體的距離判別問題(1)情形:有協(xié)方差矩陣∑相等的兩個(gè)總體G1和G2,其均值分別是?1和?2,對(duì)于一個(gè)新的樣品X,要判斷它來自哪
4、個(gè)總體。一般的想法是計(jì)算新樣品X到兩個(gè)總體的馬氏距離D2(X,G1)和D2(X,G2),并按照如下的判別規(guī)則進(jìn)行判斷這個(gè)判別規(guī)則的等價(jià)描述為:求新樣品X到G1的距離與到G2的距離之差,如果其值為正,X屬于G2;否則X屬于G1。,第二節(jié)距離判別法,,,,,,,,,,,,,,,第二節(jié)距離判別法,,,,,,,,,,,,,,,第二節(jié)距離判別法,,,,,,,,,,,,,,,第二節(jié)距離判別法,,,,,,,,,,,,,,,第二節(jié)距離判別法,,,,,,,,,,,,,,作為特殊情形,我們考慮:,第二節(jié)距離判別法,,,,,,,,,,,,我們用這種特殊情形,說明錯(cuò)判概率的有關(guān)概念。,,從圖上可直觀地看到,用距離判別
5、法會(huì)發(fā)生錯(cuò)判,如樣本X雖然來自于總體,但卻落入?yún)^(qū)域,所以按照判別準(zhǔn)則被判別為屬于。錯(cuò)判的概率為圖中陰影左半部分面積,記為,另一個(gè)錯(cuò)判概率。,第二節(jié)距離判別法,,,,,,,,,,,,,從錯(cuò)判概率公式可看出,當(dāng)兩個(gè)總體的均值相差甚微,即越小,錯(cuò)判概率變得越大,這時(shí)作判別分析沒有意義。因此只有當(dāng)兩個(gè)總體的均值有顯著性差異時(shí),做判別分析才有意義。,第二節(jié)距離判別法,,,,,,,,,,,,,第二節(jié)距離判別法,,,,,,,,,,,,我們用p=1時(shí)的特殊情形,說明兩總體協(xié)方差不等時(shí)的歸類過程。假定兩總體為正態(tài)總體:并假定,這時(shí),當(dāng)觀測(cè)值x滿足條件:時(shí),,其中,,這個(gè)點(diǎn)把直線分成兩個(gè)部分,即,相對(duì)應(yīng)的判別準(zhǔn)則為:,