spss教程13-1(判別分析).ppt
《spss教程13-1(判別分析).ppt》由會(huì)員分享,可在線(xiàn)閱讀,更多相關(guān)《spss教程13-1(判別分析).ppt(35頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
判別分析距離判別法費(fèi)歇爾判別法逐步判別法 判別分析 判別分析是根據(jù)觀察或測(cè)量到若干變量值 判斷研究對(duì)象如何分類(lèi)的方法 判別分析 設(shè)有k個(gè)總體 分布函數(shù)分別為 從每個(gè)總體 中抽取 個(gè)樣品 每個(gè)樣品測(cè)量 個(gè)指標(biāo) 對(duì)于任一給定的新樣本觀測(cè)值關(guān)于指標(biāo) 的觀測(cè)值 判斷該樣本觀測(cè)值應(yīng)屬于這k個(gè)總體中的哪一個(gè) 判別分析 例如 在考古研究中 根據(jù)挖掘的古人頭蓋骨的容量 周長(zhǎng)等判斷此人的性別 在地質(zhì)勘探中 根據(jù)某地的地質(zhì)結(jié)構(gòu) 化探和物探等各項(xiàng)指標(biāo)來(lái)判斷該地的礦化類(lèi)型 在醫(yī)學(xué)診斷中 醫(yī)生要根據(jù)某病人的化驗(yàn)結(jié)果和病情征兆判斷病人患哪一種疾病 等等 判別分析 判別分析 分類(lèi) 1 按判別的組數(shù)來(lái)分 有兩組判別分析和多組判別分析2 按區(qū)分不同總體所用的數(shù)學(xué)模型來(lái)分 有線(xiàn)性判別和非線(xiàn)性判別3 按判別對(duì)所處理的變量方法不同有逐步判別 序貫判別 4 按判別準(zhǔn)則來(lái)分 有費(fèi)歇爾判別準(zhǔn)則 貝葉斯判別準(zhǔn)則 判別分析和前面的聚類(lèi)分析有什么不同呢 主要不同點(diǎn)就是 在聚類(lèi)分析中一般人們事先并不知道或一定要明確應(yīng)該分成幾類(lèi) 完全根據(jù)數(shù)據(jù)來(lái)確定 而在判別分析中 至少有一個(gè)已經(jīng)明確知道類(lèi)別的 訓(xùn)練樣本 利用這個(gè)數(shù)據(jù) 就可以建立判別準(zhǔn)則 并通過(guò)預(yù)測(cè)變量來(lái)為未知類(lèi)別的觀測(cè)值進(jìn)行判別了 判別分析 費(fèi)歇爾判別法 費(fèi)歇爾判別方法是歷史上最早提出的判別方法之一 也叫線(xiàn)性判別法費(fèi)歇爾判別的思想是通過(guò)將多維數(shù)據(jù)投影到某個(gè)方向上 投影的原則是將類(lèi)與類(lèi)之間盡可能的分開(kāi) 然后再選擇合適的判別準(zhǔn)則 將待判的樣本進(jìn)行分類(lèi)判別 一 判別原理設(shè)有k個(gè)總體G1 G2 Gk 每類(lèi)中含有樣本數(shù)分別為n1 n2 nk假定所建立的判別函數(shù)為 費(fèi)歇爾判別法 a b a表示p維空間的一個(gè)方向 如果按這個(gè)方向做一條直線(xiàn) 表示向量x在這條直線(xiàn)上投影坐標(biāo) 費(fèi)歇爾方法就是要找一由p變量組成的線(xiàn)性函數(shù) 使得各組內(nèi)點(diǎn)的函數(shù)值盡可能接近 而不同組間的函數(shù)值盡可能遠(yuǎn) 費(fèi)歇爾判別法 2判別函數(shù) 費(fèi)歇爾判別法 費(fèi)歇爾判別法 費(fèi)歇爾判別法 費(fèi)歇爾判別法 標(biāo)準(zhǔn)化判別函數(shù) 典則相關(guān)系數(shù) 費(fèi)歇爾判別法 類(lèi)型總體投影均值之間的相等性檢驗(yàn) Wilk s 量 對(duì)于待判樣本 計(jì)算和若 則x屬于第k組 費(fèi)歇爾判別法 3判別準(zhǔn)則 逐步判別分析 一 逐步判別原理逐步判別分析從模型沒(méi)有變量開(kāi)始 每一步都對(duì)模型進(jìn)行檢驗(yàn) 把模型外對(duì)模型的判別力貢獻(xiàn)最大的變量加到模型中 同時(shí)考慮已經(jīng)在模型中但又不符合留在模型中條件的變量從模型中剔除 二 選擇變量方法1 Wilk s 最小法2 Rao V最大法3 馬氏距離最大法4 F統(tǒng)計(jì)量最大法5 剩余離差平方和最小法 逐步判別分析 Wilk s 最小法 U統(tǒng)計(jì)量 組內(nèi)平方和 總平方和 每一步都是統(tǒng)計(jì)量最小的進(jìn)入判別函數(shù)容許度 1 Ri2 Ri2為偏相關(guān)系數(shù) Rao V最大法 每步都是使RaoV統(tǒng)計(jì)量產(chǎn)生最大增量的變量進(jìn)入判別函數(shù)P 模型中的變量數(shù) g 分類(lèi)數(shù) nk 第k組樣本大小 Wij 組間協(xié)方差矩陣的逆矩陣V 兩組均值之差 組間的F檢驗(yàn) 每步都使任何兩類(lèi)間的最小的F值最大的變量進(jìn)入判別函數(shù) 判別分析的適用條件 1各自變量為連續(xù)型或有序分類(lèi)變量 2樣本來(lái)自多元正態(tài)總體 3各組的協(xié)方差矩陣相等 4變量間獨(dú)立 無(wú)共線(xiàn)性 判別分析的基本步驟 1 選擇自變量及組變量2 計(jì)算各組單變量的描述統(tǒng)計(jì)量3 推導(dǎo)判別系數(shù) 給出標(biāo)準(zhǔn)化或未標(biāo)準(zhǔn)化的典則判別系數(shù) 并對(duì)函數(shù)顯著性進(jìn)行檢驗(yàn)4 建立Fisher線(xiàn)性判別函數(shù)5 進(jìn)行判別分組6 進(jìn)行樣本回判分析 計(jì)算錯(cuò)分率7 輸出結(jié)果 具體操作 Statistics Classify Discriminant GroupingVariables 選擇分類(lèi)變量Definerange 定義范圍Independent 選擇自變量Usestepwisemethod逐步判別 Select 選擇觀測(cè)值 一般可省略 具體操作 Statistics 輸出統(tǒng)計(jì)量Descriptives 描述統(tǒng)計(jì)量Means 各類(lèi)中各自變量均值 標(biāo)準(zhǔn)差和各自變量總樣品的均值 標(biāo)準(zhǔn)差UnivariateANOVAS 檢驗(yàn)各類(lèi)中同一自變量均值是否相等Box M 檢驗(yàn)各組協(xié)差陣是否相等FunctionCofficients 判別函數(shù)系數(shù)Matrices 自變量的系數(shù)矩陣 具體操作 Method 選擇逐步判別的方法Method 選擇逐步判別的方法Criteria 選擇逐步判別停止的準(zhǔn)則Display 輸出結(jié)果 具體操作 Classify 指定分類(lèi)參數(shù)和判別結(jié)果PriorProbabilities 先驗(yàn)概率UseCovarianceMatrix 選擇分類(lèi)使用的協(xié)方差矩陣Display 輸出Casewise 逐步輸出每個(gè)樣品的分類(lèi)結(jié)果limitcasesto 最大樣品數(shù)Summarytable 分類(lèi)概括表Leave one outclassification剔除一個(gè)樣品后用其他樣品得到的該樣品的分類(lèi)結(jié)果 具體操作 Plot 輸出統(tǒng)計(jì)圖Combined groups 各類(lèi)輸出在同一張散點(diǎn)圖中Separate groups 每類(lèi)輸出一張散點(diǎn)圖中Territorialmao 分類(lèi)區(qū)域圖 具體操作 Save 保存新變量Predictedgroupmembership 建立新變量 表明預(yù)測(cè)的類(lèi)成員Discriminantscore 建立新變量 表明判別分?jǐn)?shù)Probabilitiesofgroupmembership 建立新變量 表明樣品屬于某一類(lèi)的概率 例題分析 Discrim sav 從心電圖的5個(gè)不同指標(biāo)中對(duì)健康人 硬化癥患者和冠心病患者的數(shù)據(jù) 作判別分析 例題分析 wormwood sav 作判別分析 練習(xí) 例題分析 World95 sav 根據(jù)氣候 經(jīng)濟(jì)因素 人口信息來(lái)判斷國(guó)家或地區(qū)屬于哪一種類(lèi)型 設(shè)有k個(gè)總體 均值向量分別為 協(xié)方差矩陣分別為 從每個(gè)總體 中抽取 個(gè)樣品 每個(gè)樣品測(cè)量 個(gè)指標(biāo) 對(duì)于任一給定的新樣本觀測(cè)值關(guān)于指標(biāo) 的觀測(cè)值 判斷該樣本觀測(cè)值應(yīng)屬于這k個(gè)總體中的哪一個(gè) 距離判別法 距離判別法 馬氏距離 判別準(zhǔn)則- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- spss 教程 13 判別分析
鏈接地址:http://www.szxfmmzy.com/p-6416086.html