九九热最新网址,777奇米四色米奇影院在线播放,国产精品18久久久久久久久久,中文有码视频,亚洲一区在线免费观看,国产91精品在线,婷婷丁香六月天

歡迎來到裝配圖網(wǎng)! | 幫助中心 裝配圖網(wǎng)zhuangpeitu.com!
裝配圖網(wǎng)
ImageVerifierCode 換一換
首頁 裝配圖網(wǎng) > 資源分類 > PPT文檔下載  

管理學(xué)第章 回歸分析課件

  • 資源ID:119379924       資源大?。?span id="24d9guoke414" class="font-tahoma">4.52MB        全文頁數(shù):185頁
  • 資源格式: PPT        下載積分:10積分
快捷下載 游客一鍵下載
會(huì)員登錄下載
微信登錄下載
三方登錄下載: 微信開放平臺登錄 支付寶登錄   QQ登錄   微博登錄  
二維碼
微信掃一掃登錄
下載資源需要10積分
郵箱/手機(jī):
溫馨提示:
用戶名和密碼都是您填寫的郵箱或者手機(jī)號,方便查詢和重復(fù)下載(系統(tǒng)自動(dòng)生成)
支付方式: 支付寶    微信支付   
驗(yàn)證碼:   換一換

 
賬號:
密碼:
驗(yàn)證碼:   換一換
  忘記密碼?
    
友情提示
2、PDF文件下載后,可能會(huì)被瀏覽器默認(rèn)打開,此種情況可以點(diǎn)擊瀏覽器菜單,保存網(wǎng)頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無水印,預(yù)覽文檔經(jīng)過壓縮,下載后原文更清晰。
5、試題試卷類文檔,如果標(biāo)題沒有明確說明有答案則都視為沒有答案,請知曉。

管理學(xué)第章 回歸分析課件

SPSS 16實(shí)用教程第第7章章 回歸分析回歸分析回歸分析基本概念回歸分析基本概念7.1一元線性回歸分析一元線性回歸分析7.2多元線性回歸分析多元線性回歸分析7.3非線性回歸分析非線性回歸分析7.4曲曲 線線 估估 計(jì)計(jì)7.5時(shí)間序列的曲線估計(jì)時(shí)間序列的曲線估計(jì)7.6含虛擬自變量的回歸分析含虛擬自變量的回歸分析7.7含虛擬自變量的回歸分析含虛擬自變量的回歸分析7.8 在數(shù)量分析中,經(jīng)常會(huì)看到變量與變量之在數(shù)量分析中,經(jīng)常會(huì)看到變量與變量之間存在著一定的聯(lián)系。要了解變量之間如何發(fā)間存在著一定的聯(lián)系。要了解變量之間如何發(fā)生相互影響的,就需要利用相關(guān)分析和回歸分生相互影響的,就需要利用相關(guān)分析和回歸分析。在上一章講述了相關(guān)分析有關(guān)內(nèi)容。本章析。在上一章講述了相關(guān)分析有關(guān)內(nèi)容。本章介紹回歸分析基本概念,回歸分析的主要類型:介紹回歸分析基本概念,回歸分析的主要類型:一元線性回歸分析、多元線性回歸分析、非線一元線性回歸分析、多元線性回歸分析、非線性回歸分析、曲線估計(jì)、時(shí)間序列的曲線估計(jì)、性回歸分析、曲線估計(jì)、時(shí)間序列的曲線估計(jì)、含虛擬自變量的回歸分析以及邏輯回歸分析等。含虛擬自變量的回歸分析以及邏輯回歸分析等。相關(guān)分析和回歸分析都是研究變量間關(guān)系相關(guān)分析和回歸分析都是研究變量間關(guān)系的統(tǒng)計(jì)學(xué)課題。在應(yīng)用中,兩種分析方法經(jīng)常的統(tǒng)計(jì)學(xué)課題。在應(yīng)用中,兩種分析方法經(jīng)常相互結(jié)合和滲透,但它們研究的側(cè)重點(diǎn)和應(yīng)用相互結(jié)合和滲透,但它們研究的側(cè)重點(diǎn)和應(yīng)用面不同。面不同。在回歸分析中,變量在回歸分析中,變量y y稱為因變量,處稱為因變量,處于被解釋的特殊地位;而在相關(guān)分析中,變量于被解釋的特殊地位;而在相關(guān)分析中,變量y y與變量與變量x x處于平等的地位,研究變量處于平等的地位,研究變量y y與變量與變量x x的密切程度和研究變量的密切程度和研究變量x x與變量與變量y y的密切程度是的密切程度是一樣的。一樣的。在回歸分析中,因變量在回歸分析中,因變量y y是隨機(jī)變量,是隨機(jī)變量,自變量自變量x x可以是隨機(jī)變量,也可以是非隨機(jī)的可以是隨機(jī)變量,也可以是非隨機(jī)的確定變量;而在相關(guān)分析中,變量確定變量;而在相關(guān)分析中,變量x x和變量和變量y y都都是隨機(jī)變量。是隨機(jī)變量。相關(guān)分析是測定變量之間的關(guān)系密切相關(guān)分析是測定變量之間的關(guān)系密切程度,所使用的工具是相關(guān)系數(shù);而回歸分析程度,所使用的工具是相關(guān)系數(shù);而回歸分析則是側(cè)重于考察變量之間的數(shù)量變化規(guī)律,并則是側(cè)重于考察變量之間的數(shù)量變化規(guī)律,并通過一定的數(shù)學(xué)表達(dá)式來描述變量之間的關(guān)系,通過一定的數(shù)學(xué)表達(dá)式來描述變量之間的關(guān)系,進(jìn)而確定一個(gè)或者幾個(gè)變量的變化對另一個(gè)特進(jìn)而確定一個(gè)或者幾個(gè)變量的變化對另一個(gè)特定變量的影響程度。定變量的影響程度。具體地說,回歸分析主要解決以下幾方面具體地說,回歸分析主要解決以下幾方面的問題。的問題。通過分析大量的樣本數(shù)據(jù),確定變量通過分析大量的樣本數(shù)據(jù),確定變量之間的數(shù)學(xué)關(guān)系式。之間的數(shù)學(xué)關(guān)系式。對所確定的數(shù)學(xué)關(guān)系式的可信程度進(jìn)對所確定的數(shù)學(xué)關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并區(qū)分出對某一特定變量影行各種統(tǒng)計(jì)檢驗(yàn),并區(qū)分出對某一特定變量影響較為顯著的變量和影響不顯著的變量。響較為顯著的變量和影響不顯著的變量。利用所確定的數(shù)學(xué)關(guān)系式,根據(jù)一個(gè)利用所確定的數(shù)學(xué)關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的值來預(yù)測或控制另一個(gè)特定變量或幾個(gè)變量的值來預(yù)測或控制另一個(gè)特定變量的取值,并給出這種預(yù)測或控制的精確度。的取值,并給出這種預(yù)測或控制的精確度。作為處理變量之間關(guān)系的一種統(tǒng)計(jì)方法和作為處理變量之間關(guān)系的一種統(tǒng)計(jì)方法和技術(shù),回歸分析的基本思想和方法以及技術(shù),回歸分析的基本思想和方法以及“回歸回歸(RegressionRegression)”名稱的由來都要?dú)w功于英名稱的由來都要?dú)w功于英國統(tǒng)計(jì)學(xué)家國統(tǒng)計(jì)學(xué)家F FGaltonGalton(1822182219111911)。)。在實(shí)際中,根據(jù)變量的個(gè)數(shù)、變量的類型在實(shí)際中,根據(jù)變量的個(gè)數(shù)、變量的類型以及變量之間的相關(guān)關(guān)系,回歸分析通常分為以及變量之間的相關(guān)關(guān)系,回歸分析通常分為一元線性回歸分析、多元線性回歸分析、非線一元線性回歸分析、多元線性回歸分析、非線性回歸分析、曲線估計(jì)、時(shí)間序列的曲線估計(jì)、性回歸分析、曲線估計(jì)、時(shí)間序列的曲線估計(jì)、含虛擬自變量的回歸分析和邏輯回歸分析等類含虛擬自變量的回歸分析和邏輯回歸分析等類型。型。7.2.1 統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式 定義:一元線性回歸分析是在排除其他影定義:一元線性回歸分析是在排除其他影響因素或假定其他影響因素確定的條件下,分響因素或假定其他影響因素確定的條件下,分析某一個(gè)因素(自變量)是如何影響另一事物析某一個(gè)因素(自變量)是如何影響另一事物(因變量)的過程,所進(jìn)行的分析是比較理想(因變量)的過程,所進(jìn)行的分析是比較理想化的。其實(shí),在現(xiàn)實(shí)社會(huì)生活中,任何一個(gè)事化的。其實(shí),在現(xiàn)實(shí)社會(huì)生活中,任何一個(gè)事物(因變量)總是受到其他多種事物(多個(gè)自物(因變量)總是受到其他多種事物(多個(gè)自變量)的影響。變量)的影響。在實(shí)際問題中,由于所要研究的現(xiàn)象的總在實(shí)際問題中,由于所要研究的現(xiàn)象的總體單位數(shù)一般是很多的,在許多場合甚至是無體單位數(shù)一般是很多的,在許多場合甚至是無限的,因此無法掌握因變量限的,因此無法掌握因變量y y總體的全部取值。總體的全部取值。也就是說,總體回歸方程事實(shí)上是未知的,需也就是說,總體回歸方程事實(shí)上是未知的,需要利用樣本的信息對其進(jìn)行估計(jì)。顯然,樣本要利用樣本的信息對其進(jìn)行估計(jì)。顯然,樣本回歸方程的函數(shù)形式應(yīng)與總體回歸方程的函數(shù)回歸方程的函數(shù)形式應(yīng)與總體回歸方程的函數(shù)形式一致。形式一致。通過樣本數(shù)據(jù)建立一個(gè)回歸方程后,不能通過樣本數(shù)據(jù)建立一個(gè)回歸方程后,不能立即就用于對某個(gè)實(shí)際問題的預(yù)測。因?yàn)椋瑧?yīng)立即就用于對某個(gè)實(shí)際問題的預(yù)測。因?yàn)椋瑧?yīng)用最小二乘法求得的樣本回歸直線作為對總體用最小二乘法求得的樣本回歸直線作為對總體回歸直線的近似,這種近似是否合理,必須對回歸直線的近似,這種近似是否合理,必須對其作各種統(tǒng)計(jì)檢驗(yàn)。一般經(jīng)常作以下的統(tǒng)計(jì)檢其作各種統(tǒng)計(jì)檢驗(yàn)。一般經(jīng)常作以下的統(tǒng)計(jì)檢驗(yàn)。驗(yàn)。(1 1)擬合優(yōu)度檢驗(yàn))擬合優(yōu)度檢驗(yàn) 回歸方程的擬合優(yōu)度檢驗(yàn)就是要檢驗(yàn)樣本回歸方程的擬合優(yōu)度檢驗(yàn)就是要檢驗(yàn)樣本數(shù)據(jù)聚集在樣本回歸直線周圍的密集程度,從數(shù)據(jù)聚集在樣本回歸直線周圍的密集程度,從而判斷回歸方程對樣本數(shù)據(jù)的代表程度。而判斷回歸方程對樣本數(shù)據(jù)的代表程度?;貧w方程的擬合優(yōu)度檢驗(yàn)一般用判定系數(shù)回歸方程的擬合優(yōu)度檢驗(yàn)一般用判定系數(shù)R2R2實(shí)現(xiàn)。該指標(biāo)是建立在對總離差平方和進(jìn)行實(shí)現(xiàn)。該指標(biāo)是建立在對總離差平方和進(jìn)行分解的基礎(chǔ)之上。分解的基礎(chǔ)之上。(2 2)回歸方程的顯著性檢驗(yàn)()回歸方程的顯著性檢驗(yàn)(F F檢驗(yàn))檢驗(yàn))回歸方程的顯著性檢驗(yàn)是對因變量與所有回歸方程的顯著性檢驗(yàn)是對因變量與所有自變量之間的線性關(guān)系是否顯著的一種假設(shè)檢自變量之間的線性關(guān)系是否顯著的一種假設(shè)檢驗(yàn)。驗(yàn)?;貧w方程的顯著性檢驗(yàn)一般采用回歸方程的顯著性檢驗(yàn)一般采用F F檢驗(yàn),利用檢驗(yàn),利用方差分析的方法進(jìn)行。方差分析的方法進(jìn)行。(3 3)回歸系數(shù)的顯著性檢驗(yàn)()回歸系數(shù)的顯著性檢驗(yàn)(t t檢驗(yàn))檢驗(yàn))所謂回歸系數(shù)的顯著性檢驗(yàn),就是根據(jù)樣所謂回歸系數(shù)的顯著性檢驗(yàn),就是根據(jù)樣本估計(jì)的結(jié)果對總體回歸系數(shù)的有關(guān)假設(shè)進(jìn)行本估計(jì)的結(jié)果對總體回歸系數(shù)的有關(guān)假設(shè)進(jìn)行檢驗(yàn)。檢驗(yàn)。之所以對回歸系數(shù)進(jìn)行顯著性檢驗(yàn),是因之所以對回歸系數(shù)進(jìn)行顯著性檢驗(yàn),是因?yàn)榛貧w方程的顯著性檢驗(yàn)只能檢驗(yàn)所有回歸系為回歸方程的顯著性檢驗(yàn)只能檢驗(yàn)所有回歸系數(shù)是否同時(shí)與零有顯著性差異,它不能保證回?cái)?shù)是否同時(shí)與零有顯著性差異,它不能保證回歸方程中不包含不能較好解釋說明因變量變化歸方程中不包含不能較好解釋說明因變量變化的自變量。因此,可以通過回歸系數(shù)顯著性檢的自變量。因此,可以通過回歸系數(shù)顯著性檢驗(yàn)對每個(gè)回歸系數(shù)進(jìn)行考察。驗(yàn)對每個(gè)回歸系數(shù)進(jìn)行考察?;貧w參數(shù)顯著性檢驗(yàn)的基本步驟?;貧w參數(shù)顯著性檢驗(yàn)的基本步驟。提出假設(shè)提出假設(shè) 計(jì)算回歸系數(shù)的計(jì)算回歸系數(shù)的t t統(tǒng)計(jì)量值統(tǒng)計(jì)量值 根據(jù)給定的顯著水平根據(jù)給定的顯著水平確定臨界值,確定臨界值,或者計(jì)算或者計(jì)算t t值所對應(yīng)的值所對應(yīng)的p p值值 作出判斷作出判斷 研究問題研究問題 合成纖維的強(qiáng)度與其拉伸倍數(shù)有關(guān),測得合成纖維的強(qiáng)度與其拉伸倍數(shù)有關(guān),測得試驗(yàn)數(shù)據(jù)如表試驗(yàn)數(shù)據(jù)如表7-17-1所示。求合成纖維的強(qiáng)度與所示。求合成纖維的強(qiáng)度與拉伸倍數(shù)之間是否存在顯著的線性相關(guān)關(guān)系。拉伸倍數(shù)之間是否存在顯著的線性相關(guān)關(guān)系。7.2.2 SPSS中實(shí)現(xiàn)過程中實(shí)現(xiàn)過程序序 號號拉拉 伸伸 倍倍 數(shù)數(shù)強(qiáng)度(強(qiáng)度(kg/mm2)12.01.622.52.432.72.543.52.754.03.564.54.275.25.086.36.497.16.5108.07.3119.08.01210.08.1 實(shí)現(xiàn)步驟實(shí)現(xiàn)步驟 (1 1)輸出結(jié)果文件中的第一個(gè)表格如下)輸出結(jié)果文件中的第一個(gè)表格如下表所示。表所示。7.2.3 結(jié)果和討論結(jié)果和討論 (2 2)輸出的結(jié)果文件中第二個(gè)表格如下)輸出的結(jié)果文件中第二個(gè)表格如下表所示。表所示。(3 3)輸出的結(jié)果文件中第三個(gè)表格如下)輸出的結(jié)果文件中第三個(gè)表格如下表所示。表所示。(4 4)輸出的結(jié)果文件中第四個(gè)表格如下)輸出的結(jié)果文件中第四個(gè)表格如下表所示。表所示。7.3.1 統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式 定義:在上一節(jié)中討論的回歸問題只涉及定義:在上一節(jié)中討論的回歸問題只涉及了一個(gè)自變量,但在實(shí)際問題中,影響因變量了一個(gè)自變量,但在實(shí)際問題中,影響因變量的因素往往有多個(gè)。例如,商品的需求除了受的因素往往有多個(gè)。例如,商品的需求除了受自身價(jià)格的影響外,還要受到消費(fèi)者收入、其自身價(jià)格的影響外,還要受到消費(fèi)者收入、其他商品的價(jià)格、消費(fèi)者偏好等因素的影響;影他商品的價(jià)格、消費(fèi)者偏好等因素的影響;影響水果產(chǎn)量的外界因素有平均氣溫、平均日照響水果產(chǎn)量的外界因素有平均氣溫、平均日照時(shí)數(shù)、平均濕度等。時(shí)數(shù)、平均濕度等。因此,在許多場合,僅僅考慮單個(gè)變量是因此,在許多場合,僅僅考慮單個(gè)變量是不夠的,還需要就一個(gè)因變量與多個(gè)自變量的不夠的,還需要就一個(gè)因變量與多個(gè)自變量的聯(lián)系來進(jìn)行考察,才能獲得比較滿意的結(jié)果。聯(lián)系來進(jìn)行考察,才能獲得比較滿意的結(jié)果。這就產(chǎn)生了測定多因素之間相關(guān)關(guān)系的問題。這就產(chǎn)生了測定多因素之間相關(guān)關(guān)系的問題。研究在線性相關(guān)條件下,兩個(gè)或兩個(gè)以上研究在線性相關(guān)條件下,兩個(gè)或兩個(gè)以上自變量對一個(gè)因變量的數(shù)量變化關(guān)系,稱為多自變量對一個(gè)因變量的數(shù)量變化關(guān)系,稱為多元線性回歸分析,表現(xiàn)這一數(shù)量關(guān)系的數(shù)學(xué)公元線性回歸分析,表現(xiàn)這一數(shù)量關(guān)系的數(shù)學(xué)公式,稱為多元線性回歸模型。多元線性回歸模式,稱為多元線性回歸模型。多元線性回歸模型是一元線性回歸模型的擴(kuò)展,其基本原理與型是一元線性回歸模型的擴(kuò)展,其基本原理與一元線性回歸模型類似,只是在計(jì)算上更為復(fù)一元線性回歸模型類似,只是在計(jì)算上更為復(fù)雜,一般需借助計(jì)算機(jī)來完成。雜,一般需借助計(jì)算機(jī)來完成。對多元線性回歸,也需要測定方程的擬合對多元線性回歸,也需要測定方程的擬合程度、檢驗(yàn)回歸方程和回歸系數(shù)的顯著性。程度、檢驗(yàn)回歸方程和回歸系數(shù)的顯著性。(1 1)擬合優(yōu)度檢驗(yàn))擬合優(yōu)度檢驗(yàn) 測定多元線性回歸的擬合程度,與一元線測定多元線性回歸的擬合程度,與一元線性回歸中的判定系數(shù)類似,使用多重判定系數(shù),性回歸中的判定系數(shù)類似,使用多重判定系數(shù),其定義為其定義為 (2 2)回歸方程的顯著性檢驗(yàn)()回歸方程的顯著性檢驗(yàn)(F F檢驗(yàn))檢驗(yàn))多元線性回歸方程的顯著性檢驗(yàn)一般采用多元線性回歸方程的顯著性檢驗(yàn)一般采用F F檢驗(yàn),利用方差分析的方法進(jìn)行。檢驗(yàn),利用方差分析的方法進(jìn)行。(3 3)回歸系數(shù)的顯著性檢驗(yàn)()回歸系數(shù)的顯著性檢驗(yàn)(t t檢驗(yàn))檢驗(yàn))回歸系數(shù)的顯著性檢驗(yàn)是檢驗(yàn)各自變量回歸系數(shù)的顯著性檢驗(yàn)是檢驗(yàn)各自變量x x1 1,x x2 2,對因變量,對因變量y y的影響是否顯著,從而找出的影響是否顯著,從而找出哪些自變量對哪些自變量對y y的影響是重要的,哪些是不重的影響是重要的,哪些是不重要的。要的。與一元線性回歸一樣,要檢驗(yàn)解釋變量對與一元線性回歸一樣,要檢驗(yàn)解釋變量對因變量因變量y y的線性作用是否顯著,要使用的線性作用是否顯著,要使用t t檢驗(yàn)。檢驗(yàn)。研究問題研究問題 用多元回歸分析來分析用多元回歸分析來分析3636個(gè)員工多個(gè)心個(gè)員工多個(gè)心理變量值(理變量值(z1z1z8z8)對員工滿意度)對員工滿意度mymy的預(yù)測的預(yù)測效果,測得試驗(yàn)數(shù)據(jù)如表效果,測得試驗(yàn)數(shù)據(jù)如表7-27-2所示。所示。7.3.2 SPSS中實(shí)現(xiàn)過程中實(shí)現(xiàn)過程z1z2z3z4z5z6z7Z8滿滿 意意 度度66.0064.0062.0050.0058.0056.001.081.0025.0055.0050.0059.0059.0053.0051.001.001.1122.0050.0047.0049.0045.0046.0046.001.311.2020.0055.0059.0050.0054.0052.0069.001.001.0020.0055.0059.0048.0056.0047.0050.001.001.0024.0062.0054.0068.0046.0046.0051.001.081.0023.0060.0060.0056.0053.0052.0051.001.081.0021.0052.0052.0069.0058.0057.0062.001.001.0023.0056.0055.0057.0039.0044.0046.001.691.0015.0050.0050.0068.0046.0045.0056.001.081.1425.0058.0054.0060.0059.0052.0051.001.001.0025.0053.0052.0055.0057.0065.0064.001.081.0022.0052.0056.0053.0057.0063.0051.001.461.4320.0056.0065.0052.0051.0062.0047.001.001.0022.0050.0063.0059.0053.0055.0048.001.001.0020.0063.0057.0060.0066.0051.0056.001.001.0026.0056.0046.0058.0050.0045.0052.002.231.2921.0047.0050.0057.0049.0050.0048.002.081.1420.0053.0066.0053.0059.0055.0045.001.001.0025.00z1z2z3z4z5z6z7z8滿滿 意意 度度61.0055.0058.0061.0058.0061.001.151.1423.0059.0064.0060.0052.0054.0056.001.081.0026.0055.0060.0072.0060.0055.0067.001.081.0026.0056.0052.0068.0040.0051.0055.001.851.7130.0059.0051.0061.0056.0052.0056.001.001.0025.0060.0053.0062.0055.0047.0063.001.311.1427.0052.0051.0057.0045.0055.0059.001.231.1420.0056.0057.0057.0052.0059.0055.001.001.1426.0068.0058.0071.0068.0053.0061.001.001.0030.0060.0053.0061.0060.0056.0051.001.001.0027.0064.0056.0074.0050.0059.0057.001.851.1418.0067.0053.0060.0053.0053.0051.001.001.0024.0056.0056.0067.0067.0056.0052.001.001.0024.0053.0046.0049.0043.0050.0048.001.311.1419.0053.0057.0065.0052.0067.0059.001.771.4317.0060.0040.0071.0057.0056.0058.001.081.0024.0054.0045.0044.0049.0042.0046.001.001.0023.00 實(shí)現(xiàn)步驟實(shí)現(xiàn)步驟 (1 1)輸出結(jié)果文件中的第一個(gè)表格如下)輸出結(jié)果文件中的第一個(gè)表格如下表所示。表所示。7.3.3 結(jié)果和討論結(jié)果和討論 2 2)輸出的結(jié)果文件中第二個(gè)表格如下表)輸出的結(jié)果文件中第二個(gè)表格如下表所示。所示。(3 3)輸出的結(jié)果文件中第三個(gè)表格如下)輸出的結(jié)果文件中第三個(gè)表格如下表所示。表所示。(4 4)輸出的結(jié)果文件中第四個(gè)表格如下)輸出的結(jié)果文件中第四個(gè)表格如下表所示。表所示。(5 5)輸出的結(jié)果文件中第五個(gè)表格如下)輸出的結(jié)果文件中第五個(gè)表格如下表所示。表所示。(6 6)輸出的結(jié)果文件中第六個(gè)表格為回)輸出的結(jié)果文件中第六個(gè)表格為回歸系數(shù)分析,如下表所示歸系數(shù)分析,如下表所示 (7 7)輸出的結(jié)果文件中第七個(gè)表格如下)輸出的結(jié)果文件中第七個(gè)表格如下表所示。表所示。(8 8)輸出的結(jié)果文件中第八部分為圖形,)輸出的結(jié)果文件中第八部分為圖形,為回歸因變量和每個(gè)自變量之間的關(guān)系點(diǎn)圖。為回歸因變量和每個(gè)自變量之間的關(guān)系點(diǎn)圖。圖圖7-87-8為自變量為自變量z1z1和和mymy之間的關(guān)系點(diǎn)圖。之間的關(guān)系點(diǎn)圖。7.4.1 統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式 定義:研究在非線性相關(guān)條件下,自變量定義:研究在非線性相關(guān)條件下,自變量對因變量的數(shù)量變化關(guān)系,稱為非線性回歸分對因變量的數(shù)量變化關(guān)系,稱為非線性回歸分析。析。在實(shí)際問題中,變量之間的相關(guān)關(guān)系往往在實(shí)際問題中,變量之間的相關(guān)關(guān)系往往不是線性的,而是非線性的,因而不能用線性不是線性的,而是非線性的,因而不能用線性回歸方程來描述它們之間的相關(guān)關(guān)系,而要采回歸方程來描述它們之間的相關(guān)關(guān)系,而要采用適當(dāng)?shù)姆蔷€性回歸分析。用適當(dāng)?shù)姆蔷€性回歸分析。非線性回歸問題大多數(shù)可以化為線性回歸非線性回歸問題大多數(shù)可以化為線性回歸問題來求解,也就是通過對非線性回歸模型進(jìn)問題來求解,也就是通過對非線性回歸模型進(jìn)行適當(dāng)?shù)淖兞孔儞Q,使其化為線性模型來求解。行適當(dāng)?shù)淖兞孔儞Q,使其化為線性模型來求解。一般步驟為:一般步驟為:根據(jù)經(jīng)驗(yàn)或者繪制散點(diǎn)圖,選擇適當(dāng)根據(jù)經(jīng)驗(yàn)或者繪制散點(diǎn)圖,選擇適當(dāng)?shù)姆蔷€性回歸方程;的非線性回歸方程;通過變量置換,把非線性回歸方程化為通過變量置換,把非線性回歸方程化為線性回歸;線性回歸;用線性回歸分析中采用的方法來確定各用線性回歸分析中采用的方法來確定各回歸系數(shù)的值;回歸系數(shù)的值;對各系數(shù)進(jìn)行顯著性檢驗(yàn)。對各系數(shù)進(jìn)行顯著性檢驗(yàn)。計(jì)算公式如下。計(jì)算公式如下。在本節(jié)中介紹幾種常見的非線性回歸模型,在本節(jié)中介紹幾種常見的非線性回歸模型,并分別給出其線性化方法及圖形。并分別給出其線性化方法及圖形。研究問題研究問題 研究民用汽車總量與國內(nèi)生產(chǎn)總值的關(guān)系。研究民用汽車總量與國內(nèi)生產(chǎn)總值的關(guān)系。數(shù)據(jù)如表數(shù)據(jù)如表7-37-3所示。(資料來源:所示。(資料來源:中國統(tǒng)計(jì)中國統(tǒng)計(jì)年鑒年鑒20072007,中國統(tǒng)計(jì)出版社,中國統(tǒng)計(jì)出版社,20072007年)年)7.4.2 SPSS中實(shí)現(xiàn)過程中實(shí)現(xiàn)過程 實(shí)現(xiàn)步驟實(shí)現(xiàn)步驟7.4.3 結(jié)果和討論結(jié)果和討論 (1 1)第一部分輸出相關(guān)統(tǒng)計(jì)量和參數(shù)的)第一部分輸出相關(guān)統(tǒng)計(jì)量和參數(shù)的值,如下表所示。值,如下表所示。(2 2)第二部分輸出的是觀察值和)第二部分輸出的是觀察值和CubicCubic,PowerPower兩種曲線預(yù)測值的對比圖,如圖兩種曲線預(yù)測值的對比圖,如圖7-127-12所所示。示。7.5.1 統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式 定義:在一元回歸分析中,一般首先繪制定義:在一元回歸分析中,一般首先繪制自變量和因變量間的散點(diǎn)圖,然后通過數(shù)據(jù)在自變量和因變量間的散點(diǎn)圖,然后通過數(shù)據(jù)在散點(diǎn)圖中的分布特點(diǎn)選擇所要進(jìn)行回歸分析的散點(diǎn)圖中的分布特點(diǎn)選擇所要進(jìn)行回歸分析的類型,是使用線性回歸分析還是某種非線性的類型,是使用線性回歸分析還是某種非線性的回歸分析。回歸分析。然而,在實(shí)際問題中,用戶往往不能確定然而,在實(shí)際問題中,用戶往往不能確定究竟該選擇何種函數(shù)模型更接近樣本數(shù)據(jù),這究竟該選擇何種函數(shù)模型更接近樣本數(shù)據(jù),這時(shí)可以采用曲線估計(jì)的方法,其步驟如下:時(shí)可以采用曲線估計(jì)的方法,其步驟如下:首先根據(jù)實(shí)際問題本身特點(diǎn),同時(shí)選首先根據(jù)實(shí)際問題本身特點(diǎn),同時(shí)選擇幾種模型;擇幾種模型;然后然后SPSSSPSS自動(dòng)完成模型的參數(shù)估計(jì),自動(dòng)完成模型的參數(shù)估計(jì),并顯示并顯示R2R2、F F檢驗(yàn)值、相伴概率值等統(tǒng)計(jì)量;檢驗(yàn)值、相伴概率值等統(tǒng)計(jì)量;最后,選擇具有最后,選擇具有R2R2統(tǒng)計(jì)量值最大的模統(tǒng)計(jì)量值最大的模型作為此問題的回歸模型,并作一些預(yù)測。型作為此問題的回歸模型,并作一些預(yù)測。研究問題研究問題 試用試用SPSSSPSS對國內(nèi)生產(chǎn)總值和社會(huì)消費(fèi)品對國內(nèi)生產(chǎn)總值和社會(huì)消費(fèi)品零售總額之間的關(guān)系進(jìn)行曲線回歸分析。數(shù)據(jù)零售總額之間的關(guān)系進(jìn)行曲線回歸分析。數(shù)據(jù)如表如表7-47-4所示。(資料來源:所示。(資料來源:中國統(tǒng)計(jì)年鑒中國統(tǒng)計(jì)年鑒20072007,中國統(tǒng)計(jì)出版社,中國統(tǒng)計(jì)出版社,20072007年)年)7.5.2 SPSS中實(shí)現(xiàn)過程中實(shí)現(xiàn)過程年年 份份國內(nèi)生產(chǎn)總值(億元)國內(nèi)生產(chǎn)總值(億元)社會(huì)消費(fèi)品零售總額(億元)社會(huì)消費(fèi)品零售總額(億元)19783645.21558.619794062.61800.019804545.62140.019814891.62350.019825323.42570.019835962.72849.419847208.13376.419859016.04305.0198610275.24950.0198712058.65820.0198815042.87440.0198916992.38101.4199018667.88300.1199121781.59415.6199226923.510993.7199335333.912462.1199448197.916264.7199560793.720620.0199671176.624774.1199778973.027298.9199884402.329152.5199989677.131134.7200099214.634152.62001109655.237595.22002120332.748135.92003135822.852516.32004159878.359501.02005183867.967176.62006210871.076410.0 實(shí)現(xiàn)步驟實(shí)現(xiàn)步驟 (1 1)SPSSSPSS輸出結(jié)果文件中的第一部分如輸出結(jié)果文件中的第一部分如下表所示。下表所示。7.5.3 結(jié)果和討論結(jié)果和討論 (2 2)輸出的結(jié)果文件中第二部分如圖)輸出的結(jié)果文件中第二部分如圖7-7-1515所示。所示。(3 3)由于進(jìn)行曲線估計(jì)時(shí)所選的曲線模)由于進(jìn)行曲線估計(jì)時(shí)所選的曲線模型種類較多,所以使得輸出的觀察值與在各種型種類較多,所以使得輸出的觀察值與在各種函數(shù)模型條件下預(yù)測值的對比圖比較復(fù)雜,不函數(shù)模型條件下預(yù)測值的對比圖比較復(fù)雜,不易分辨出究竟易分辨出究竟LinearLinear,QuadraticQuadratic,CubicCubic及及PowerPower這這4 4種曲線究竟哪種的對樣本觀察值的種曲線究竟哪種的對樣本觀察值的擬合優(yōu)度更符合實(shí)際。擬合優(yōu)度更符合實(shí)際。(4 4)重新回到圖)重新回到圖7-137-13所示對話框,在所示對話框,在“ModelModel”框內(nèi)只選中框內(nèi)只選中“QuadraticQuadratic”和和“CubicCubic”這兩種擬合優(yōu)度更高的曲線模型進(jìn)行估計(jì)。得這兩種擬合優(yōu)度更高的曲線模型進(jìn)行估計(jì)。得出它們與觀察值的對比圖,如圖出它們與觀察值的對比圖,如圖7-177-17所示。所示。(5 5)如果在圖)如果在圖7-137-13所示對話框中選中了所示對話框中選中了“Display ANOVA tableDisplay ANOVA table”項(xiàng),作回歸方程顯項(xiàng),作回歸方程顯著性檢驗(yàn),將輸出相應(yīng)的方差分析表,以著性檢驗(yàn),將輸出相應(yīng)的方差分析表,以CubicCubic模型為例(如下表所示),其結(jié)果是:模型為例(如下表所示),其結(jié)果是:回歸方程顯著有意義,并且回歸方程顯著有意義,并且x,x2,x3x,x2,x3三個(gè)自變?nèi)齻€(gè)自變量的系數(shù)顯著不為零。量的系數(shù)顯著不為零。(6 6)由于在圖)由于在圖7-137-13所示對話框中選了所示對話框中選了“SaveSave”項(xiàng),且在圖項(xiàng),且在圖7-147-14所示的所示的“Save Save VariablesVariables”框中選擇了框中選擇了“Predicted valuesPredicted values”,“ResidualsResiduals”和和“Prediction intervalsPrediction intervals”3 3個(gè)選項(xiàng),因此在個(gè)選項(xiàng),因此在SPSSSPSS數(shù)據(jù)編輯窗口中就增了數(shù)據(jù)編輯窗口中就增了fit_1fit_1,err_1err_1,lcl_1lcl_1,ucl_1ucl_1等等4444個(gè)變量的個(gè)變量的值,如圖值,如圖7-187-18所示。所示。7.6.1 統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式 定義:時(shí)間序列的曲線估計(jì)是分析社會(huì)和定義:時(shí)間序列的曲線估計(jì)是分析社會(huì)和經(jīng)濟(jì)現(xiàn)象中經(jīng)常用到的一種曲線估計(jì)。通常把經(jīng)濟(jì)現(xiàn)象中經(jīng)常用到的一種曲線估計(jì)。通常把時(shí)間設(shè)為自變量時(shí)間設(shè)為自變量x x,代表具體的經(jīng)濟(jì)或社會(huì)現(xiàn),代表具體的經(jīng)濟(jì)或社會(huì)現(xiàn)象的變量設(shè)為因變量象的變量設(shè)為因變量y y,研究變量,研究變量x x與與y y之間關(guān)之間關(guān)系的方法就是時(shí)間序列曲線估計(jì)。其具體步驟系的方法就是時(shí)間序列曲線估計(jì)。其具體步驟與一般的曲線估計(jì)基本類似。與一般的曲線估計(jì)基本類似。計(jì)算公式:計(jì)算公式:SPSSSPSS中時(shí)間序列的曲線估計(jì)中時(shí)間序列的曲線估計(jì)模型與上一節(jié)所介紹相同。模型與上一節(jié)所介紹相同。研究問題研究問題 試用試用SPSSSPSS對對1978197820062006年間社會(huì)消費(fèi)品年間社會(huì)消費(fèi)品零售總額之間的關(guān)系進(jìn)行曲線回歸分析。數(shù)據(jù)零售總額之間的關(guān)系進(jìn)行曲線回歸分析。數(shù)據(jù)如表如表7-57-5所示。(資料來源:所示。(資料來源:中國統(tǒng)計(jì)年鑒中國統(tǒng)計(jì)年鑒20072007,中國統(tǒng)計(jì)出版社,中國統(tǒng)計(jì)出版社,20072007年)年)7.6.2 SPSS中實(shí)現(xiàn)過程中實(shí)現(xiàn)過程序序 號號年年 份份社會(huì)消費(fèi)品零售總額(億元)社會(huì)消費(fèi)品零售總額(億元)119781558.6219791800.0319802140.0419812350.0519822570.0619832849.4719843376.4819854305.0919864950.01019875820.01119887440.01219898101.41319908300.11419919415.615199210993.716199314270.417199418622.918199523613.819199628360.220199731252.921199833378.122199935647.923200039105.724200143055.425200248135.926200352516.327200459501.028200567176.629200676410.0 實(shí)現(xiàn)步驟實(shí)現(xiàn)步驟 (1 1)第一部分輸出相關(guān)統(tǒng)計(jì)量和參數(shù)的)第一部分輸出相關(guān)統(tǒng)計(jì)量和參數(shù)的值如下表所示。值如下表所示。7.6.3 結(jié)果和討論結(jié)果和討論 (2 2)第二部分輸出的是觀察值)第二部分輸出的是觀察值LinearLinear,CubicCubic,PowerPower和和Exponential 4Exponential 4種曲線預(yù)測值種曲線預(yù)測值的對比圖,如圖的對比圖,如圖7-217-21所示。所示。(3 3)由于在圖)由于在圖7-197-19所示所示“Curve Curve EstimationEstimation”對話框(三)中選了對話框(三)中選了“SaveSave”項(xiàng),項(xiàng),且在圖且在圖7-207-20的的“Save VariablesSave Variables”框中選擇了框中選擇了“Predicted valuesPredicted values”選項(xiàng)和選項(xiàng)和“Predict Predict CasesCases”框中選擇了框中選擇了“Predict throughPredict through”項(xiàng),項(xiàng),并且在并且在“ObservationObservation”框中鍵入了框中鍵入了“3131”,因,因此在此在SPSSSPSS數(shù)據(jù)編輯窗口中就新增了數(shù)據(jù)編輯窗口中就新增了fit_1fit_1,fit_2fit_2,fit_3fit_3和和fit_4fit_4等等4 4個(gè)變量的預(yù)測值,個(gè)變量的預(yù)測值,同時(shí)在窗口下方還新增了兩個(gè)個(gè)案,它們分別同時(shí)在窗口下方還新增了兩個(gè)個(gè)案,它們分別代表對代表對20072007年和年和20082008年的預(yù)測值。如圖年的預(yù)測值。如圖7-227-22所示。所示。7.7.1 統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式 定義:前面幾節(jié)所討論的回歸模型中,因定義:前面幾節(jié)所討論的回歸模型中,因變量和自變量都是可以直接用數(shù)字計(jì)量的,即變量和自變量都是可以直接用數(shù)字計(jì)量的,即可以獲得其實(shí)際觀測值(如收入、支出、產(chǎn)量、可以獲得其實(shí)際觀測值(如收入、支出、產(chǎn)量、國內(nèi)生產(chǎn)總值等),這類變量稱作數(shù)量變量、國內(nèi)生產(chǎn)總值等),這類變量稱作數(shù)量變量、定量變量或數(shù)量因素。然而,在實(shí)際問題的研定量變量或數(shù)量因素。然而,在實(shí)際問題的研究中,經(jīng)常會(huì)碰到一些非數(shù)量型的變量,如性究中,經(jīng)常會(huì)碰到一些非數(shù)量型的變量,如性別、民族、職業(yè)、文化程度、地區(qū)、正常年份別、民族、職業(yè)、文化程度、地區(qū)、正常年份與干旱年份、改革前與改革后等定性變量。與干旱年份、改革前與改革后等定性變量。在建立一個(gè)實(shí)際問題的回歸方程時(shí),經(jīng)常在建立一個(gè)實(shí)際問題的回歸方程時(shí),經(jīng)常需要考慮這些定性變量。例如,建立糧食產(chǎn)量需要考慮這些定性變量。例如,建立糧食產(chǎn)量預(yù)測方程就應(yīng)考慮到正常年份與受災(zāi)年份的不預(yù)測方程就應(yīng)考慮到正常年份與受災(zāi)年份的不同影響;建立空調(diào)的銷售模型時(shí),除了要考慮同影響;建立空調(diào)的銷售模型時(shí),除了要考慮居民收入和商品價(jià)格這兩個(gè)量的因素之外,還居民收入和商品價(jià)格這兩個(gè)量的因素之外,還必須將必須將“季節(jié)季節(jié)”這個(gè)質(zhì)的因素,作為一個(gè)重要這個(gè)質(zhì)的因素,作為一個(gè)重要解釋變量。解釋變量。由于受到質(zhì)的因素影響,回歸模型的參數(shù)由于受到質(zhì)的因素影響,回歸模型的參數(shù)不再是固定不變的。例如,在空調(diào)銷售模型中,不再是固定不變的。例如,在空調(diào)銷售模型中,收入、價(jià)格與空調(diào)銷售額的關(guān)系是隨著季節(jié)變收入、價(jià)格與空調(diào)銷售額的關(guān)系是隨著季節(jié)變化而改變的,也就是說,在不同的季節(jié)回歸?;淖兊模簿褪钦f,在不同的季節(jié)回歸模型的參數(shù)也會(huì)有所不同。再如,我國居民的消型的參數(shù)也會(huì)有所不同。再如,我國居民的消費(fèi)行為在改革開放前后大不相同,因此消費(fèi)函費(fèi)行為在改革開放前后大不相同,因此消費(fèi)函數(shù)的參數(shù)也會(huì)發(fā)生變化。顯然,如果忽略質(zhì)的數(shù)的參數(shù)也會(huì)發(fā)生變化。顯然,如果忽略質(zhì)的因素,仍把模型中的參數(shù)看作是固定不變的,因素,仍把模型中的參數(shù)看作是固定不變的,得到的參數(shù)估計(jì)量就不能正確描述經(jīng)濟(jì)變量之得到的參數(shù)估計(jì)量就不能正確描述經(jīng)濟(jì)變量之間的關(guān)系。間的關(guān)系。在回歸分析中,對一些自變量是定性變量在回歸分析中,對一些自變量是定性變量的先作數(shù)量化處理,處理的方法是引進(jìn)只取的先作數(shù)量化處理,處理的方法是引進(jìn)只取“0 0”和和“1 1”兩個(gè)值的兩個(gè)值的0 01 1型虛擬自變量。當(dāng)某型虛擬自變量。當(dāng)某一屬性出現(xiàn)時(shí),虛擬變量取值為一屬性出現(xiàn)時(shí),虛擬變量取值為“1 1”,否則,否則取值為取值為“0 0”。例如,令。例如,令“1 1”表示改革開放以表示改革開放以后的時(shí)期,后的時(shí)期,“0 0”則表示改革開放以前的時(shí)期。則表示改革開放以前的時(shí)期。再如,用再如,用“l(fā) l”表示某人是男性,表示某人是男性,“0 0”則表示則表示某人是女性。虛擬變量也稱為啞變量。需要指某人是女性。虛擬變量也稱為啞變量。需要指出的是,雖然虛擬變量取某一數(shù)值,但這一數(shù)出的是,雖然虛擬變量取某一數(shù)值,但這一數(shù)值沒有任何數(shù)量大小的意義,它僅僅用來說明值沒有任何數(shù)量大小的意義,它僅僅用來說明觀察單位的性質(zhì)和屬性。觀察單位的性質(zhì)和屬性。如果在回歸模型中需要引入多個(gè)如果在回歸模型中需要引入多個(gè)0 01 1型虛型虛擬變量擬變量D D時(shí),虛擬變量的個(gè)數(shù)應(yīng)按下列原則來時(shí),虛擬變量的個(gè)數(shù)應(yīng)按下列原則來確定:對于包含一個(gè)具有確定:對于包含一個(gè)具有k k種特征或狀態(tài)的質(zhì)種特征或狀態(tài)的質(zhì)因素的回歸模型,如果回歸模型不帶常數(shù)項(xiàng),因素的回歸模型,如果回歸模型不帶常數(shù)項(xiàng),則中需引入則中需引入k k個(gè)個(gè)0 01 1型虛擬變量型虛擬變量D D;如果有常數(shù);如果有常數(shù)項(xiàng),則只需引入項(xiàng),則只需引入k k1 1個(gè)個(gè)0 01 1型虛擬變量型虛擬變量D D。當(dāng)。當(dāng)k=2k=2時(shí),只需要引入一個(gè)時(shí),只需要引入一個(gè)0 01 1型虛擬變量型虛擬變量D D。計(jì)算公式如下。計(jì)算公式如下。下面以自變量所含定性變量是一個(gè)還是多下面以自變量所含定性變量是一個(gè)還是多個(gè)來分別說明如何構(gòu)造含虛擬自變量的回歸模個(gè)來分別說明如何構(gòu)造含虛擬自變量的回歸模型。型。(1 1)自變量中只含一個(gè)定性變量,且這)自變量中只含一個(gè)定性變量,且這個(gè)定性變量只有兩種特征的簡單情況時(shí)。個(gè)定性變量只有兩種特征的簡單情況時(shí)。(2 2)自變量中含多個(gè)定性變量時(shí)。)自變量中含多個(gè)定性變量時(shí)。研究問題研究問題 研究采取某項(xiàng)保險(xiǎn)革新措施的速度研究采取某項(xiàng)保險(xiǎn)革新措施的速度y y與保與保險(xiǎn)公司的規(guī)模險(xiǎn)公司的規(guī)模x1x1及其類型及其類型d d之間的關(guān)系,數(shù)據(jù)之間的關(guān)系,數(shù)據(jù)如表如表7-67-6所示。所示。7.7.2 SPSS中實(shí)現(xiàn)過程中實(shí)現(xiàn)過程iyx1d1171510226920321175043031052210406027707122100819120094290010162380112816411215272113112951143868115318511621224117201661181330511930124120142461 實(shí)現(xiàn)步驟實(shí)現(xiàn)步驟 (1 1)第一部分輸出結(jié)果文件中的第一個(gè))第一部分輸出結(jié)果文件中的第一個(gè)表格如下表所示。表格如下表所示。7.7.3 結(jié)果和討論結(jié)果和討論 (2 2)輸出的結(jié)果文件中第二個(gè)表格如下)輸出的結(jié)果文件中第二個(gè)表格如下表所示。表所示。(3 3)輸出的結(jié)果文件中第三個(gè)表格如下)輸出的結(jié)果文件中第三個(gè)表格如下表所示。表所示。(4 4)輸出的結(jié)果文件中第四個(gè)表格如下)輸出的結(jié)果文件中第四個(gè)表格如下表所示。表所示。7.8.1 統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式統(tǒng)計(jì)學(xué)上的定義和計(jì)算公式 定義:邏輯回歸分析是對定性變量的回歸定義:邏輯回歸分析是對定性變量的回歸分析。分析??捎糜谔幚矶ㄐ砸蜃兞康慕y(tǒng)計(jì)分析方法有:可用于處理定性因變量的統(tǒng)計(jì)分析方法有:判別分析(判別分析(Discriminant analysisDiscriminant analysis)、)、ProbitProbit分析、分析、LogisticLogistic回歸分析和對數(shù)線性回歸分析和對數(shù)線性模型等。在社會(huì)科學(xué)中,應(yīng)用最多的是模型等。在社會(huì)科學(xué)中,應(yīng)用最多的是LogisticLogistic回歸分析?;貧w分析。LogisticLogistic回歸分析根據(jù)回歸分析根據(jù)因變量取值類別不同,又可以分為因變量取值類別不同,又可以分為Binary Binary LogisticLogistic回歸分析和回歸分析和Multinomi-nal Multinomi-nal LogisticLogistic回歸分析。回歸分析。Binary Logistic Binary Logistic回歸模型中因變量只能回歸模型中因變量只能取兩個(gè)值取兩個(gè)值1 1和和0 0(虛擬因變量),而(虛擬因變量),而Multinomial LogisticMultinomial Logistic回歸模型中因變量可回歸模型中因變量可以取多個(gè)值。本節(jié)將只討論以取多個(gè)值。本節(jié)將只討論Binary LogisticBinary Logistic回歸,并簡稱回歸,并簡稱LogisticLogistic回歸(與回歸(與7.57.5節(jié)曲線估節(jié)曲線估計(jì)中介紹的計(jì)中介紹的LogisticLogistic曲線模型相區(qū)別)。曲線模型相區(qū)別)。LogisticLogistic函數(shù)的形式為函數(shù)的形式為 與任何概率一樣,似然的取值范圍在與任何概率一樣,似然的取值范圍在0,10,1之間。之間。2LL2LL的計(jì)算公式為的計(jì)算公式為1-2對數(shù)似然值(對數(shù)似然值(-2 log likelihood,-2LL)Logistic Logistic回歸的擬合優(yōu)度統(tǒng)計(jì)量計(jì)算公回歸的擬合優(yōu)度統(tǒng)計(jì)量計(jì)算公式為式為 在實(shí)際問題中,通常采用如下分類表在實(shí)際問題中,通常采用如下分類表(Classification TableClassification Table)反映擬合效果。)反映擬合效果。2擬合優(yōu)度(擬合優(yōu)度(Goodness of Fit)統(tǒng)計(jì)量)統(tǒng)計(jì)量Predicted(預(yù)測值)01Percent Correct(正確分類比例)Observed(觀測值)0n00n01f01n10n11f1Overall(總計(jì))ffClassification Table for YClassification Table for Y3Cox和和Snell的的R 2(Cox&Snells R-Square)4Nagelkerke的的R 2(N agelkerkes R-Square)5偽偽R 2(Psedo-R-square)偽偽R R2 2與線性回歸模型的與線性回歸模型的R R2 2相對應(yīng),其意義相對應(yīng),其意義相似,但它小于相似,但它小于1 1。6Hosmer和和Lemeshow的擬合優(yōu)度檢驗(yàn)的擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量(統(tǒng)計(jì)量(Hosmer and Lemeshows Goodness of Fit Test Statistic)與一般擬合優(yōu)度檢驗(yàn)不同,與一般擬合優(yōu)度檢驗(yàn)不同,HosmerHosmer和和LemeshowLemeshow的擬合優(yōu)度檢驗(yàn)通常把樣本數(shù)據(jù)根的擬合優(yōu)度檢驗(yàn)通常把樣本數(shù)據(jù)根據(jù)預(yù)測概率分為據(jù)預(yù)測概率分為1010組,然后根據(jù)觀測頻數(shù)和期組,然后根據(jù)觀測頻數(shù)和期望頻數(shù)構(gòu)造卡方統(tǒng)計(jì)量(即望頻數(shù)構(gòu)造卡方統(tǒng)計(jì)量(即HosmerHosmer和和LemeshowLemeshow的擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量,簡稱的擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量,簡稱H-LH-L擬擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量),最后根據(jù)自由度為合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量),最后根據(jù)自由度為8 8的的卡方分布計(jì)算其值并對卡方分布計(jì)算其值并對LogisticLogistic模型進(jìn)行檢模型進(jìn)行檢驗(yàn)。驗(yàn)。如果該如果該p p值小于給定的顯著性水平(如值小于給定的顯著性水平(如=0.05=0.05),則拒絕因變量的觀測值與模型預(yù)測),則拒絕因變量的觀測值與模型預(yù)測值不存在差異的零假設(shè),表明模型的預(yù)測值與值不存在差異的零假設(shè),表明模型的預(yù)測值與觀測值存在顯著差異。如果值大于,我們沒有觀測值存在顯著差異。如果值大于,我們沒有充分的理由拒絕零假設(shè),表明在可接受的水平充分的理由拒絕零假設(shè),表明在可接受的水平上模型的估計(jì)擬合了數(shù)據(jù)。上模型的估計(jì)擬合了數(shù)據(jù)。7Wald統(tǒng)計(jì)量統(tǒng)計(jì)量 Wald Wald統(tǒng)計(jì)量用于判斷一個(gè)變量是否應(yīng)該統(tǒng)計(jì)量用于判斷一個(gè)變量是否應(yīng)該包含在模型中,其檢驗(yàn)步驟如下。包含在模型中,其檢驗(yàn)步驟如下。(1 1)提出假設(shè)。)提出假設(shè)。(2 2)構(gòu)造)構(gòu)造WaldWald統(tǒng)計(jì)量。統(tǒng)計(jì)量。(3 3)作出統(tǒng)計(jì)判斷。)作出統(tǒng)計(jì)判斷。研究問題研究問題 在一次關(guān)于某城鎮(zhèn)居民上下班使用交通工在一次關(guān)于某城鎮(zhèn)居民上下班使用交通工具的社會(huì)調(diào)查中,因變量具的社會(huì)調(diào)查中,因變量y=1y=1表示居民主要乘表示居民主要乘坐公共汽車上下班;坐公共汽車上下班;y y=0=0表示主要騎自行車表示主要騎自行車上下班;自變量上下班;自變量x1x1表示被調(diào)查者的年齡;表示被調(diào)查者的年齡;x2x2表表示被調(diào)查者的月收入;示被調(diào)查者的月收入;x3x3表示被調(diào)查者的性別表示被調(diào)查者的性別(x3=1x3=1為男性,為男性,x3=0 x3=0為女性)。為女性)。試建立試建立y y與自變量間的與自變量間的LogisticLogistic回歸,數(shù)據(jù)如回歸,數(shù)據(jù)如表表7-77-7所示。所示。7.8.2 SPSS中實(shí)現(xiàn)過程中實(shí)現(xiàn)過程序號序號x1(年齡)(年齡)x2(月收入:元)(月收入:元)x3(性別)(性別)y118850002211200003238500142395001528120001631850007361500018421000019469500110481200001155180001125621000113581800011418850101520100010162512001017271300101828150010193095011203210001021331800102233100010233812001024411500102545180011264810001027521500112856180011 實(shí)現(xiàn)步驟實(shí)現(xiàn)步驟 (1 1)第一部分輸出結(jié)果有兩個(gè)表格,第)第一部分輸出結(jié)果有兩個(gè)表格,第一個(gè)表格說明所有個(gè)案(一個(gè)表格說明所有個(gè)案(2828個(gè))都被選入作為個(gè))都被選入作為回歸分析的個(gè)案?;貧w分析的個(gè)案。7.8.3 結(jié)果和討論結(jié)果和討論 第二個(gè)表格說明初始的因變量值(第二個(gè)表格說明初始的因變量值(0 0,1 1)已經(jīng)轉(zhuǎn)換為邏輯回歸分析中常用的已經(jīng)轉(zhuǎn)換為邏輯回歸分析中常用的0 0、1 1數(shù)值。數(shù)值。(2 2)第二部分()第二部分(Block 0Block 0)輸出結(jié)果有)輸出結(jié)果有4 4個(gè)表格。個(gè)表格。(3 3)Omnibus Tests of Model Omnibus Tests of Model CoefficientsCoefficients表格列出了模型系數(shù)的表格列出了模型系數(shù)的Omnibus Omnibus TestsTests結(jié)果。結(jié)果。(4 4)Model SummaryModel Summary表給出了表給出了-2-2 對數(shù)似對數(shù)似然值、然值、CoxCox和和SnellSnell的的R2R2以及以及NagelkerkeNagelkerke的的R2R2檢驗(yàn)統(tǒng)計(jì)結(jié)果。檢驗(yàn)統(tǒng)計(jì)結(jié)果。(5 5)Hosmer and Lemeshow TestHosmer and Lemeshow Test表格以表格以及及Contingency Table for Hosmer and Contingency Table for Hosmer and Lemeshow TestLemeshow Test表格給出了表格給出了HosmerHosmer和和LemeshowLemeshow的擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量。的擬合優(yōu)度檢驗(yàn)統(tǒng)計(jì)量。(6 6)Classification TableClassification Table分類表說明分類表說明第一次迭代結(jié)果的擬合效果,從該表格可以看第一次迭代結(jié)果的擬合效果,從該表格可以看出對于出對于y=0y=0,有,有86.7%86.7%的準(zhǔn)確性;對于的準(zhǔn)確性;對于y=1y=1,有,有76.9%76.9%準(zhǔn)確性,因此對于所有個(gè)案總共有準(zhǔn)確性,因此對于所有個(gè)案總共有82.1%82.1%的準(zhǔn)確性。的準(zhǔn)確性。(7 7)Variables in the EquationVariables in the Equation表格表格列出了列出了Step 1Step 1中各個(gè)變量對應(yīng)的系數(shù),以及中各個(gè)變量對應(yīng)的系數(shù),以及該變量對應(yīng)的該變量對應(yīng)的Wald Wald 統(tǒng)計(jì)量值和它對應(yīng)的相伴統(tǒng)計(jì)量值和它對應(yīng)的相伴概率。從該表格中可以看出概率。從該表格中可以看出x3x3相伴概率最小,相伴概率最小,WaldWald統(tǒng)計(jì)量最大,可見該變量在模型中很重要。統(tǒng)計(jì)量最大,可見該變量在模型中很重要。(8 8)Correlation MatrixCorrelation Matrix表格列出了常表格列出了常數(shù)數(shù)ConstantConstant、系數(shù)之間的相關(guān)矩陣。常數(shù)與、系數(shù)之間的相關(guān)矩陣。常數(shù)與x2x2之間的相關(guān)性最大,之間的相關(guān)性最大,x1x1和和x3x3之間的相關(guān)性之間的相關(guān)性最小。最小。(9 9)圖)圖7-267-26所示是觀測值和預(yù)測概率分所示是觀測值和預(yù)測概率分布圖。該圖以布圖。該圖以0 0和和1 1為符號,每四個(gè)符號代表一為符號,每四個(gè)符號代表一個(gè)個(gè)案。橫坐標(biāo)是個(gè)案屬于個(gè)個(gè)案。橫坐標(biāo)是個(gè)案屬于1 1的錄屬度,這里的錄屬度,這里稱為預(yù)測概率(稱為預(yù)測概率(Predicted ProbabilityPredicted Probability)。)??v坐標(biāo)是個(gè)案分布頻數(shù),反映個(gè)案的分布。縱坐標(biāo)是個(gè)案分布頻數(shù),反映個(gè)案的分布。(1010)邏輯回歸的最后一個(gè)輸出表格是)邏輯回歸的最后一個(gè)輸出表格是Casewise ListCasewise List,列出了殘差大于,列出了殘差大于2 2的個(gè)案。的個(gè)案?;貧w分析是研究變量與變量之間聯(lián)系的最回歸分析是研究變量與變量之間聯(lián)系的最為廣泛的模型。在實(shí)際中,根據(jù)變量的個(gè)數(shù)、為廣泛的模型。在實(shí)際中,根據(jù)變量的個(gè)數(shù)、類型,以及變量之間的相關(guān)關(guān)系,回歸分析通類型,以及變量之間的相關(guān)關(guān)系,回歸分析通常分為一元線性回歸分析、多元線性回歸分析、常分為一元線性回歸分析、多元線性回歸分析、非線性回歸分析、曲線估計(jì)、時(shí)間序列的曲線非線性回歸分析、曲線估計(jì)、時(shí)間序列的曲線估計(jì)、含虛擬自變量的回歸分析和邏輯回歸分估計(jì)、含虛擬自變量的回歸分析和邏輯回歸分析等。析等。

注意事項(xiàng)

本文(管理學(xué)第章 回歸分析課件)為本站會(huì)員(痛***)主動(dòng)上傳,裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對上載內(nèi)容本身不做任何修改或編輯。 若此文所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng)(點(diǎn)擊聯(lián)系客服),我們立即給予刪除!

溫馨提示:如果因?yàn)榫W(wǎng)速或其他原因下載失敗請重新下載,重復(fù)下載不扣分。




關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號:ICP2024067431-1 川公網(wǎng)安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請立即通知裝配圖網(wǎng),我們立即給予刪除!