《變量的相關性回歸分析獨立性檢驗》由會員分享,可在線閱讀,更多相關《變量的相關性回歸分析獨立性檢驗(27頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、單擊此處編輯母版標題樣式,單擊此處編輯母版文本樣式,第二級,第三級,第四級,第五級,*,1.,兩個變量間的相關關系,如果兩個變量之間確實存在關系,但又沒有函數(shù)關系所具有的確定性,它們的關系帶有隨機性,則稱這兩個變量具有,.,有相關關系的兩個變量,若一個變量的值由小到大時,另一個變量的值也是由小到大,這種相關稱為,;反之,一個變量的值由小到大,另一個變量的值由大到小,這種相關稱為,.,相關關系,正相關,負相關,2.,散點圖,在平面直角坐標系中描點,得到關于兩個變量的一組數(shù)據(jù)的圖形,這樣的圖形叫做,.,如果散點圖中,相應于具有相關關系的兩個變量所有觀察值的數(shù)據(jù)點,分布在一條直線附近,則稱這兩個變量
2、具有,這條直線叫做,方程為,=,bx,+,a,其中,b=,a,=-,b,.,散點圖,線性相關關系,回歸直線,3.,最小二乘法,使殘差平方和,Q,=(,y,i,-,bx,i,-,a,),2,為最小的方法,叫做,.,4.,線性回歸模型,(1),樣本的相關系數(shù),r,=,.,最小二乘法,當,r,0,時,表示兩個變量正相關,當,r,2.706,,就認為,x,與,y,有關系,.,利用,K,2,來確定在多大程度可以認為“兩個分類變量有關系”的方法稱為獨立性檢驗,.,題型一,變量的相關性,例,1,汽車的重量和汽車消耗一升汽油所行駛的路程成負相關,這說明,(),A.,汽車越重,每消耗,1,升汽油所行駛的路程越短
3、,B.,汽車越輕,每消耗,1,升汽油所行駛的路程越短,C.,汽車越重,消耗汽油越多,D.,汽車越輕,消耗汽油越多,A,要透徹理解一些常見參概念的意義,.,題型二,回歸分析,例,2,某車間為了規(guī)定工時定額,需要確定加工零件所花費的時間,為此做了四次試驗,根據(jù)試驗數(shù)據(jù)得到如下圖所示的散點圖,其中,x,表示零件的個數(shù),y,表示加工時間,.,(1),求出,y,關于,x,的線性,回歸方程,=,bx,+,a,;,(2),試預測加工,10,個零,件需多長時間?,(1),=3.5,=3.5,所以,b,=,=0.7,a,=-,b,=3.5-0.73.5=1.05,所以線性回歸方程為,=0.7,x,+1.05.,
4、(2),當,x,=10,時,,=0.710+1.05=8.05,故加工,10,個零件大約需,8.05,小時,.,求出回歸直線方程后,往往用來作為現(xiàn)實生產(chǎn)中的變量之間相關關系的近似關系,從而可用來指導生產(chǎn)實踐,.,為了研究某種細菌隨時間,x,變化繁殖的個數(shù),收集數(shù)據(jù)如下:,(1),以,x,為解釋變量,,y,為預報變量作這些數(shù)據(jù)的散點圖;,(2),求,y,關于,x,的回歸方程,.,天數(shù),(,x,),1,2,3,4,5,6,繁殖細菌個數(shù),(,y,),6,12,25,49,95,190,用所學函數(shù)看變化趨勢,.,(1),畫散點圖,(2),若建立線性模型,=,a,+,bx,則得到,=-56.467+34
5、.086,x,若建立指數(shù)函數(shù)模型,=,me,nx,則得到,=3.0519,e,0.6902,x,.,回歸方程不一定惟一,該題還可以用二次函數(shù)為模型,.,題型二,獨立性檢驗,例,2,在對人群的休閑方式的一次調(diào)查中,共調(diào)查了,124,人,其中女性,70,人,女性中有,43,人主要的休閑方式是看電視,另外,27,人主要的休閑方式是運動;男性中,21,人主要的休閑方式是看電視,其余男性的主要休閑方式是運動,.,(1),根據(jù)以上數(shù)據(jù)建立一個,22,列聯(lián)表,;,(2),判斷性別與休閑方式是否有關系,并說明理由,.,是否有關系取決于,K,2,的大小,.,(1),22,列聯(lián)表為,看電視,運動,總計,女,43,
6、27,70,男,21,33,54,合計,64,60,124,(2),K,2,=,=6.2,設,H,1,:,性別與不同運動方式有關系,.,假設,H,0,:,性別與不同的運動方式?jīng)]有關系,在,H,0,的前提下,,K,2,應該很小,而,P,(,K,2,5.024)0.025.,所以有,97.5,的把握認為性別與不同的運動方式之間有關系,.,對判斷過程和計算方式要清楚,計算,K,2,時勿將,(,ad,-,bc,),2,中的平方運算漏掉,.,下面是兩個變量間的一組數(shù)據(jù):,x,1.0,4.0,6.0,10.0,14.0,y,19.0,44.0,40.0,52.0,53.0,(1),在同一直角坐標系中畫出散
7、點圖、直線,=24+2.5,x,和曲線,=;,(2),比較所畫直線與曲線,哪一條更能表現(xiàn)這組數(shù)據(jù)之間的關系?,(3),分別計算用直線方程與曲線方程得到在,5,個,x,點處的預測值與實際預測之間的誤差,比較兩個誤差絕對值之和的大小,.,(,1,),所求作圖型如下:,(2),從圖形上看,曲線,=,比直線,=24+2.5,x,更能表現(xiàn)這組數(shù)據(jù)間的關系,.,(3),用直線,=24+2.5,x,近似數(shù)據(jù)時,誤差絕對值的和為,27.5,,用曲線,=,時,誤差絕對值的和為,12.5,,比前者小得多,.,由散點圖可比較直觀地看出更能表現(xiàn)所給數(shù)據(jù)的關系的曲線,再通過比較誤差絕對值之和的大小,則顯得更有說服力,.
8、,1.,計算回歸直線方程中的參數(shù),a,、,b,時應分層進行,避免因計算錯誤而產(chǎn)生誤差,.,2.,求線性回歸方程之前,應對數(shù)據(jù)進行線性相關分析,.,3.,回歸分析的關鍵是根據(jù)散點圖選擇函數(shù)模型,用相關系數(shù)判定哪種模型更好,.,4.,獨立性檢驗不能用比例余數(shù)來判定,,a,、,b,、,c,、,d,成比例擴大,,K,2,的值是不同的,正確列出,22,列聯(lián)表是解題的關鍵步驟,.,學例,1,(2009,遼寧卷,),某企業(yè)有兩個分廠生產(chǎn)某種零件,按規(guī)定內(nèi)徑尺寸(單位:,mm,)的值落在,29.94,,,30.06,)的零件為優(yōu)質(zhì)品,.,從兩個分廠生產(chǎn)的零件中各抽出了,500,件,量其內(nèi)徑尺寸,得結(jié)果如下表:
9、,甲廠:乙廠:,分組,頻數(shù),29.86,29.90),12,29.90,29.94),63,29.94,29.98),86,29.98,30.02),182,30.02,30.06),92,30.06,30.10),61,30.10,30.14),4,分組,頻數(shù),29.86,29.90),29,29.90,29.94),71,29.94,29.98),85,29.98,30.02),159,30.02,30.06),76,30.06,30.10),62,30.10,30.14),18,(1),試分別估計兩個分廠生產(chǎn)的零件的優(yōu)質(zhì)品率,;,(2),由以上統(tǒng)計數(shù)據(jù)填下面,22,列聯(lián)表,并分析是否有,
10、99%,的把握認為“兩個分廠生產(chǎn)的零件的質(zhì)量有差異”,.,甲廠,乙廠,合計,優(yōu)質(zhì)品,非優(yōu)質(zhì)品,合計,P,(,K,2,k,),0.05,0.01,k,3.841,6.635,附:,K,2,=,(,1,),甲廠抽查的產(chǎn)品中有,360,件優(yōu)質(zhì)品,從而甲廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計為,=72%,;乙廠抽查的產(chǎn)品中有,320,件優(yōu)質(zhì)品,從而乙廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計為,=64%.,(2),22,列聯(lián)表如下:,K,2,=7.356.635,所以有,99%,的把握認為“兩個分廠生產(chǎn)的零件的質(zhì)量有差異”,.,甲廠,乙廠,合計,優(yōu)質(zhì)品,360,320,680,非優(yōu)質(zhì)品,140,180,320,合計,500,500,1000,