《應(yīng)用統(tǒng)計學(xué)相關(guān)分析與回歸分析學(xué)習(xí)教案》由會員分享,可在線閱讀,更多相關(guān)《應(yīng)用統(tǒng)計學(xué)相關(guān)分析與回歸分析學(xué)習(xí)教案(65頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、會計學(xué)1應(yīng)用應(yīng)用(yngyng)統(tǒng)計學(xué)統(tǒng)計學(xué) 相關(guān)分析與回歸分相關(guān)分析與回歸分析析第一頁,共65頁。2(了解)(了解) 主要內(nèi)容和學(xué)習(xí)目標(biāo)主要內(nèi)容和學(xué)習(xí)目標(biāo) 第1頁/共65頁第二頁,共65頁。3 8.1 8.1相關(guān)分析相關(guān)分析第2頁/共65頁第三頁,共65頁。4如:商品如:商品(shngpn)(shngpn)的消費量(的消費量(y y)與居民收入()與居民收入(x x)之)之間的關(guān)系間的關(guān)系 變量間關(guān)系是不能用函數(shù)關(guān)系精確變量間關(guān)系是不能用函數(shù)關(guān)系精確(jngqu)(jngqu)表達(dá)的,一個變表達(dá)的,一個變量的取值不能由另一個變量唯一確定。當(dāng)變量量的取值不能由另一個變量唯一確定。當(dāng)變量x x取
2、某個值時,變量取某個值時,變量y y的取值可能有幾個。的取值可能有幾個。各觀測點分布各觀測點分布(fnb)在直線周圍。在直線周圍。第3頁/共65頁第四頁,共65頁。5第4頁/共65頁第五頁,共65頁。6曲線(qxin)相關(guān)相關(guān)(xinggun)關(guān)系線性相關(guān)正相關(guān)(xinggun)負(fù)相關(guān)單相關(guān)復(fù)相關(guān)多元線性相關(guān)多元非線性相關(guān)第5頁/共65頁第六頁,共65頁。7第6頁/共65頁第七頁,共65頁。8飯飯店店學(xué)生人學(xué)生人數(shù)(千數(shù)(千人)人)x x季營業(yè)季營業(yè)額(千額(千元)元)y y飯飯店店學(xué)生人學(xué)生人數(shù)(千數(shù)(千人)人)x x季營業(yè)額季營業(yè)額(千元)(千元)y y1 12 258586 616161
3、371372 26 61051057 720201571573 38 888888 820201691694 48 81181189 922221491495 5121211711710102626202202第7頁/共65頁第八頁,共65頁。9第8頁/共65頁第九頁,共65頁。10第9頁/共65頁第十頁,共65頁。11第10頁/共65頁第十一頁,共65頁。12第11頁/共65頁第十二頁,共65頁。13第12頁/共65頁第十三頁,共65頁。14總體總體(zngt)(zngt)相關(guān)系數(shù)相關(guān)系數(shù): :XYXY式中:XY是變量(binling)X和Y的協(xié)方差X是變量(binling)X的標(biāo)準(zhǔn)差Y是變
4、量是變量Y Y的標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)差樣本相關(guān)系數(shù)樣本相關(guān)系數(shù):22()()iiiixxyyrxxyy第13頁/共65頁第十四頁,共65頁。15121040140 1300100.9511(2528140 140) (1847301300 1300)1010r第14頁/共65頁第十五頁,共65頁。16| 1r 01r10r | 1r 1r 1r 0r 第15頁/共65頁第十六頁,共65頁。170 | 1r|r|r0 | 0.3r0.3 | | 0.5r0.5 | 0.8r0.8 | 1r第16頁/共65頁第十七頁,共65頁。18根據(jù)給定的顯著性水平和自由度根據(jù)給定的顯著性水平和自由度n-2,n-2,查
5、找查找t t分布分布(fnb)(fnb)中的中的相應(yīng)臨界值相應(yīng)臨界值 。如果。如果 ,就否定原假設(shè),認(rèn)為,就否定原假設(shè),認(rèn)為 r r 在統(tǒng)計上是顯著的,即總體相關(guān)系數(shù)不為零,總體變量間存在統(tǒng)計上是顯著的,即總體相關(guān)系數(shù)不為零,總體變量間存在線性相關(guān)關(guān)系。在線性相關(guān)關(guān)系。8.1.2.3 8.1.2.3 相關(guān)系數(shù)的顯著性檢驗相關(guān)系數(shù)的顯著性檢驗(jinyn)(jinyn)提出提出(t ch)假設(shè):假設(shè):01:0,:0HH計算計算 t t 檢驗統(tǒng)計量:檢驗統(tǒng)計量: 2t2|tt 22(2)1ntrt nr第17頁/共65頁第十八頁,共65頁。1901:0; :0HH221020.958.6111 0
6、.95 0.95ntrr第18頁/共65頁第十九頁,共65頁。200.025(8)(0.05,8)2.31tTINV0.025| | 8.61(8)2.31tt第19頁/共65頁第二十頁,共65頁。21 8.2 8.2 線性回歸分析線性回歸分析第20頁/共65頁第二十一頁,共65頁。22第21頁/共65頁第二十二頁,共65頁。23第22頁/共65頁第二十三頁,共65頁。24總體(zngt)回歸線PRL隨機試驗所有可能(knng)結(jié)果的集合稱為總體或樣本空間第23頁/共65頁第二十四頁,共65頁。第一節(jié) 古典回歸(hugu)模型01( |)iiE Y XX11111.101.401.701.80
7、1.55555第24頁/共65頁第二十五頁,共65頁。第一節(jié) 古典回歸(hugu)模型第25頁/共65頁第二十六頁,共65頁。第一節(jié) 古典(gdin)回歸模型0101,1第26頁/共65頁第二十七頁,共65頁。第一節(jié) 古典回歸(hugu)模型01iiiYXi第27頁/共65頁第二十八頁,共65頁。29XYXY10.7763.2021.1074.0031.7084.3041.6594.5052.50106.00第28頁/共65頁第二十九頁,共65頁。30第29頁/共65頁第三十頁,共65頁。第一節(jié) 古典(gdin)回歸模型第30頁/共65頁第三十一頁,共65頁。第一節(jié) 古典回歸(hugu)模型0
8、01iiYXiY110第31頁/共65頁第三十二頁,共65頁。第一節(jié) 古典回歸(hugu)模型01iiiYXe第32頁/共65頁第三十三頁,共65頁。第一節(jié) 古典(gdin)回歸模型01iiiYXe01iiiYX第33頁/共65頁第三十四頁,共65頁。35第34頁/共65頁第三十五頁,共65頁。36第35頁/共65頁第三十六頁,共65頁。3701yx第36頁/共65頁第三十七頁,共65頁。第一節(jié) 古典(gdin)回歸模型( )0E12,kx xx2第37頁/共65頁第三十八頁,共65頁。第二節(jié) 回歸模型的參數(shù)(cnsh)的估計iiiiieYYYY實際的估計的22201min:()()iiiii
9、eY YYX01第38頁/共65頁第三十九頁,共65頁。第二節(jié) 回歸(hugu)模型的參數(shù)的估計12201()xyiiiiiixxSnx yxynxxSyx 第39頁/共65頁第四十頁,共65頁。410220()()()(2)iixxexSn nS1221()(2)ixxxxeSSnS第40頁/共65頁第四十一頁,共65頁。421121121(2) (),(2) ()tnStnS020020(2) (),(2) ()tnStnS0第41頁/共65頁第四十二頁,共65頁。4301 122 1,2,iiikkiiyxxxin22201 122() ()miniiiiiikkieyyyxxx第42頁
10、/共65頁第四十三頁,共65頁。4401 122001 1221101 1222()( 1)02()()0()()0iiikkiiiikkiiiiikkikikQyxxxQyxxxxQyxxxx第43頁/共65頁第四十四頁,共65頁。45121nnyyYy112111222212(1)1 1 1 kknnknnkxxxxxxXxxx0 11(1) 1kkB ()X YX X B1()BX XX Y第44頁/共65頁第四十五頁,共65頁。4622()1iiiiiieSccnk22(1) (),(1) ()iiiitnkStnkSiic1()CX X第45頁/共65頁第四十六頁,共65頁。47第4
11、6頁/共65頁第四十七頁,共65頁。481 1、復(fù)相關(guān)、復(fù)相關(guān)(xinggun)(xinggun)在多變量情況下,復(fù)相關(guān)在多變量情況下,復(fù)相關(guān)(xinggun)(xinggun)系數(shù)是用來測定因系數(shù)是用來測定因變量變量 與一組自變量與一組自變量 之間相關(guān)之間相關(guān)(xinggun)(xinggun)程度的指標(biāo)。其計算公式為:程度的指標(biāo)。其計算公式為:12,mx xxy22,122()1()iiymiyyrRyy復(fù)相關(guān)系數(shù)的值域在復(fù)相關(guān)系數(shù)的值域在0 0到到1 1之間,它的值為之間,它的值為1 1,表明,表明 與與 之間存在嚴(yán)密的線性關(guān)系;它的值為之間存在嚴(yán)密的線性關(guān)系;它的值為0 0,則表,則表
12、明明 與與 之間不存在任何線性相關(guān)關(guān)系;它的取之間不存在任何線性相關(guān)關(guān)系;它的取值在值在0 0和和1 1之間時,表明變量之間時,表明變量(binling)(binling)之間存在一定的線性之間存在一定的線性相關(guān)關(guān)系。相關(guān)關(guān)系。y12,mxxx y12,mxxx 第47頁/共65頁第四十八頁,共65頁。492 2、偏相關(guān)、偏相關(guān) 在多變量情況下,偏相關(guān)系數(shù)是用來測定當(dāng)其他變在多變量情況下,偏相關(guān)系數(shù)是用來測定當(dāng)其他變量保持不變的情況下,任意兩個變量之間相關(guān)程度的指量保持不變的情況下,任意兩個變量之間相關(guān)程度的指標(biāo)。它主要考察兩個變量之間的凈相關(guān)關(guān)系,從而反映標(biāo)。它主要考察兩個變量之間的凈相關(guān)關(guān)
13、系,從而反映現(xiàn)象現(xiàn)象(xinxing)之間的真實聯(lián)系。以兩個自變量的情形之間的真實聯(lián)系。以兩個自變量的情形為例為例: 12121222212(1)(1)yyyyrrrrrr21122122112(1)(1)yyyyrrrrrrx1和和y偏相關(guān)系數(shù):偏相關(guān)系數(shù): x2和和y偏相關(guān)系數(shù):偏相關(guān)系數(shù):第48頁/共65頁第四十九頁,共65頁。50 8.3 8.3 回歸模型的統(tǒng)計檢驗和預(yù)測回歸模型的統(tǒng)計檢驗和預(yù)測 第49頁/共65頁第五十頁,共65頁。51問題:采用普通問題:采用普通(ptng)(ptng)最小二乘估計方法,已經(jīng)保證了模型最好地擬合了樣本觀測值,為什么還要檢驗擬合程度?最小二乘估計方法,
14、已經(jīng)保證了模型最好地擬合了樣本觀測值,為什么還要檢驗擬合程度?第50頁/共65頁第五十一頁,共65頁。52 如果Yi=i 即實際觀測值落在樣本回歸“線”上,則擬合最好(zu ho)??烧J(rèn)為,“離差”全部來自回歸線,而與“殘差”無關(guān)。第51頁/共65頁第五十二頁,共65頁。53 對于所有樣本點,則需考慮這些(zhxi)點與樣本均值離差的平方和,可以證明:記22)(YYyTSSii總體總體(zngt)平方和平方和22()iiRSSyYY回歸回歸(hugu)(hugu)平方和平方和22()iiiESSeYY殘差平方和殘差平方和第52頁/共65頁第五十三頁,共65頁。54TSS=RSS+ESS Y的觀
15、測值圍繞其均值(jn zh)的總離差(total variation)可分解為兩部分:一部分來自回歸線(RSS),另一部分則來自隨機勢力(ESS)。在給定樣本在給定樣本(yngbn)中,中,TSS不變,不變,如果實際觀測點離樣本如果實際觀測點離樣本(yngbn)回歸線越近,則回歸線越近,則RSS在在TSS中占的比重越大,因此中占的比重越大,因此 擬合優(yōu)度:回歸平方和擬合優(yōu)度:回歸平方和RSS/Y的總離差的總離差TSS第53頁/共65頁第五十四頁,共65頁。5521R S SE S SRT S ST S S可決系數(shù)可決系數(shù)(xsh)R2(xsh)R2統(tǒng)計量統(tǒng)計量 稱稱 R2 R2 為(樣本為(樣
16、本(yngbn)(yngbn))可決系數(shù)或判定系數(shù))可決系數(shù)或判定系數(shù) 可決系數(shù)的取值范圍:可決系數(shù)的取值范圍:0,1 R2越接近越接近1,說明實際,說明實際(shj)觀測點離樣本線越近,擬合優(yōu)度越高。觀測點離樣本線越近,擬合優(yōu)度越高。第54頁/共65頁第五十五頁,共65頁。5601 122 1,2,iiikkiiyxxxin第55頁/共65頁第五十六頁,共65頁。57基本基本(jbn)步驟如下:步驟如下: 1、提出(t ch)假設(shè)2 2、計算檢驗、計算檢驗(jinyn)(jinyn)統(tǒng)計量統(tǒng)計量:3 3、對給定的顯著水平、對給定的顯著水平 確定臨界值確定臨界值4 4、得出檢驗結(jié)論:、得出檢驗
17、結(jié)論:如果如果 ,則否定原假設(shè),表明回歸模型是顯著,則否定原假設(shè),表明回歸模型是顯著的;反之,就不能否定原假設(shè)。的;反之,就不能否定原假設(shè)。012112:0; :,0kkHH 至少有一個不等于/( ,1)/(1)SSR kFF k nkSSEnk( ,1)FFk nk( ,1)F k nk第56頁/共65頁第五十七頁,共65頁。5801 122 1,2,iiikkiiyxxxin第57頁/共65頁第五十八頁,共65頁。59 檢驗(jinyn)步驟: 1、對總體參數(shù)(cnsh)提出假設(shè) 4 4、 比較,判斷比較,判斷(pndun)(pndun) 若若|t|t|t|t/2(n-k-1)/2(n-k
18、-1),則拒絕,則拒絕H0 H0 ,接受,接受H1 H1 ; 若若|t|t| t t/2(n-k-1)/2(n-k-1),則拒絕,則拒絕H1 H1 ,接受,接受H0 H0 ;01:0; :0iiHH2 2、構(gòu)造檢驗統(tǒng)計量、構(gòu)造檢驗統(tǒng)計量(1)()iiitt nkS3 3、對給定的顯著水平對給定的顯著水平 確定臨界值確定臨界值t /2(n-k-1)第58頁/共65頁第五十九頁,共65頁。60第59頁/共65頁第六十頁,共65頁。61( (一一) )點預(yù)測點預(yù)測(yc)(yc)對于一元線性回歸模型對于一元線性回歸模型 iiXY10給定樣本以外的解釋變量的觀測值給定樣本以外的解釋變量的觀測值XfXf
19、,可以得到被解釋變,可以得到被解釋變量的預(yù)測值量的預(yù)測值f f ,可以此作為其條件均值,可以此作為其條件均值E(Y|X=Xf)E(Y|X=Xf)或個別或個別(gbi)(gbi)值值YfYf的一個近似估計。的一個近似估計。 注意:嚴(yán)格地說,這只是被解釋注意:嚴(yán)格地說,這只是被解釋(jish)(jish)變量的預(yù)測值的估變量的預(yù)測值的估計值,而不是預(yù)測值。計值,而不是預(yù)測值。 原因原因: :(1 1)參數(shù)估計量不確定;)參數(shù)估計量不確定; (2 2)隨機項的影響)隨機項的影響8.3.4 8.3.4 預(yù)測預(yù)測第60頁/共65頁第六十一頁,共65頁。62()fE y22/221()1(2)()ffniixxytnnxx1/2(1)()fffytn kXXXX 第61頁/共65頁第六十二頁,共65頁。63fy22/221()1(2)1()ffniixxytnnxx第62頁/共65頁第六十三頁,共65頁。64 8.4 8.4 非線性回歸非線性回歸第63頁/共65頁第六十四頁,共65頁。65第64頁/共65頁第六十五頁,共65頁。