练习题
5.1 设消费函数为
Yi12X2i3X3iui
式中,Yi为消费支出;X2i为个人可支配收入;X3i为个人的流动资产;ui为随机误差
项,并且E(u(u222i)0,Vari)X2i(其中为常数)。试回答以下问题:
(1)选用适当的变换修正异方差,要求写出变换过程;
(2)写出修正异方差后的参数估计量的表达式。
5.2 根据本章第四节的对数变换,我们知道对变量取对数通常能降低异方差性,但须对这种模型的随机误差项的性质给予足够的关注。例如,设模型为Y1X2u,对该模型中的变量取对数后得如下形式
lnYln12lnXlnu
(1)如果lnu要有零期望值,u的分布应该是什么? (2)如果E(u)1,会不会E(lnu)0?为什么? (3)如果E(lnu)不为零,怎样才能使它等于零?
5.3 由表中给出消费Y与收入X的数据,试根据所给数据资料完成以下问题: (1)估计回归模型Y12Xu中的未知参数1和2,并写出样本回归模型的书写格式;
(2)试用Goldfeld-Quandt法和White法检验模型的异方差性; (3)选用合适的方法修正异方差。
Y X Y X Y X 55 80 152 220 95 140 65 100 144 210 108 145 70 85 175 245 113 150 80
110
180
260
110
160
1
79 84 98 95 90 75 74 110 113 125 108 115 140 120 145 130
120 115 130 140 125 90 105 160 150 165 145 180 225 200 240 185
135 140 178 191 137 189 55 70 75 65 74 80 84 79 90 98
190 205 265 270 230 250 80 85 90 100 105 110 115 120 125 130
125 115 130 135 120 140 140 152 140 137 145 175 189 180 178 191
165 180 185 190 200 205 210 220 225 230 240 245 250 260 265 270
5.4 由表中给出1985年我国北方几个省市农业总产值,农用化肥量、农用水利、农业劳动力、每日生产性固定生产原值以及农机动力数据,要求:
(1) 试建立我国北方地区农业产出线性模型; (2) 选用适当的方法检验模型中是否存在异方差;
(3) 如果存在异方差,采用适当的方法加以修正。
农业总产值 农业劳动力 灌溉面积 化肥用量 户均固定
地区 北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 山东 河南 陕西 新疆
5.5 表中的数据是美国1988研究与开发(R&D)支出费用(Y)与不同部门产品销售量
2
农机动力
(亿元) 19.64 14.4 149.9 55.07 60.85 87.48 73.81 104.51 276.55 200.02 68.18 49.12
(万人) (万公顷) (万吨) 90.1 95.2 1639 .0 562.6 462.9 588.9 399.7 425.3 2365.6 2557.5 884.2 256.1
33.84 34.95 357.26 107.9 96.49 72.4 69.63 67.95 456.55 318.99 117.9 260.46
7.5 3.9 92.4 31.4 15.4 61.6 36.9 25.8 152.3 127.9 36.1 15.1
资产(元) (万马力) 394.3 567.5 706.89 856.37 1282.81 844.74 2576.81 1237.16 5812.02 754.78 607.41 1143.67
435.3 450.7 2712.6 1118.5 641.7 1129.6 647.6 1305.8 3127.9 2134.5 764 523.3
(X)。试根据资料建立一个回归模型,运用Glejser方法和White方法检验异方差,由此决定异方差的表现形式并选用适当方法加以修正。
单位:百万美元 工业群体
销售量X R&D费用Y
利润Z 1.容器与包装 6375.3 62.5 185.1 2.非银行业金融 11626.4 92.9 1569.5 3.服务行业 14655.1 178.3 276.8 4.金属与采矿 21869.2 258.4 2828.1 5.住房与建筑 26408.3 494.7 225.9 6.一般制造业 32405.6 1083 3751.9 7.休闲娱乐 35107.7 1620.6 2884.1 8.纸张与林木产品 40295.4 421.7 4645.7 9.食品 70761.6 509.2 5036.4 10.卫生保健 80552.8 6620.1 13869.9 11.宇航 95294 3918.6 4487.8 12.消费者用品 101314.3 1595.3 10278.9 13.电器与电子产品 116141.3 6107.5 8787.3 14.化工产品 122315.7 4454.1 16438.8 15.五金
141649.9 3163.9 9761.4 16.办公设备与电算机 175025.8 13210.7 19774.5 17.燃料 230614.5 1703.8 22626.6 18.汽车
293543
9528.2
18415.4
5.6 由表中给出的收入和住房支出样本数据,建立住房支出模型。
住房支出 收入 1.8 5 2 5 2 5 2 5 2.1 5 3 10 3.2 10 3.5 10 3.5 10 3.6 10 4.2 15 4.2 15 4.5 15 4.8 15
3
5 4.8 5 5.7 6 6.2 15 20 20 20 20 20 假设模型为Yi12Xiui,其中Y为住房支出,X为收入。试求解下列问题: (1)用OLS求参数的估计值、标准差、拟合优度
(2)用Goldfeld-Quandt方法检验异方差(假设分组时不去掉任何样本值)
222(3)如果模型存在异方差,假设异方差的形式是iXi,试用加权最小二乘法重新
估计1和2的估计值、标准差、拟合优度。
5.7 表中给出1969年20个国家的股票价格(Y)和消费者价格年百分率变化(X)的一个横截面数据。
国家 1.澳大利亚 2.奥地利 3.比利时 4.加拿大 5.智利 6.丹麦 7.芬兰 8.法国 9.德国 10.印度 11.爱尔兰 12.以色列 13.意大利 14.日本 15.墨西哥 16.荷兰 17.新西兰 18.瑞典 19.英国 20.美国
试根据资料完成以下问题:
(1)将Y对X回归并分析回归中的残差;
股票价格变化率%Y
5 11.1 3.2 7.9 25.5 3.8 11.1 9.9 13.3 1.5 6.4 8.9 8.1 13.5 4.7 7.5 4.7 8 7.5 9
消费者价格变化率%X
4.3 4.6 2.4 2.4 26.4 4.2 5.5 4.7 2.2 4 4 8.4 3.3 4.7 5.2 3.6 3.6 4 3.9 2.1
4
(2)因智利的数据出现了异常,去掉智利数据后,重新作回归并再次分析回归中的残差; (3)如果根据第1条的结果你将得到有异方差性的结论,而根据第2条的结论你又得到相反的结论,对此你能得出什么样的结论?
5.8 表中给出的是1998年我国重要制造业销售收入与销售利润的数据资料 行业名称 食品加工业 食品制造业 饮料制造业 烟草加工业 纺织业 服装制造业 皮革羽绒制品 木材加工业 家具制造业 造纸及纸制品 印刷业 文教体育用品 石油加工业 化学原料制品 销售收入 187.25 111.42 205.42 183.87 316.79 157.70 81.73 35.67 31.06 134.40 90.12 54.40 194.45 502.61 销售利润 3180.44 1119.88 1489.89 1328.59 3862.90 1779.10 1081.77 443.74 226.78 1124.94 499.83 504.44 2363.80 4195.22 行业名称 医药制造业 化学纤维制造 橡胶制品业 塑料制品业 非金属矿制品 黑色金属冶炼 有色金属冶炼 金属制品业 普通机械制造 专用设备制造 交通运输设备 电子机械制造 电子通讯设备 仪器仪表设备 销售收入 238.71 81.57 77.84 144.34 339.26 367.47 144.29 201.42 354.69 238.16 511.94 409.83 508.15 72.46 销售利润 1264.10 779.46 692.08 1345.00 2866.14 3868.28 1535.16 1948.12 2351.68 1714.73 4011.53 3286.15 4499.19 663.68 试完成以下问题:
(1)求销售利润岁销售收入的样本回归函数,并对模型进行经济意义检验和统计检验; (2)分别用图形法、Glejser方法、White方法检验模型是否存在异方差; (3)如果模型存在异方差,选用适当的方法对异方差性进行修正。
5.9 下表所给资料为1978年至2000年四川省农村人均纯收入Xt和人均生活费支出Yt的数据。
四川省农村人均纯收入和人均生活费支出 单位:元/人
时间
农村人均纯收入农村人均生活费
时间
农村人均纯收入农村人均生活费
5
X 支出Y X 支出Y
1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989
127.1 155.9 187.9 220.98 255.96 258.39 286.76 315.07 337.94 369.46 448.85 494.07
120.3 142.1 159.5 184.0 208.23 231.12 251.83 276.25 310.92 348.32 426.47 473.59
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
557.76 590.21 634.31 698.27 946.33 1158.29 1459.09 1680.69 1789.17 1843.47 1903.60
509.16 552.39 569.46 647.43 904.28 1092.91 1358.03 1440.48 1440.77 1426.06 1485.34
数据来源:《四川统计年鉴》2001年。
(1)求农村人均生活费支出对人均纯收入的样本回归函数,并对模型进行经济意义检验和统计检验;
(2)选用适当的方法检验模型中是否存在异方差;
(3)如果模型存在异方差,选用适当的方法对异方差性进行修正。
5.10 在题5.9中用的是时间序列数据,而且没有剔除物价上涨因素。试分析如果剔除物价上涨因素,即用实际可支配收入和实际消费支出,异方差的问题是否会有所改善?由于缺乏四川省从1978年起的农村居民消费价格定基指数的数据,以1978年—2000年全国商品零售价格定基指数(以1978年为100)代替,数据如下表所示: 年份 商品零售价格指数 1978 1979 1980 1981 1982 1983 1984 1985 100 102 108.1 110.7 112.8 114.5 117.7 128.1 1986 1987 1988 1989 1990 1991 1992 1993 年份 商品零售消费价格指数 135.8 145.7 172.7 203.4 207.7 213.7 225.2 254.9 1994 1995 1996 1997 1998 1999 2000 年份 商品零售消费价格指数 310.2 356.1 377.8 380.8 370.9 359.8 354.4 数据来源:《中国统计年鉴2001》
6
练习题参考解答
练习题5.1 参考解答
2(1)因为f(Xi)X2i,所以取W2i1,用Wi乘给定模型两端,得 X2i
YiXu11233ii X2iX2iX2iX2i上述模型的随机误差项的方差为一固定常数,即 Var(ui1)2Var(ui)2 X2iX2i(2)根据加权最小二乘法及第四章里(4.5)和(4.6)式,可得修正异方差后的参数估计
式为
ˆY*ˆX*ˆX* 12233ˆ 2W***2****yxWxWyxWx2ii2i2i3i2ii3i2i2ix3iWW2i*22i2ixWW*3*22i3ixWW3i**22i2i3ixx
ˆ其中
X3W2i**2****yi*x3iW2ix2iW2iyix2iW2ix2ix3i*22i2i
x*22i3ix**2i2i3ixx2*2WXW2i2i,XWXW2i2i,Y*WYW2i2ii
** x2iX2iX2**x3iX3iX3y*YiY*
练习题5.3参考解答
(1)该模型样本回归估计式的书写形式为
ˆ9.34750.6371XYii
(2.5691)(32.0088)R20.9464,s.e.9.0323,F1023.56
(2)首先,用Goldfeld-Quandt法进行检验。
a.将样本按递增顺序排序,去掉1/4,再分为两个部分的样本,即n1n222。 b.分别对两个部分的样本求最小二乘估计,得到两个部分的残差平方和,即
7
ee求F统计量为
2122603.01482495.8402221
eFe2495.844.1390
603.0148给定0.05,查F分布表,得临界值为F0.05(20,20)2.12。
c.比较临界值与F统计量值,有F=4.1390>F0.05(20,20)2.12,说明该模型的随机误差项存在异方差。
其次,用White法进行检验。具体结果见下表
White Heteroskedasticity Test: F-statistic Obs*R-squared
Test Equation:
Dependent Variable: RESID^2 Method: Least Squares Date: 08/05/05 Time: 12:37 Sample: 1 60
Included observations: 60 Variable C X X^2 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient -10.03614 0.165977 0.001800 Std. Error 131.1424 1.619856 0.004587 t-Statistic -0.076529 0.102464 0.392469 Prob. 0.9393 0.9187 0.6962 111.1375 12.14285 12.24757 6.301373 0.003370 6.301373 Probability 10.86401 Probability
0.003370 0.004374
0.181067 Mean dependent var 78.86225 0.152332 S.D. dependent var 102.3231 Akaike info criterion 596790.5 Schwarz criterion -361.2856 F-statistic 0.937366 Prob(F-statistic)
给定0.05,在自由度为2下查卡方分布表,得5.9915。
比较临界值与卡方统计量值,即nR10.86405.9915,同样说明模型中的随机误差项存在异方差。 (2)用权数W1
Dependent Variable: Y
2221,作加权最小二乘估计,得如下结果 X 8
Method: Least Squares Date: 08/05/05 Time: 13:17 Sample: 1 60
Included observations: 60 Weighting series: W1
Variable Coefficient Std. Error t-Statistic Prob. C 10.37051 2.629716 3.943587 0.0002 X 0.630950 0.018532 34.04667 0.0000 Weighted Statistics R-squared
0.211441 Mean dependent var 106.2101 Adjusted R-squared 0.197845 S.D. dependent var 8.685376 S.E. of regression 7.778892 Akaike info criterion 6.973470 Sum squared resid 3509.647 Schwarz criterion 7.043282 Log likelihood -207.2041 F-statistic 1159.176 Durbin-Watson stat 0.958467 Prob(F-statistic) 0.000000 Unweighted Statistics R-squared
0.946335 Mean dependent var 119.6667 Adjusted R-squared 0.945410 S.D. dependent var 38.68984 S.E. of regression 9.039689 Sum squared resid 4739.526
Durbin-Watson stat 0.800564
其估计的书写形式为
Yˆ10.37050.6310X(3.9436)(34.0467)
R20.2114,s.e.7.7789,F1159.18
练习题5.5参考解答
(1)建立样本回归模型。
Yˆ192.99440.0319X
(0.1948)(3.83)
R20.4783,s.e.2759.15,F14.6692(2)利用White检验判断模型是否存在异方差。
White Heteroskedasticity Test: F-statistic 3.057161 Probability 0.076976 Obs*R-squared 5.212471 Probability 0.073812
Test Equation:
Dependent Variable: RESID^2 Method: Least Squares Date: 08/08/05 Time: 15:38 Sample: 1 18
9
Included observations: 18 Variable C X X^2 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient -6219633. 229.3496 -0.000537 Std. Error 6459811. 126.2197 0.000449 t-Statistic -0.962820 1.817066 -1.194942 Prob. 0.3509 0.0892 0.2507
35.77968 35.92808 3.057161 0.076976 0.289582 Mean dependent var 6767029. 0.194859 S.D. dependent var
Akaike info criterion
2.61E+15 Schwarz criterion -319.0171 F-statistic 1.694572 Prob(F-statistic)
给定0.05和自由度为2下,查卡方分布表,得临界值5.9915,而White统计量
2(2),则不拒绝原假设,说明模型中不存在异方差。 nR25.2125,有nR20.052(3)有Glejser检验判断模型是否存在异方差。经过试算,取如下函数形式 e2X 得样本估计式
ˆ6.4435Xe
(4.5658) R20.2482由此,可以看出模型中随机误差项有可能存在异方差。
(4)对异方差的修正。取权数为w1/X,得如下估计结果
ˆ243.49100.0367XY
(1.7997)(5.5255)
R20.1684,s.e.694.2181,F30.5309
练习题5.7参考解答 (1)求回归估计式。
ˆ4.61030.7574XY
(4.2495)(5.0516)R20.5864,s.e.3.3910,F25.5183
作残差的平方对解释变量的散点图
10
504030E220100051015X202530
由图形可以看出,模型有可能存在异方差。
(2)去掉智利的数据后,回归得到如下模型
ˆ6.73810.2215XY
(2.8254)(0.3987)R20.0093,s.e.3.3906,F0.1589
作残差平方对解释变量的散点图
4030E220100051015X202530
从图形看出,异方差的程度降低了。
(3)比较情况(1)和情况(2),实际上根据所给的数据,我们发现情况(1)的异方差性比情况(2)的异方差性要低。
练习题5.9参考解答
(1)建立样本回归函数。
ˆ43.89670.8104XY
(2.1891)(37.7771)R20.9854,s.e.60.4920,F1427.112
从估计的结果看,各项检验指标均显著,但从残差平方对解释变量散点图可以看出,模型很
可能存在异方差。
11
2000015000E2100005000005001000X15002000
(2)用White检验判断是否存在异方差。
White Heteroskedasticity Test: F-statistic Obs*R-squared
Test Equation:
Dependent Variable: RESID^2 Method: Least Squares Date: 08/08/05 Time: 17:04 Sample: 1978 2000 Included observations: 23 Variable C X X^2 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient -2319.690 10.85979 -0.002560 Std. Error 2268.373 6.644388 0.003247 t-Statistic -1.022623 1.634430 -0.788315 Prob. 0.3187 0.1178 0.4398 5013.402 19.42572 19.57383 9.509463 0.001252 9.509463 Probability 11.21085 Probability
0.001252 0.003678
0.487428 Mean dependent var 3337.769 0.436171 S.D. dependent var 3764.490 Akaike info criterion 2.83E+08 Schwarz criterion -220.3958 F-statistic 1.552514 Prob(F-statistic)
由上表可知,nR11.2109,给定0.05,在自由度为2下,查卡方分布表,得临界值
2为5.9915,显然,nR11.2109>5.9915,则拒绝原假设,说明模型存在异
222方差。
进一步,用ARCH检验判断模型是否存在异方差。经试算选滞后阶数为1,则ARCH检验结果见下表
ARCH Test: F-statistic
9.394796 Probability
0.006109
12
Obs*R-squared
Test Equation:
7.031364 Probability
0.008009
Dependent Variable: RESID^2 Method: Least Squares Date: 08/08/05 Time: 17:11 Sample(adjusted): 1979 2000
Included observations: 22 after adjusting endpoints Variable C RESID^2(-1) R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient 1676.876 0.588797 Std. Error 1086.874 0.192098 t-Statistic 1.542843 3.065093 Prob. 0.1385 0.0061 5097.707 19.66118 19.76037 9.394796 0.006109 0.319607 Mean dependent var 3457.332 0.285588 S.D. dependent var 4308.730 Akaike info criterion 3.71E+08 Schwarz criterion -214.2730 F-statistic 1.874793 Prob(F-statistic)
由上表可知,(np)R7.0314,在0.05和自由度为1下,查卡方分布表,得临界值为0.05(1)3.8415,显然,(np)R7.0314>0.05(1)3.8415,则说明模型中随机误差项存在异方差。
(3)修正异方差。取权数为W1/X,得如下估计结果
22222ˆ8.30650.8558XY
(1.8563)(34.1172)R20.9941,s.e.13.4795,F1163.99
经检验异方差的表现有明显的降低。
13
因篇幅问题不能全部显示,请点此查看更多更全内容