1、 已知回归模型:,为起始薪金(元),为受教育水平(年),为随机干扰分布未知: ⑴ 、的含义
⑵是否满足线性、无偏、有效? ⑶是否可对作t检验?
⑷若E的单位为100元,各变量有什么变化? 解:
⑴表示没有接受过教育的员工的平均起始薪金;表示每单位N变化所引起的E的变化,即每多接受一年教育所对应的薪金的增加值。
⑵满足线性、无偏、有效性,因为这些性质的成立无需随机干扰项μ的正态分布假设。
(3)如果的分布未知,则所有的假设检验都是无效的。因为t检验与F检验是建立在μ的正态分布的基础上的。
⑷设表示以百元为度量单位的薪金, =++
所以,估计的截距项与斜率项均为原回归系数的1/100
2、下面是根据10组数据的X和Y的观察值得到的数据: ;; ;
假定满足所有的古典线性回归模型的假设,要求: (1)和的估计值及其标准差? (2)R的值
(3)对和分别建立95%的置信区间?利用置信区间法,你可以接受零假设:吗? 解: (1)因为n=10 且
2
???Xi2?Yi??Xi?YiXi??0?22?n?Xi?(?Xi)?n?YX??Y?Xiiii???1?22?n?Xi?(?Xi)??
所以0.5344 =21.22
若要求标准差,则需首先求出随机干扰项方差的估计:
2???2e?in?2
=77.60
?2故S????12x?i=0.0484
S???0??2?Xi2n?xi2?8.5913
(2)?ei2??(Yi2=620.81 ?Y?)i?(Yi?Y)2=10090
故R2?ESSRSS?1?=0.9365 TSSTSS(3)对自由度为8 的分布,在5%的显著性水平下的临界值
为t0。025(8)=2.306,故?0、?1的95%的置信区间分别为
?0?t??s?????(?,0?t?s?20?20)=(1.4085 ,41.0315)
?1?t??s?,??1?t??s?)=(0.4228 ,0.6460) (??1?122由于?1=0不在?1的置信区间内,故拒绝原假设:?1=0
2、 最小二乘法是指(D)最小: A、 B、
?Yi?Y?i
2?(Y?Y)?ii
C、 max?Yi?Y?i D、4、Blue是指(ABC)
A、 无偏 B、有效 C、线性 D、一致 5、回归方程(C)
A、N(0, B、t(n-2) C、N(0,) D、t(n) 6、R的范围是[0,1]
2
Yi??0??1Xi??i,通常假定?i服从
1.若要能得到k个参数估计量,所要求的最小的样本容量为( )
A.n≥k B.n≥k+1 C.n≥30 D.n≥3(k+1) 答案:A 分析:题中说的是k个参数估计量,而不是解释变量,若题干说有k个解释变量,那么应该选择B,因为还要加上?0。
2.当R2=1时,F=( )
A.F=1 B.F=-1 C.F→+∞ D.F=0 答案:C
3.n=30,在一个包含3个变量的线性回归中R2=0.85,则R2= 答案:0.833 解:R2?1?(1?R2)n?130?1?1?(1?0.85)??0.833
n?k?130?3?1
4.Biddle and Hameresh (1990)研究工作与休息之间关系,sleep代表休息,work代表工作,edu代表教育年限,age代表年龄,
sleep??0??1work??2edu??3age??
706个样本回归得到:(括号为回归样本标准差),
sleep=3638.25-0.148work-11.13edu+2.20age (112.3) (0.02) (5.88) (1.45)
2
R=0.11,SE2=419.4。 (1)求R2,F,标准差Std
(2)给定5%的检验水平,检验?3是否显著,如果是10%的显著水平呢?(t0.025(702)=1.65,t0.05(702)=1.28) 解:
(1)∵RSS=SE2×(n-k-1)=419.4×(706-3-1)=294418.8 ∴TSS=RSS/(1- R2)=330807.6404 则:Std?R2?1?(1?R2)TSS=21.6617 n?1n?1?0.106
n?k?1R2/kF??28.92 2(1?R)/(n?k?1)(2) ∵t???3S??3?2.20?1.52 1.45∴t0.05(702)=1.28<1.52<t0.025(702)=1.65 ∴5%的检测水平不能拒绝原假设,不显著
相关推荐: