第二章 简单线性回归模型
第一节 回归分析与回归方程
一、回归与相关 1、变量之间的关系
(1)函数关系:Y?f(X),其中Y为应变量,X为自变量。 (2)相关关系或统计关系:当一个变量X或若干个变量X1,X2,,Xk变化时,
Y发生相应的变化(一种依赖或依存的关系),反之亦然(相互依赖或依存的关系)。
在相关关系中,变量X与变量Y均为不确定的,并且它们之间的影响是双向的(双向因果关系)。
(3)单向因果关系:Y?f(X,u),其中u为随机变量。在计量经济模型中,单一线性函数要求变量必须是单向因果关系。
在单向因果关系中,变量Y是不确定的,变量X是确定的(或可控制的)。 要注意的是,对因果关系的解释不是靠相关关系或统计关系来确定的,并且,相关关系与统计关系也给不出变量之间的具体数学形式,而是要通过其它相关理论来解释,如经济学理论。例如,我们说消费支出依赖于实际收入是引用了消费理论的观点。
比如,数据挖掘关系可以看成是没有经济学关系的一种统计关系。 2、相关关系的类型 (1) 简单相关 (2) 复相关或多重相关 (3) 线性相关 (4) 非线性相关 (5) 正相关 (6) 负相关 (7) 不相关
1
3、相关关系的表示 (1)图形法
上述相关类型可直观地用(EViews软件)画图形来判断。例如,美国个人可支配收入与个人消费支出之间的相关关系可由下列图形看出,它们为正相关关系。
35003000PCE250020001500150020002500300035004000
其中,PDI为(美)个人可支配收入,PCE为个人消费支出。PDI和PCE分别对时间的折线图如下
3600PDI360032003200280028002400240020002000160070727476788082PDI84868890160070727476788082PCE84868890 PROFIT对STOCK的散点图为
250200PROFIT150100500050STOCK100150
2
其中,STOCK为(美)公司股票利息,PROFIT为公司税后利润。
以下是利润与股息分别对时间的序列图(或称趋势图)
250140120100150801006050402070727476788082848688907072747678808284868890PROFITSTOCK2000
GDP对M2的散点图为
1000008000060000GDP40000200000050000M2100000150000
其中M2为(中国)广义货币供应量,GDP为国内生产总值。 LM2对LPP的曲线图为
12.011.5LM211.010.54.95.05.1LPP5.25.3
其中,LPP为(中国)季度物价指数,LM2为季度广义货币供应量,变量前L表示对变量取了对数(以自然数为底)。
(2)相关程度的度量
3
第一,总体相关系数。
?XY?第二,样本相关系数。 rXYCov(X,Y)(记号)
Var(X)Var(Y)?(X?X)(Y?Y)?(X?X)?(Y?Y)ii2ii2(记号+表达式)
第三,计算相关系数应注意的问题。 ●rXY?rYX。
●rXY只是说明线性相关程度。 ●rXY是?XY的样本估计量。
●相关系数反映的是变量之间的(线性)双向因果关系的相关程度,而不反映它们之间的单向因果关系的相关程度。但对两个变量之间是否具有线性关系可作初步的判断。
(3)运用EViews计算相关系数 ● 用图形直观地进行判断。 ● 用计算简单相关系数进行判断。 下列表格为PDI与PCE之间地简单相关系数,
PDI PCE
PDI 1 0.997020834
PCE 0.997020834
1
(4)简单相关系数的性质
●r?0,则变量X与Y没有线性相关关系。 ●简单相关系数的取值范围为?1?r?1。 ●当0?r?1时,变量X与Y呈正相关关系。 ●当?1?r?0时,变量X与Y呈负相关关系。
●当r?1时,变量X与Y呈完全线性关系;若r?1,则变量X与Y呈完全正线性关系;若r??1,则变量X与Y呈完全负线性关系。 4、回归的含义
4
相关推荐: