第一范文网 - 专业文章范例文档资料分享平台

应用回归分析课程设计

来源:用户分享 时间:2025/7/5 16:57:48 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

基于多元线性回归模型对我国钢铁生产的分析

摘要:钢铁工业是国民经济中最重要的基础原材料产业和重要支撑产业。本文根据我国

钢材产量为研究对象,选取可能影响钢材产量的粗钢产量、发电量、房屋建筑面积、总能源消耗、铁路运输量、对建筑工程的投资和汽车生产量七个因素,运用多元线性回归分析建立模型,先运用普通最小二乘估计求回归系数再对方程进行异方差、自相关、和多重共线性诊断,用迭代法消除了自变量之间的自相关。对于多重共线性问题,先是用逐步回归和剔除变量的方法,最终转变为用岭回归剔除粗钢产量和发电量两个变量解决

???2.731553041?0.000002198x3?0.000007388x4 多重共线性,建立最终的岭回归方程:y?0.000010632x5?0.000009249x6?0.000837960x7以其探究最后进入回归方程的几个变

量在影响钢材生产方面孰轻孰重,达到学习与生活结合的效果。

关键词:多元线性回归 异方差 自相关 多重共线性 逐步回归 岭回归

一、引言

中国的钢铁工业历经50年的发展,特别是改革开放30年以来有了巨大的进步,取得了举世瞩目的成就。钢铁工业的钢产量增加速度加快、技术水平得到明显提高,产品结构不断调整,成为名副其实的钢铁大国。1996年我国钢产量首次超过1亿吨大关,跃居世界第一位,此后我国产量一直保持世界排名第一的位置。2002年实现钢产量1.8亿吨,到2003年钢产量突破2亿吨,达到22234万吨,2004年全国共产钢27279万吨,比上年增长22.7%,生铁、钢材的产量分别达到创记录的25185万吨与29723万吨(含重复材),同比增长均在20%以上。在钢材品种和质量方面,已经逐步形成能冶铁包括高温合金、精密合金再内的1000多个钢材品种,轧制和加工包括板、带、管、型、线等各种形状的4万多个品种规格的钢材;各项技术经济指标明显提高。

钢铁行业是国民经济的支柱产业,是加快实现工业化的先导产业,其在拉动上下游产业发展、扩大城乡劳动力就业以及推动区域经济发展等方面做出了重要的贡献。虽然整个现代化建设以传统原材料为主的状况已经发生改变,但钢铁行业对我国来说仍然是基础工业,直接影响着国民经济的健康发展。可以说钢铁行业的稳定发展是实现我国新型工业化战略目标的关键一环,其发展水平的高低是衡量我国工业化水平和综合国力高低的重要标志。随着国际产业的转移和我国国民经济的快速发展,我国钢铁工业取得了巨大成就。本文研究了粗钢产量、发电量、房屋建筑面积、总能源消耗量、铁路运输量、对建筑工程的投资以及汽车生产总量7个变量对钢材生产量的影响,以及它们之间的关系;以此可以看出这7个指标中哪些指标对钢材生产量有着驻足轻重的关系,哪些指标对钢铁产量的影响相对较弱。由此,可以看出怎么样才能使钢材产量更上一层楼,让钢铁事业有着更加长足且辉煌的发展。

二、模型假设

1、假设选取的自变量指标能基本上全面反映钢铁生产; 2、假设选取的年份期间没有大的金融市场波动; 3、假设随机误差?~N(0,?2)。

三、符号说明

1、y表示钢材产量; 2、x1表示粗钢产量; 3、x2表示发电量; 4、x3表示房屋建筑面积; 5、x4表示总能源消耗; 6、x5表示铁路运输量 ; 7、x6表示对建筑工程投资 ;

8、x7表示汽车生产总量; 9、?表示模型的随机误差项。

四、模型分析与建立

4.1多元线性回归模型

1.多元线性回归模型的一般形式

设随机变量y与一般变量x1,x2,?,xp 的线性回归模型为

y??0??1x1??2x2????pxp?? (4.1)

其中,?0,?1,?,?p是p?1个未知参数,?0称为回归常数,?1,?,?p称为回归系数。y称为被解释变量(因变量),x1,x2,?,xp是p个可以精确测量并控制的一般变量,称为解释变量(自变量)。 ?是随机误差,与一元线性回归一样,对随机误差项我们常假定

??E(?)?0?var(?)??2 (4.2)

E(y)??0??1x1??2x2????pxp?? (4.3) 为理论回归方程。

对一个实际问题,如果我们获得n组观测数据(x1i,xi2?,xip;yi),(i?1,2,?,n),则线性回归模型(4.1)式可表示为

?y1??0??1x11??2x12????px1p??1??y2??0??1x21??2x22????px2p??2 (4.4) ????yn??0??1xn1??2xn2????pxnp??n?写成矩阵形式为

y?X??? (4.5)

其中

??? y?????y1??1??1y2??X?

??????yn????1x11x21?xn1x12x22?xn2??????0???0?x1p??????1????x2p?1?? ???2 ??? (4.6) ???2??????????????xnp??????n????p?? X是一个n?(p?1)阶矩阵,称为回归设计矩阵或资料矩阵。

2.多元线性回归模型的基本假定

为了方便地进行模型的参数估计,对回归方程(4.4)式有如下一些基本假定: (1)解释变量x1,x2,?,xp是确定性变量,不是随机变量,且要求

rank(X)?p?1?n。这里的rank(X)?p?1?n,表明设计矩阵X中的自变量列之间不

相关,样本量的个数应大于解释变量的个数,X是一满秩矩阵。

(2)随机误差项具有零均值和等方差,即

?E(?i)?0,i?1,2,?,n? (4.7) ??2,i?j?,i,j?1,2,?,n?cov(?i,?j)???0,i?j? 这个假定常称为高斯—马尔柯夫条件。E(?i)?0,假设观测值没有系统错误,随机误差项?i的平均值为0。随机误差项?i的协方差为0,表明随机误差项在不同的样本点之间是不相关的(在正态假定下即为独立的),不存在序列相关,并且有相同的精度。

(3)正态分布的假定条件为

??i~N(0,?2),i?1,2,?,n???1,?2,?,?n相互独立 (4.8)

对于多元线性回归的矩阵模型(4.5)式, 这个条件便可表示为

?~N(0,?In) (4.9)

2由上述假定和多元正态分布的性质可知,随机变量y服从n维正态分布,回归模型(4.5)式的期望向量

E(y)?X?2 (4.10)

var(y)??In (4.11)

因此

y~N(X?,?In) (4.12)

24.2回归参数的普通最小二乘估计

线性回归方程确定后的任务是利用已经收集到的样本数据,根据一定的统计拟合准则,对方程中的各个参数进行估计。普通最小二乘就是一种最为常见的统计拟合准则,在该准则下得到的回归参数的估计称为回归参数的普通最小二乘估计。

对于(4.5)式表示的回归模型y?X???,所谓最小二乘法,就是寻找参数

?0,?1,?2,?,?p

的估计值

?,??,??,?,???012p,使离差平方和

搜索更多关于: 应用回归分析课程设计 的文档
应用回归分析课程设计.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c9cmys7oiew25ui718i50_1.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top