第一范文网 - 专业文章范例文档资料分享平台

广义线性回归在研究学生成绩相关性的应用

来源:用户分享 时间:2025/6/5 5:43:13 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

引言

回归分析是一种应用极为广泛的数量分析方法,它用于分析事物之间的统计关系,侧重考察变量之间的数量变化规律,并通过回归方程的形式描述和反映这种关系,帮助人们准确的把握变量受其他一个或多个变量影响的程度,进而为事物的控制和预测提供科学依据。

作为标准的统计分析工具,多元线性回归分析在诸多行业和领域的数据分析应用中发挥着极为重要的作用。利用多元回归方法分析变量之间的关系或进行预测时的一个基本要求是:被解释变量应是连续数值型变量。然而,实际应用中这种要求未必都能得到较好的满足。例如,在对小轿车消费群体特点的分析和预测中,可以根据历史数据,建立关于小轿车的多元回归模型。可能将诸如职业,年收入,年龄等因素纳入模型,并希望通过模型预测具有某特定特征的客户是否会购买小轿车。这个多元回归模型的被解释变量设为是否购买(l表示购买,0表示不购买),是个纯粹的二值型品质变量,显然不满足变量为数值型数据的要求。在数据分析中,尤其在社会科学、医学的研究中,像这样的情况是很普遍的。当出现这种情况的时候,建立的一般多元回归模型就会出现以下问题:残差不再服从零均值的正态分布;被解释变量的取值区间受限制等。

基于这种情况,提出了广义线性模型。形式上,广义线性模型是常见的正态线性模型的直接推广。它可适用于连续数据和离散数据,特别是后者,如属性数据,计数数据。这在实际中,尤其是生物、医学、经济和社会数据的统计分析上,具有重要的意义。

广义线性模型要求响应变量通过线性形式依赖于自变量,这一特点保持了线性自变量的思想,而且广义线性模型允许许多用于线性模型的方法能用于更一般的实际问题。广义线性模型的响应变量Y都属于指数分布族,而指数分布族不仅包含了许多常见的重要分布,如正态分布,二项分布,Poisson分布等,而且它有良好

的分析性质,在数据处理上有很多方便。总之,广义线性模型为今后回归模型提供了一个重要的统一的研究方法。

广义线性模型的个别特例起源很早。Fisher在1919年曾用过它。最重要的Logistic[21]模型,在20世纪四五十年代曾由Berkson,Dyke Patterson等人使用过。1972年Nelder和Weddethum在一篇论文中引进广义线性模型一词,提供了一个新的估计理论和计算框架,对传统线性回归模型作了进一步推广,建立了统一理论和计算框架,对回归模型在统计学中的应用产生了重要影响。这种新的统计模称作广义线性模型(generalized linear models,简称GLM)。近年来,广义线性模在理论上和应用上得到了快速的发展,在模型的拓展、参数估计方法以及模型的验和诊断等方面不断趋于成熟。张尧庭[11](1995)在与传统线性模型对比的基础上,对广义线性模型本质特征进行了描述。陈希孺[17,19]院士于2002—2004年在《数理统计与管理》杂志上,分十次讲解对多元广义线性模型进行了系统的介绍。另外,我国学者在广义线性模型参数估计的相合性、收敛速度、模型的诊断等方面得到了不少优秀成果。用于GLM的计算软件也相继问世,目前,除了由NAG(Numerical Algorithms Group)研发的专用程序GLIM(Generalized Linear Interaetive Modeling)外,SAS和SPASS[2,3]统计软件中的Genmod模块也被广泛使用,在统计软件R和X-plore中,也有相应的计算模块。得益于应用软件的推广,广义线性模型在医学、农业、交通运输、产品试验以及经济、金融等方面得到了广泛的应用。近年来,广义线性混合模型、半参数广义线性模型[22]、广义非线性模型等扩展模型在理论研究和实际应用上得到了快速的发展。

广义线性模型理论的建立,极大地推动了以统计方法为基石的精算学的发展。传统的线性回归模型,都是建立在对称分布的基础上,以常值方差为假设。但在精算实践中,所采集的数据往往显示出非常值方差的趋势;用于描述索赔额等变量分布通常具有厚重的右尾;反应变量不再局限于对解释变量的线性依赖。在许多情况下,传统线性回归模型不适宜作为精算统计模型。广义线性模型的出现,为精算学的发展提供了有力的工具。广义线性模型在精算中的应用起始于上世纪八十年

代,九十年代经历了快速的发展,并被广泛地应用于精算学的各个领域,如生命表的修匀、损失分布、信度理论、风险分类、准备金和费率的估计等方面。

大学学习不同于高中或者初中,以往的教学方式长期有老师的监督和教导,而大学学习更注重培养学生的自主学习的能力,而在这种缺乏约束的学习氛围下,学生的学习成绩可能会出现不同程度的畸形。大学生步入大学之后,由于学习目标不明确而导致学习动力不足,放松要求,出现了考试不及格、降级、退学等学籍异动情况,对学校和个人都造成了损失。那么出现这种事故有无规律?有无征兆?本文仅从学生各门课程考试成绩的变化角度对该问题进行分析与研究,以安徽工程大学统计学专业07级81个学生前三学年的学习成绩为样本通过广义线性回归分析来研究学生学年间成绩的相关性。在这三学年中,有些学生出现了退学降级等学籍异动,对他们的相应数据做了如下处理:对于退学学生后期成绩不存在的用“0”补;对于降级学生后期成绩用下一学年甚至以后几学年的相应学习成绩补缺。出于公正的角度,均用他们的第一次考试成绩为观察值进行数据处理和分析。

第1章 绪论

1.1广义线性回归基本思想

先看下面几个例子。

例1 抛物线的拟合

某零件上有一条曲线,可以近似看作是一条抛物线,为了在数控机床上加工这一零件,在曲线上测得

个点的坐标

,要求从这

广义线性回归在研究学生成绩相关性的应用.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c14ljw7bssk7916095eiv3gyk618jli0080x_1.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top