7.5 逻辑回归分析
统计学上的定义和计算公式
定义:逻辑回归分析是对定性变量的回归分析。
现实中的很多现象可以划分为两种可能,或者归结为两种状态,这两种状态分别用0和1 表示。买汽车回受到家庭、收入等因素的影响,但最终的结果只能是两个:买或不买。如果我们采用多个因素对0-1 表示的某种现象进行因果关系解释,就可能应用到logistic 回归。例如,想探讨胃癌发生的危险因素,可以选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群肯定有不同的体征和生活方式等。这里的因变量就是是否胃癌,即“是”或“否”,为两分类变量,自变量就可以包括很多了,例如年龄、性别、饮食习惯等。自变量既可以是连续的,也可以是分类的。通过logistic回归分析,就可以大致了解到底哪些因素是胃癌的危险因素。
可用于处理定性因变量的统计分析方法有:判别分析(Discriminant analysis)、Probit分析、Logistic回归分析和对数线性模型等。在社会科学中,应用最多的是Logistic回归分析。Logistic回归分析根据因变量取值类别不同,又可以分为Binary Logistic回归分析和Multi-nominal Logistic回归分析。
Binary Logistic回归模型中因变量只能取两个值1和0(虚拟因变量),而Multinomial Logistic回归模型中因变量可以取多个值。本节将只讨论Binary Logistic回归,并简称Logistic回归(与7.5节曲线估计中介绍的Logistic曲线模型相区别)。Logistic函数的形式为
实例操作
在一次关于某城镇居民上下班使用交通工具的社会调查中,因变量y =1表示居民主要乘坐公共汽车上下班;y=0表示主要骑自行车上下班;自变量x1表示被调查者的年龄;x2表示被调查者的月收入;x3表示被调查者的性别(x3=1为男性,x3=0为女性)。
试建立y与自变量间的Logistic回归,数据如表所示。数据“上下班交通调查表.sav” 表:使用交通工具上下班情况
搜索“diyifanwen.net”或“第一范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,第一范文网,提供最新资格考试认证第7章 5逻辑回归分析讲义全文阅读和word下载服务。
相关推荐: