第一范文网 - 专业文章范例文档资料分享平台

logistic回归结合决策树技术在冠心病患者住院费用组合分析中的应用

来源:用户分享 时间:2025/5/19 16:12:07 本文由loading 分享 下载这篇文档手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

logistic回归结合决策树技术在冠心病患者住院费用组合分

析中的应用*

中山大学孙逸仙纪念医院信息科(510120)

【摘 要】【提 要】目的 探讨在logistic回归分析基础上进行决策树分析的风险,分析不同病例组合下冠心病患者的住院费用。方法 采用logistic回归分析动脉粥样硬化性心脏病的影响因素,将有统计学意义的变量纳入决策树分析,用CHAID法进行预剪枝处理,最后进行病例组合分析探讨每种组合的费用。结果 logistic回归结合决策树分析方法的风险分值为0.245,小于单纯决策树分析的风险分值(0.329)。根据住院天数、手术、性别建立病例组合,每种组合的费用差异明显。结论 logistic回归结合决策树分析能降低预测风险分值,提高不同病例组合的费用差异度。 【期刊名称】中国卫生统计 【年(卷),期】2015(032)006 【总页数】3

【关键词】【关键词】logistic回归 决策树 数据挖掘 冠心病

动脉粥样硬化性心脏病(简称冠心病,亦称缺血性心脏病)是指供应心脏本身的冠状动脉管壁形成粥样斑块,造成血管腔狭窄引起的心脏病变。冠心病是全球死亡率最高的疾病之一,根据世界卫生组织2011年的报告,中国的冠心病死亡人数已列世界第二位,且发病呈年轻化趋势[1]。由此给患者带来了巨大的疾病负担和经济负担。了解该疾病住院费用的影响因素以及不同病例组合时的费用特征,能为卫生行政部门和医院领导提供病种费用情况的直观认识,也为日后医疗预付费制度的实施打下基础。

对象与方法

1.资料来源

数据来源于广东省某三甲医院2009年至2013年诊断为动脉粥样硬化性心脏病的8224例出院患者资料。ICD码四位为I 25.1。将所有可能影响住院费用的因素均导出,本次共导出的因素有住院次数、性别、年龄、住院天数(天数)、婚姻状况、付款方式、是否手术、病人来源、是否转科、是否抢救等十个。 2.研究目的与统计方法

本文旨在分析动脉粥样硬化性心脏病住院费用的影响因素及组合情况。采用SPSS20.0统计软件进行分析。先用logistic回归分析(向前LR)筛选影响因素,再在此基础上进行决策树分析。

结 果

1.住院费用的影响因素分析

将住院费用按照中位数分为两组,低费用组和高费用组。采用向前LR方法分析影响动脉硬化性心脏病住院费用的因素。有统计学意义的变量列于表1中。 2.决策树和病例组合分析

根据logistic回归分析结果,将有意义的变量均纳入进行决策树分析。决策树分析采用CHAID预剪枝的方法进行树的剪枝处理,选取最小个案数:父节点800,子节点600。使用10倍交叉验证进行决策树计算效果的验证。

通过决策树分析,最终决策树纳入天数、手术和性别三个变量。具体的决策树见图1。 3.病例组合情况

根据决策树确定最终的病例组合方式,本文确定了9种病例组合。将每种病例

组合的费用数据列表2中。以P75+1.5Q作为费用上线控制标准[2]。本文按该标准共筛选出超额费用患者373例,占4.5%。

讨 论

DRGs(diagnosis related groups)是以病人特征、住院特征和住院期间接受的治疗措施为基础的一种病例分类方案[3]。DRGs已经在很多国家不断探索成熟,我国仍处于探索阶段。本文利用某医院动脉硬化性心脏病患者的病案首页信息进行病例组合分析,先用logistic回归分析进行影响因素筛选,后将有统计学意义的变量纳入决策树分析,进而提出病例组合方案。

logistic回归分析用于因变量为分类变量的影响因素分析,通过P值判断自变量是否有统计学意义,通过OR值判断自变量对因变量的影响大小及作用方向。其主要分析在控制其他变量对因变量影响的前提下,某个自变量对因变量的影响大小。logistic回归分析主要研究变量的主效应,但很难体现变量之间的交互效应,也无法从分类的角度给出直观具体的解释[4]。而决策树(decision tree)是解决实际应用中分类问题的数据挖掘方法,通过训练样本集,建立目标变量关于各输入变量的分类预测模型,全面实现输入变量和目标变量不同取值下的数据分组,进而用于对新数据对象的分类和预测[5]。但是决策树分析时,对数的剪枝处理非常关键,剪枝的效果也影响了对未知数据分类的准确性。当纳入的因素众多时,决策树的剪枝处理会更加困难。

本研究在logistic回归分析基础上,纳入有统计学意义的变量进行决策树分析。研究结果显示决策树的预测风险分值为0.245,小于将所有因素纳入决策树分析的预测风险(0.329)。可见,用logistic回归分析先选定有统计学意义的变量后进行决策树分析,能充分利用两种方法的优点,分类处理的效率更高,预测

logistic回归结合决策树技术在冠心病患者住院费用组合分析中的应用.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/c95n9y0q8f39uewu2s0h44x67j2pwcn01e8u_1.html(转载请注明文章来源)
热门推荐
Copyright © 2012-2023 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top