第一范文网 - 专业文章范例文档资料分享平台

基于KNN算法的医药信息文本分类系统的研究(3)

来源:用户分享 时间:2021-06-01 本文由百年孤独 分享 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:xxxxxx或QQ:xxxxxx 处理(尽可能给您提供完整文档),感谢您的支持与谅解。

②权限设置:系统的权限为二级管理权限,本系

密切,以训练语料要反映一定的广度。在本系统进所行设计的时候,度认为每一类的训练库集大,取的一提

统管理员级别最高,可以进行任何操作,系统操作员只

能对自己的信息进行维护并拥有对分类器进行操作的权限。

特征词越多越好,但经过测试后发现这种认识是有错误的。抽取的特征词太多,会不利于文本的自动分也

③修改密码:管理员与操作员都可以对自己的密码进行修改。

类。因为有些特征词对于相对权重小的文本的分类会有干扰的作用。所以语料库的大小,要经过大量的需测试才可以确定。

3实验结果与分析3 1实验结果 .

4结束语构建了一个实验用医药语料库,结合医药信息并的特点利用 K NN算法实现了医药信息文本分类系统。实验结果显示,构建的数据集上该系统可以获在得 7 .3 4 8%的 F值。因此, 1该系统较好地实现了医药信息的自动分类,有效提高了医药信息分类的处理效

使用文中构建的训练集对设计的系统进行训练, 使用构建的测试集对医药信息分类系统进行测试,测试结果如表 2所示,果图如图 3结所示,图中 L为理气药,为清热药,为抗肿瘤药,为化痰止咳平喘药, Q K H

Y为影响血液及造血系统的药物, F为宏平均值。表 2医药信息分类系统的分类结果 类别理气药清热药抗肿化痰止咳影响血液及造宏平瘤药平喘药血系统的药物均值

准确率 7 . t 3 9% 7% 7 .7% 6 1% 4 64 3.6召回率 7 3 7 .3% 4 2 0 8% 3 3 7 9% 6% 0 7 .3% 08 6% 8 6 .9% 93 7 7 l6% 6 9 9 2% 7 6 04‘

率。但是,这还仅仅在于对医药信息自动分类的初步成功尝试,在接下来的工作中,将重点在构建更为丰富

的医药数据集以及相应的分类算法方面进行深人的研究。

F1值 7 2% 3 6 43 7 6% 4 8 7 .7% 6 .4 1 5%

参考文献:[]唐 1菁,记全,炳儒 .于沈杨基we b的文本挖掘系统的研究与实现[]计算机科学, 0 3 3 J, 20,0()6 1:0—6 3

[]张启蕊, 2张

凌,守斌, .基董等

于免疫算法的文本分类研究[] J .微计算机信息,20, 3 0 7 2()20 2 2 8:1— 1 . [] Sb s a i .Mah el ri 3 e a i tn F ci an g i n e n na tmae e tctg r ain J . uo td tx aeoi t[] z oACM C ompuig t Suv y。2 02, n re s 0

图 3医药信息分类系统的分类结果图 3.结果分析 2[]王 4煜,自

3 ( )1—4 . 41: 7

石,正欧 .于 We文本分类的快速 K N王用 b N

实验过程与结果显示,该系统的分类处理速度比

算法[]情报学报,0 72 ()6—6 . J. 20,6 1:0 4

较慢,反应了算法上还有待改进与优化,词典集的词量不够丰富,需要不断增加,分词的方法还存在着两个缺

[]印 5[]杨 6

鉴,焕云.于 )谭基 (计量的 K 2统 NN文本分类算法超.分词技术研究报告[/ L .08一O .学资源 R O]20 3教

[]小型微型计算机系统, 0,8 6:0 4 07 J. 2 72 ( )19—19 . 0

点:一是限制了词的长度,二是每次分词都有若干次无效循环 (要一直循环到最大长度为止)。并且该系统对于类别差异性较大的类别具有较高的分类性能,而对

网,算机网络专栏,t:/ w t k .o L n e/计 ht/w w.i o cm/ uw n p g n80 6 83. t . h m1

[]

国家食品药品监督管理局 .处方药与非处方药分类管理 7办法[/ L . 9 9—0 S 0] 19 6— 1 . t:/ w sa gv c/ 1 ht/w w.d. o .n pW )/ 2 8/ 4 24. m1】 (I 8 2 5 ht .

于类别差异不大的类别的识别能力还有待提高。这说明文本的特征表示是影响分类系统性能的主要原因。在实验中,发现特征词的选择与语料库情况关系

中国计算机学会会干、国科技核心期刊 U中

《算机技术与发展》计欢迎订阅,邮发代号:2 17 5 2

搜索“diyifanwen.net”或“第一范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,第一范文网,提供最新教学研究基于KNN算法的医药信息文本分类系统的研究(3)全文阅读和word下载服务。

基于KNN算法的医药信息文本分类系统的研究(3).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
本文链接:https://www.diyifanwen.net/wenku/1190684.html(转载请注明文章来源)
热门推荐
Copyright © 2018-2022 第一范文网 版权所有 免责声明 | 联系我们
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ:xxxxxx 邮箱:xxxxxx@qq.com
渝ICP备2023013149号
Top