洪宇 等:话题跟踪中静态和动态话题模型的核捕捉衰减 1115
显示,其他3种动态话题模型与IL-DTM在绝大部分话题上取得了高于阈值δ(δ=0.6)的A3指标.尤其是, BIL-DTM与IL-DTM有26项话题的A3指标高于0.9,占参评话题总数的81%,表现出高度的CKA趋势一致性,如图8所示.其原因是,BIL-DTM仅仅对IL-DTM的自学习机制进行了适量改进,即利用突发事件中具有促发概率的特征,补充IL-DTM实时修正的话题核心描述.相比之下,HT-DTM和TEC-DTM分别只有9项和6项话题获得高于0.9的A3指标,原因在于话题模型结构本身即具有差异.但总体而言,上述话题模型与IL-DTM都具有近似的CKA趋势(A3>δ),换言之,动态话题模型普遍善于捕获话题的漂移趋势.
Table 4 Results of the A3 comparison between dynamic topic models and Basic-STM
表4 动态话题模型之间的A3比对结果
A值域
BIL-DTM 0 0 1(±) 3(±) 2(±) 26(±)
HT-DTM 0 2(+) 2(+) 8(+) 11(+) 9(±)
TEC-DTM 0 3(+) 1(+) 6(+) 16(+) 6(±) 模型 总之,CKA趋势图和A3指标的对比结果说明:话题模型的优劣更多地取决于话题结构的设计合理性,而不是特征选择.详细而言,表2中不同静态话题模型(结构不可变)的区别仅在于选择的特征形式(动词、名词与形容词等等)和权重度量方法,而获得的CKA趋势基本一致(A3指标较高),即捕捉大部分话题核的能力都存在近似的衰减趋势,特征选择及其权重度量方法的异同并未使这一趋势发生明显变化.相反,当融入动态学习机制后(结构可变),如IL-DTM和BIL-DTM,CKA趋势则出现了显著差异,两者与话题模型Basic-STM的A3指标普遍很低.此外,根据图8的CKA观测数据,IL-DTM和BIL-DTM具有更强的核捕捉能力.因此,话题结构的设计对话题模型的优劣具有决定性的作用.下文给出的跟踪系统性能将进一步验证,改善话题的结构设计,如层次树型和时序链式动态话题模型,能够进一步改进跟踪性能.
搜索“diyifanwen.net”或“第一范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,第一范文网,提供最新人文社科话题跟踪中静态和动态话题模型的核捕捉衰减(23)全文阅读和word下载服务。
相关推荐: