6.2 话题跟踪性能及分析
(1) 静态跟踪系统性能及分析
基于测试语料,即TDT 2003,实验对嵌入上述各种话题模型的跟踪系统进行测试.测试中,所有跟踪系统的阈值皆基于训练语料(TDT 2002)所得.阈值训练过程是:首先采用CKA的5阶多项式平滑函数的最大取值作为采样上界,将CKA曲线上的最小值作为采样下界;然后,计算各跟踪系统的匹配算法在上述两界点可获得的相关度;最后,驱动阈值以特定粒度在两界点的相关度之间渐进取值,并检测对应最小检测错误权衡系数的阈值取值,这一取值即为训练最优解.与泛0~1之间的所有阈值取值相比,这一训练方法有效缩减了阈值的采样范畴.就阈值的渐变粒度而言,使用话题模型LG-STM,RM-STM和SM-STM的跟踪系统采用0.001为粒度,原因是上述话题模型的匹配需要利用KL(kullback-leibler)距离进行计算,相关度粒度较小.除此之外,其他跟踪系统皆采用0.01为粒度.所有系统训练出的最优阈值θ见表5和表6.
Table 5 Results of the A3 comparison among dynamic topic models
表5 基于静态话题模型的跟踪系统测试结果 模型
(CDet)norm Basic-STM N-STM NE-STM SR-STM0.092 8 0.086 1 0.151 6 0.152 8
θ=0.30 θ=0.33 θ=0.16 θ=0.11 Okapi-STM0.091 2 θ=0.30 Rocchio-STM0.090 3 θ=0.29 LG-STM RM-STM SM-STM0.089 80.100 3 0.089 1 θ=0.004 θ=0.003 θ=0.003
Table 6 Test results of tracking systems based on dynamic topic model
表6 基于动态话题模型的跟踪系统测试结果
模型
(CDet)norm IL-DTM BIL-DTM HT-DTM TEC-DTM 0.062 6 0.058 2 0.039 1 0.029 6
θ=0.34 θ=0.35 θ=0.36 θ=0.36
测试结果中,基于静态话题模型的跟踪系统性能见表5.其中,基于话题模型NE-STM,SR-STM和RM-STM
搜索“diyifanwen.net”或“第一范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,第一范文网,提供最新人文社科话题跟踪中静态和动态话题模型的核捕捉衰减(24)全文阅读和word下载服务。
相关推荐: