·158·情
[2]
报杂志第33卷
联。Trivison赵文清
[3]
最早利用词共现来计算文档间相似度。通过体独有的情感表达方式和整体共用的特征知识,协作式在线学习算法完成主客观分类(Emotional和
Non-emotional.)。
国内针对中文文本的主客观分类研究起步较晚。[17]
叶强提出根据连续双词词类组合模式(2-POS)自动判断句子主观性程度的方法,并在阈值设定为0.12时,分类查准率和查全率均达到了76%,接近英文同类研究。张博
[18]
等人考虑到微博中新闻话题时域性强、影响
力大的特点综合相对词频和词频增加率两个因素抽取主题词,根据共现率构建词共现图,完成新闻话题识
[4]
别。同时Popescu提出的点互信息(Point-wiseMu-tualInformation,PMI)观点也与此思路一致。Liu[5]通过句法分析抽取主题,然后结合PMI算法和名词剪枝算法对抽取的主题进行筛选。Cai和词频分布方法完成主题发现。
b.基于序列标注(SequentialLabeling)的监督学该算法主要包括隐马尔可夫模型(Hidden习算法,
MarkovModel,HMM)和条件随机场(ConditionalRan-domField,CRF)。林琛[7]通过引入字级特征、特征词及线索词特征,无需引入任何外部领域知识的情况下,利用条件随机场求解指定观察序列下的最大概率的状态序列来完成网络舆情的主题识别。翟东海
[8]
[6]
采用逐点互信息将句法结构、依存关系抽取和SVM
[19]
分类方法三者结合,采用模板匹配的方式完成中文观点句抽取工作,并取得不错效果。杨武
等人针对微
2-博文本特点将特征词和主客观线索做语义特征,
POS模式做语法特征,采用贝叶斯算法完成中文微博的主客观句分类,其中F值达到81.2%的实验效果。
从国内外研究现状来看,通过分类器和特征项选取是完成文本主客观分类的主要方法,那么今后采用更具针对性的特征项更能提高分类效果。更深层、
搜索“diyifanwen.net”或“第一范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,第一范文网,提供最新外语学习面向网络舆情的评论文本情感分析研究_李光敏(2)全文阅读和word下载服务。
相关推荐: