期刊在线咨询服务,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)

期刊咨询 杂志订阅 购物车(0)

半监督自训练的方面提取

曲昭伟; 吴春叶; 王晓茹 北京邮电大学网络技术研究院; 北京100876; 北京邮电大学计算机学院; 北京100876

关键词:方面提取 词向量 半监督 自训练 未标签数据 

摘要:方面提取是观点挖掘和情感分析任务中的关键一步,随着社交网络的发展,用户越来越倾向于根据评论信息来帮助进行决策,并且用户也更加关注评论的细粒度的信息,因此,从海量的网络评论数据中快速挖掘方面信息对于用户快速决策具有重要意义。大部分基于主题模型和聚类的方法在方面提取的一致性上效果并不好,传统的监督学习的方法效果虽然表现很好,但是需要大量的标注文本作为训练数据,标注文本需要消耗大量的人力成本。基于以上问题,本文提出一种基于半监督自训练的方面提取方法,充分利用现存的大量未标签的数据价值,在未标签数据集上通过词向量模型寻找方面种子词的相似词,对每个方面建立与数据集最相关的方面表示词集合,本文方法避免了大量的文本标注,充分利用未标签数据的价值,并且本文方法在中文和英文数据集上都表现出了理想的效果。

智能系统学报杂志要求:

{1}作者简介请标明工作单位、职务、职称、联系电话、电子信箱、所在城市和邮编。

{2}文章须言之有物,理论联系实际,研究目的明确,研究方法得当,有自己的学术见解,对理论或实践具有参考、借鉴或指导作用。

{3}文题应简明确切地反映文章的特定内容,以不超过20字为宜。

{4}参考文献:应为正式出版物上发表的、作者亲自阅读、与文稿主要内容密切相关的近年文献,要求精选。

{5}文前附400字以内的中文、英文内容提要,关键词2-5个。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

智能系统学报

北大期刊
1-3个月下单

关注 30人评论|1人关注
相关期刊
服务与支付