期刊在线咨询服务,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)

期刊咨询 杂志订阅 购物车(0)

面向跨语言文本分类与标签推荐的带标签双语主题模型的研究

田明杰; 崔荣一 延边大学计算机科学与技术学科智能信息处理研究室; 吉林延吉133002

关键词:主题模型 标签 跨语言文本分类 标签推荐 潜在主题 

摘要:针对日渐丰富的跨语言的文字信息资源与新闻报道及科技文献中的多标签数据,为了挖掘跨语言间的相关性及数据属性间的关联性,提出了带标签双语主题模型,应用于跨语言文本分类与标签的推荐。首先,假设科技文献中的关键词与摘要部分有着内容上的相关性,对关键词进行提取,并进行标签化,进而把标签对应于主题模型中的主题,实例化“潜在”的主题;其次,利用带标签双语主题模型对摘要部分进行了训练迭代;最后,对新加入的文档进行跨语言文本分类及标签的推荐。实验结果表明,跨语言文本分类任务中micro-F1达到94.81%,推荐的标签也能较好地体现出语义上的相关性。

计算机应用研究杂志要求:

{1}注释与参考文献:注释是对论文中某一特定内容的解释或补充说明,用带圈数字注于当页页脚;参考文献是论文中引用的观点、数据和材料等内容的出处,用带方括号的数字(如[])按顺序编码标明,并与文末编码对应。

{2}引言应简明扼要介绍本文研究的领域,国内外目前研究的近期结果与趋势,存在的问题;本文研究的理论依据,历史背景,研究的设想、思路、要解决的具体问题,创新点(重要)和预期目的及意义。

{3}来稿须为学术论文,内容应在本刊用稿范围内。来稿应结构完整,包括标题、作者信息、摘要、关键词、正文和参考文献等部分。

{4}作者介绍主要包括:作者姓名,工作单位(+职务),技术职称,主要研究方向。

{5}一般三至四级标题为宜,不超过五级。正文字号字体均为五号宋体,行间距为固定值20磅。一级标题应加黑居中。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机应用研究

北大期刊
1-3个月下单

关注 31人评论|5人关注
相关期刊
服务与支付