期刊在线咨询服务,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)

期刊咨询 杂志订阅 购物车(0)

结合词向量和统计特征的专利相似度测量方法

俞琰; 陈磊; 姜金德; 赵乃瑄 南京工业大学信息服务部; 南京210009; 东南大学成贤学院计算机工程系; 南京211816; 南京晓庄学院经济与管理学院; 南京210028

关键词:专利相似度 词向量 统计特征 

摘要:【目的】针对传统专利相似度测量忽略词语语义关系的问题,提出一种新的专利相似度测量方法,以提高专利相似度测量的准确度。【方法】引入基于神经网络的词向量模型,获得专利文本中词的语义信息;计算词统计特征信息,度量不同词在专利文本中的重要程度;最后结合词向量和统计特征,形成专利文本表示,测量专利相似度。【结果】本文所提结合词向量和统计特征的专利相似度测量方法比传统的空间向量方法表示专利文本相似度方法准确率提高了13.92%。【局限】辅助专利文本集的选取策略有待进一步研究。【结论】使用空间向量方法表示专利文本结合词向量和统计特征能够显著提高专利相似度测量的准确度。

数据分析与知识发现杂志要求:

{1}所有作者的作者简介(姓名、工作单位、职称、研究方向);通讯作者请再提供电子邮箱。

{2}稿件文责自负。编辑部有权对来稿进行文字和技术性删改,对实质性内容的修改,则应征求作者同意。

{3}标题序号:可按四级小标题的格式写:一、(一)、1、(1);一级、二级标题另起段,正文另起段;三级、四级小标题另起段,但正文接排;正文内序号用①……②……等。

{4}参考文献:(1)正文格式:作者,发表年(多版次文献请同时提供第 1 版的发表时间),页码,外加圆括号。(2)文末格式:中、外文献分开,各按音序排列。

{5}摘要应反映论文的目的、方法及主要结果、结论,并充分反映论文的创新点,表达简明、语义确切,以100 ~300 字为宜。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

相关论文

数据分析与知识发现

CSSCI南大期刊
1-3个月下单

关注 12人评论|1人关注
相关期刊
服务与支付