期刊在线咨询服务,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)
关键词:文本分类 词向量 卷积神经网络 主题模型
摘要:【目的】更加全面地提取文本语义特征,提高文本向量对文本语义的表示能力。【方法】通过卷积神经网络提取词粒度、主题粒度和字粒度文本特征向量,通过“融合门”机制将三种特征向量融合得到最终的文本向量,并进行文本分类实验。【结果】该模型在搜狗语料库文本分类实验上的准确率为92.56%,查准率为92.33%,查全率为92.07%,F1值为92.20%,较基准模型Text-CNN分别提高2.40%,2.05%,1.77%,1.91%。【局限】词序关系范围较小,语料库规模较小。【结论】该模型可以更加全面地提取文本语义特征,得到的文本向量对文本语义表示能力更强。
数据分析与知识发现杂志要求:
{1}所有作者的作者简介(姓名、工作单位、职称、研究方向);通讯作者请再提供电子邮箱。
{2}稿件文责自负。编辑部有权对来稿进行文字和技术性删改,对实质性内容的修改,则应征求作者同意。
{3}标题序号:可按四级小标题的格式写:一、(一)、1、(1);一级、二级标题另起段,正文另起段;三级、四级小标题另起段,但正文接排;正文内序号用①……②……等。
{4}参考文献:(1)正文格式:作者,发表年(多版次文献请同时提供第 1 版的发表时间),页码,外加圆括号。(2)文末格式:中、外文献分开,各按音序排列。
{5}摘要应反映论文的目的、方法及主要结果、结论,并充分反映论文的创新点,表达简明、语义确切,以100 ~300 字为宜。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社