期刊在线咨询服务,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)
关键词:中文分词 膨胀卷积 深度学习 自然语言处理
摘要:目前,许多深度神经网络模型以双向长短时记忆网络结构处理中文分词任务,存在输入特征不够丰富、语义理解不全、计算速度慢的问题。针对以上问题,该文提出一种基于膨胀卷积神经网络模型的中文分词方法。通过加入汉字字根信息并用卷积神经网络提取特征来丰富输入特征;使用膨胀卷积神经网络模型并加入残差结构进行训练,能够更好理解语义信息并提高计算速度。基于Bakeoff 2005语料库的4个数据集设计实验,与双向长短时记忆网络模型的中文分词方法做对比,实验表明该文提出的模型取得了更好的分词效果,并具有更快的计算速度。
中文信息学报杂志要求:
{1}本刊对刊发的文章拥有版权,不得擅自转载、改编。凡转载、改编务经我刊同意,违者必究。
{2}作者简介包括:姓名、性别、出生年月、毕业学校及所学专业、工作单位、职务职称、现从事的研究工作情况。
{3}来稿若属国家自然科学基金项目或省部基金项目,请在文稿中标明其基金来源和编号,我刊可以优先审核发表。
{4}正文内连续叙述中的序号采用①……;②……;③……。分级超过3级后用网括号如:“①”,“②”表示,并采用连排。
{5}附注请一律使用当页脚注的形式,以带圈①……⑩的方式编号,使用每页重新编号的方式。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社