期刊在线咨询服务,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)
关键词:webcollector elasticsearch 敏感词检测 爬虫 搜索引擎
摘要:在高校信息化建设过程中,建设了大量的网站,这些网站的信息和展示的内容很可能含有国家法律禁止或者学校规定禁止的敏感词汇,针对从海量的网站信息中定位到敏感词汇的目的,本文采用了文献研究法、个案研究法及实证研究法,通过研究相关材料文献和技术文档,研究相关系统设计案例,结合实际情况设计和实现一个能运行的系统,得出基于Webcollector爬虫框架和ElasticSearch搜索引擎设计和实现网站群敏感词检测系统的可行性。
电子设计工程杂志要求:
{1}摘要直接概括论文的学术观点和结论,一般不超过300字。
{2}来稿应具有原创性,内容符合本单位保密规定。论文的主要研究工作应由作者独立完成,引用他人成果时,须按《著作权法》中的有关规定标明其出处,由此引发的一切著作权责任由作者自负。
{3}本刊对来稿保留修改权,不同意者请预先声明。
{4}参考文献按引文先后在文中标出序号,并与文后参考文献序号一致,参考文献著录项目要齐全。
{5}静态图:图或照片应另附于文后,分别按其在正文中出现的先后次序连续编码。图题和图说明应简洁明确,具有自明性。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社