期刊在线咨询服务,发表咨询:400-888-9411 订阅咨询:400-888-1571股权代码(211862)

期刊咨询 杂志订阅 购物车(0)

EasiFFRA:一种基于邻域粗糙集的属性快速约简算法

王念; 彭政红; 崔莉 中国科学院计算技术研究所; 北京100190; 中国科学院大学; 北京100190

关键词:邻域粗糙集 特征约简 对称机制 过滤机制 散列分桶 

摘要:从高维异构感知信息中提取有效特征是支撑物联网系统预测与识别的基础.物联网场景中通常包括多个多种感知节点,系统通常会从感知数据中提取大量特征,其中不乏部分无关和冗余特征.这些无关及冗余特征会降低系统的运行速度,引入冗余计算,更会影响后续的分类及预测等机器学习操作的性能.因而高效识别并提取低维有效的特征子集是物联网数据分析所面临的一大挑战.邻域粗糙集方法能够在保持数据集可分性的前提下,识别和去除无关及冗余特征子集,从而达到降维效果.但由于现有基于邻域粗糙集的特征约简算法的计算开销大、运行时间长,故而并未得到广泛应用.提出了一种基于邻域关系对称性及决策值过滤策略的特征快速约简算法EasiFFRA.EasiFFRA可通过改进的散列分桶方法加速正域样本计算,可检验并过滤冗余决策值样本,从而降低现有方法中由于重复距离评估所带来的冗余计算.实验结果表明:EasiFFRA在实际采集的水质数据集和多个不同样本量及维度的公开数据集中平均加快75.45%的特征约简时间,其约简结果和已有邻域粗糙集特征约简算法等效,可有效解决物联网数据分析中由冗余及无关特征导致的分类及预测精度下降问题,有重要应用价值.

计算机研究与发展杂志要求:

{1}摘要200字左右,应具有独立性和自明性,阐明撰写该文的目的、方法、结论并体现出原创性,不加引注。

{2}来稿请恪守学术道德,严禁抄袭。

{3}来稿经审查后,编辑部有权对来稿作适当文字修改.来稿不退,请作者自留底稿。

{4}间接引文通常以“参见”或“详见”等引领词引导,反映出与正文行文的呼应,标注时应注出具体参考引证的起止页码或章节。标注项目、顺序与格式同直接引文。

{5}本期刊的文献引证方式均采用页下注(脚注),采用小五号宋体,每页单独编号,注释中卷次、出版时间、刊期、页码一律用阿拉伯数字表示。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

计算机研究与发展

北大期刊
1-3个月下单

关注 25人评论|0人关注
相关期刊
服务与支付