关键词:局部光滑 多分类支持向量机 基于角度的间隔最大分类框架
摘要:支持向量机作为机器学习中一个经典的分类算法,一直广受数据科学家的喜爱。无论是处理线性可分还是非线性可分数据,传统的支持向量机能够很好地解决二分类问题。针对给定的样本,支持向量机通过最大化最小间隔得到最佳的决策分界面,从而实现对新样本的类别预测。然而现实中的数据更为复杂多样,一方面数据的类别往往多于两个,近年不乏有优秀的多分类支持向量机算法出现;另一方面不同领域的数据的特征集中可能存在相对特殊的变量(称之为主变量,targeted variable),需要将其挑选出来并加以特殊处理,以保持主变量对最终分类结果的重要影响。考虑这两个方面,提出基于角度的变系数多分类支持向量机(TLAMSVM)模型以解决含有主变量的多分类问题。它使用具备更好几何解释能力的基于角度的间隔最大分类框架完成多分类,并引入变系数模型,通过选择合适的局部光滑函数处理主变量对模型的影响。把基于角度的变系数多分类支持向量机分别应用到模拟数据集和真实数据集上。数值结果显示,相比没有使用变系数思想或基于角度的多分类框架的多分类支持向量机,TLAMSVM模型具有更高的预测准确度。
中国科学院大学学报杂志要求:
{1}文中表格采用三线表,必要时可加辅助线,表内“空白”代表未测或无此项,“—”代表未发现,“0”代表实测结果为零。
{2}本刊在收到稿件1个月内决定是否采用;如不能采用,将通过电子邮件的形式明确告知。
{3}参考文献要求10篇以上,中英文对照,只列最新、最必要的公开出版物,建议尽量引用本行业知名期刊已刊出的相关文章,并在文中相应处以上标形式按顺序标出。
{4}中文摘要:字数为150-200字。中文关键词:选取3-5个文章核心术语。
{5}作者简介在50字以内,如果作者是国际著名科学奖获得者、两院院士、国家级名师、长江学者以及中小学、幼儿园特级教师,请注明。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社