当前位置:主页 > 文献综述 >

【文献综述】基于双标签支持向量机的多标签分类算法改进

请输入课题关键词,搜索相关范文

文档下载

网盘链接 https://pan.baidu.com/s/1BYqwWeTxgiUWjFwko_MnVQ

提取码: hpy5


部分内容展示

引言
分类是人类重要的基本活动,在人们的日常生活、社会活动及科研工作中,分类问题无处不在。分类问题不存在纯客观的分类标准,也不仅仅是单纯的数学问题,因为任何分类都带有主观性。随着人们对分类问题的进一步细化,分类问题又可以划分为单标签分类问题和多标签分类问题,单标签分类问题认为一个样本仅仅属于一个标签,而多标签分类问题认为一个样本可以属于多个标签[1]。其中,多标签分类的类别之间是相互关联的,如果一个算法能对多标签分类样本进行较好的分类,同时兼顾样本之间关联性和算法的效率,对生物基因学、web内容挖掘等具有重要意义。针对基于数据分解的多标签分类问题,有以标签为基础分解的标签转化法和以样本为基础分解的样本转化法,标签转化法目前主要有两种分解策略,分别是“一对一”和“一对多”,分解策略可以将多标签分类问题拆解成单标签分类问题,进而使用单标签分类算法对样本进行分类[2]。近年来支持向量机的引入对多标签分类问题有着极大的帮助,本文主要介绍基于“一对多”分解策略和双标签支持向量机的多标签分类算法;更多范文
数学与应用数学综述
一、多标签分类算法
目前研究的多标签分类算法,主要包括五类:基于数据分解的方法、基于算法扩展的方法、混合方法、集成方法以及标签编码方法[3]
(一)数据分解方法
基于数据分解的多标签分类方法主要是利用分解策略,将多标签的数据集分解成多个单标签(两类或多类)的数据集,然后在单标签的数据集上应用已有的单标签分类算法(如支持向量机SVM,k近邻等),训练子分类器,最后将得到的子分类器的结果进行组合从而确定预测的标签集[4]。表1是一个多标签数据集,其中包含了4个样本(x1,x2,x3,x4),4个标签(y1,y2,y3,y4)。

  • 添加微信,提供课题关键词,帮你找

猜你喜欢

热搜课题