|
|
FCS | 前沿研究:面向多标记分类的组合度量学习 |
|
论文标题:(面向多标记分类的组合度量学习)
期刊:
作者:Yan-Ping SUN, Min-Ling ZHANG
发表时间:31 Dec 2020
DOI:
微信公众号链接:
FCS“优秀青年计算机app家论坛”于2019年启动,以尊重app贡献、传播更多优秀成果为宗旨。论坛作者审视自己的研究领域,介绍研究方向和研究进展。本论坛所有文章均为特邀稿件。
本期“优秀青年计算机app家论坛”推出张敏灵教授团队的成果——面向多标记分类的组合度量学习。
作者简介:张敏灵
东南大学教授,博士生导师。主要从事机器学习、数据挖掘领域研究工作。现任亚洲机器学习会议(ACML)、亚太知识发现与数据挖掘会议(PAKDD)指导委员会委员,CAAI机器学习专委会副主任、CCF人工智能与模式识别专委会常务委员等。担任《ACM Trans. IST》、《Frontiers of Computer Science》等国际期刊编委、《明升中国app:信息app》青年编委等。曾获CFF - IEEE CS青年app家奖等。
导读
多标记分类问题旨在为每个示例指定一组合适的标签,其中距离度量学习有助于提高基于示例的多标记分类模型的泛化能力。现有的多标记度量学习方法利用成对约束,以满足“具有相似标记集的示例在嵌入特征空间中具有更近的距离”。基于示例空间和标记空间之间的结构化交互关系,本文提出了一种新的多标记分类距离度量学习方法——多标记组合距离度量学习方法。一方面,组合距离度量表示为基于分量基的秩-1PSD矩阵加权形式;另一方面,利用从示例空间和标记空间导出的三元组相似性约束优化组合权重。由于所采用的距离度量的组合性,可将其形式化为关于训练示例数量呈线性复杂度的二次规划问题。本文对组合度量进行鲁棒性分析,推导了该方法的泛化界,并在16个基准数据集上进行实验,充分验证了该组合度量在多标记分类距离度量中的有效性。
文章精要
摘要
Multi-label classification aims to assign a set of proper labels for each instance, where distance metric learning can help improve the generalization ability of instance-based multi-label classification models. Existing multi-label metric learning techniques work by utilizing pairwise constraints to enforce that examples with similar label assignments should have close distance in the embedded feature space. In this paper, a novel distance metric learning approach for multi-label classification is proposed by modeling structural interactions between instance space and label space. On one hand, compositional distance metric is employed which adopts the representation of a weighted sum of rank-1 PSD matrices based on component bases. On the other hand, compositional weights are optimized by exploiting triplet similarity constraints derived from both instance and label spaces. Due to the compositional nature of employed distance metric, the resulting problem admits quadratic programming formulation with linear optimization complexity w.r.t. the number of training examples.We also derive the generalization bound for the proposed approach based on algorithmic robustness analysis of the compositional metric. Extensive experiments on sixteen benchmark data sets clearly validate the usefulness of compositional metric in yielding effective distance metric for multi-label classification.
相关内容推荐:
Frontiers of Computer Science (FCS)是由教育部主管、高等教育出版社和北京航空航天大学共同主办、SpringerNature 公司海外发行的英文学术期刊。本刊于 2007 年创刊,双月刊,全球发行。主要刊登计算机app领域具有创新性的综述论文、研究论文等。本刊主编为周志华教授,共同主编为熊璋教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和明升中国app引文数据库(CSCD)核心库等收录,为 CCF 推荐期刊;两次入选“明升中国科技期刊国际影响力提升计划”;入选“第4届明升中国国际化精品科技期刊”;入选“明升中国科技期刊卓越行动计划项目”。
《前沿》系列英文学术期刊
由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础app、明升m88app、工程技术和人文社会app四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中13种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。
高等教育出版社入选“明升中国科技期刊卓越行动计划”集群化项目。Frontier系列期刊中:13种被SCI收录;1种被A&HCI收录;6种被Ei收录;2种被MEDLINE收录;11种明升中国科技核心期刊;16种被CSCD收录。
明升中国学术前沿期刊网
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。