来源:Frontiers of Computer Science 发布时间:2024/10/12 15:02:32
选择字号:
FCS  文章精要:山西大学钱宇华教授团队——距离关联内嵌数据表征方法

论文标题:A data representation method using distance correlation

期刊:Frontiers of Computer Science

作者:Xinyan LIANG, Yuhua QIAN, Qian GUO, Keyin ZHENG

发表时间:15 Jan 2025

DOI:10.1007/s11704-023-3396-y

微信链接:点击此处阅读微信文章

FCS“优秀青年计算机科学家论坛”于2019年启动,以尊重科学贡献、传播更多优秀成果为宗旨。论坛作者审视自己的研究领域,介绍研究方向和研究进展。本论坛所有文章均为特邀稿件。

本期“优秀青年计算机科学家论坛”推出山西大学钱宇华教授团队的成果——距离关联内嵌数据表征方法。

作者简介

钱宇华,山西大学计算智能与中文信息处理教育部重点实验室教授、博士生导师,主要从事计算智能、数据挖掘与知识发现方面的科研教学工作。近五年来,先后在国际国内重要学术刊物和国际会议发表学术论文70余篇,其中SCI收录40余篇,获发明专利2项,软件著作权登记1项。论文引用达近3000次,4篇论文入选“Web of Science”高引用论文名单。

引用格式:

Xinyan LIANG, Yuhua QIAN, Qian GUO, Keyin ZHENG. A data representation method using distance correlation. Front. Comput. Sci., 2025, 19(1): 191303

阅读原文:

问题概述

 

特征间关联性已被证实可用于提升数据的表征能力。然而,原始关联数据重构方法可能面临如下两个问题:重构数据维度必定高于原始数据维度及所采用的关联度量方法无法平衡算法的有效性和高效性。为解决这两个问题,本文提出一个新颖的内嵌关联的表征提升方法,称为AssoRep。

文章旨在提出更高效、有效的关联内嵌的数据表征学习,基于泰勒展开式内嵌距离相关系数到原表征空间,提升数据的表征能力。

技术步骤

通过幂次函数丰富原始数据中的关系形式,内嵌特征间距离相关系数到原特征空间,并使用主成分降维技术构建结构紧凑的特征关联内嵌的数据新表征。

实验结果

大量实验结果表明,基于本文提出的距离关联表征学习技术,可有效提升数据的分类性能,并在样本规模较大的数据集上具有更优的性能表现。

文章推荐:

文章精要 | 华东师范大学钱鸿副教授团队:基础模型增强的无梯度认知诊断 2025 19(1):191318

文章精要 | 南京大学李宇峰教授团队:RTS:面向带有噪声标记时序数据的稳健学习方法 2024 18(6):186332

文章精要 | 北京航空航天大学黄迪教授团队:FIFAWC:群体行为识别的具有详细注释和丰富语义的数据集 2024 18(6):186351

文章精要 | 南京航空航天大学黄圣君教授团队:基于成对置信度对比信息的鲁棒AUC优化 2024 18(4):184317


Frontiers of Computer Science


Frontiers of Computer Science (FCS)是由教育部主管、高等教育出版社和北京航空航天大学共同主办、SpringerNature 公司海外发行的英文学术期刊。本刊于 2007 年创刊,双月刊,全球发行。主要刊登计算机科学领域具有创新性的综述论文、研究论文等。本刊主编为周志华教授,共同主编为熊璋教授。编委会及青年 AE 团队由国内外知名学者及优秀青年学者组成。本刊被 SCI、Ei、DBLP、INSPEC、SCOPUS 和中国科学引文数据库(CSCD)核心库等收录,为 CCF 推荐期刊;两次入选“中国科技期刊国际影响力提升计划”;入选“第4届中国国际化精品科技期刊”;入选“中国科技期刊卓越行动计划项目”。


《前沿》系列英文学术期刊

由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础科学、生命科学、工程技术和人文社会科学四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中12种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。

中国学术前沿期刊网

http://journal.hep.com.cn