2025世界统计大会于北京时间10月9日晚10—11点在荷兰海牙举行,明尼苏达大学统计学院教授邹晖和斯坦福大学教授Trevor Hastie(特里瓦·哈斯蒂)共同获颁2025年统计学奠基人奖。邹晖也成为首位获得统计奠基人奖的中国人。
统计学奠基人奖是国际统计学会(ISI)的最高奖之一,旨在表彰对统计理论、方法、实践或应用产生深远影响的研究成果。获奖论文或著作必须是近三十年内发表的研究论文或书籍。评选委员会由来自世界各地的知名统计学家组成。
据了解,统计学奠基人奖每两年评选一次。在2021年之前,该奖以统计学创始人之一卡尔皮尔逊的名字命名。首届卡尔皮尔逊奖于2013年在香港召开的世界统计大会上颁发。2021,国际统计学会(ISI)决定重新命名该奖项,以纪念统计学的众多奠基者。
邹晖此次获奖的主要原因,是其于2005年和Hastie教授在英国皇家统计学会会刊上刊发文章 《通过弹性网络进行正则化和变量选择》,该文被引23000余次。这也是英国皇家统计学会会刊创刊以来引用最多的五篇论文之一。
自2000年以来,随着生物科技、通信技术以及互联网的突破性发展,研究者能够采集大量的研究对象的信息指标。统计学上将这些指标称为“变量”。当变量的数量非常庞大时,得到的数据被称为“高维数据”。
面对高维数据,许多传统的统计方法,包括经典的回归分析方法,不仅难以建立具有良好预测能力的模型,更无法解决高维数据中至关重要的可解释性问题。举例来说,研究者希望利用个体的上万个基因表达信息,预测其是否患有某种疾病。一个理想的模型不仅要具有较高的预测准确率,还应能识别出哪些基因与疾病的发生直接相关。
此外,高维数据统计建模面临的一大挑战是计算效率。因为模型参数通常通过优化预测性能来估计,而高维数据优化问题往往非常耗时。
2002年,作为博士生,邹晖师从Trevor Hastie,敏感地关注到了高维数据遇到的困扰。当时套索法似乎是最好的方法。套索法是现代统计里的一个重要的发明,这项成果也在2021年获得统计奠基人奖。但Trevor Hastie发现,面对高维数据,套索法预测效果不佳,而且选择的变量很不稳定,但当时也没有找到好的解决方案,于是将这个任务布置给了邹晖。经过探索,邹晖找到了套索法的问题症结,并给出了相应的解决方案。Hastie第一时间肯定了邹晖的方案,同时构思了方法的名字——弹性网。
邹晖介绍,弹性网同时兼顾三个目标:良好的预测性能、有效的变量筛选以及较低的计算复杂度,提供了一个高效的高维度数据回归建模的解决方案。使用者可以快速地得到一个预测精度高且解释性好的统计模型用于各种复杂数据建模分析。目前该方法已被广泛应用于高维数据分析。
邹晖本科毕业于中国科学技术大学少年班,博士毕业于斯坦福大学统计系。
(原标题:中国人首获国际统计大奖 )
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。