作者:桂运安 来源:中国科学报 发布时间:2020/12/24 14:38:51
选择字号:
新算法可快速选出最优子集

中国科学技术大学管理学院教授王学钦团队与美国耶鲁大学公共卫生学院教授张和平合作,针对线性回归模型的基准问题——最优子集选取,提出一种新的快速算法,在有限步内就能得到稳定解。该成果日前发表于美国《国家科学院院刊》。

发现事物间的关系是大部分科学研究的目的,这在统计学中称之为回归分析。其中,线性回归模型由于其简洁性和可解释性,成为最有用的科学研究工具之一。最优子集算法泛指多元回归分析中自变量选择时旨在寻找为数不多的,根据指定准则是“最优”回归模型的计算方法。尽管线性回归模型被如此广泛使用,但其中一个很基本的问题——如何在一组变量中选择最优的子模型,尚未解决。

当前,得益于现代科技的发展,数据的收集越来越便利,在典型的生物医学研究中会收集到上百个变量,常规的全基因组研究中则涉及到成千上万甚至是百万级别的遗传变异。然而,现有的算法难以在上万级别的实际问题中寻找到最优子集。

为了解决这个问题,王学钦团队利用排序和剪接的思想,结合一个新的信息准则发展出一种新的算法,使得算法在有限步内就能得到稳定解。同时,他们证明了在一定条件下,依大概率,该算法具有多项式的时间复杂度,而且能够选出最优子集。

相关论文信息:https://doi.org/10.1073/pnas.2014241117

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
标准模型被打破了吗 肿瘤细胞不爱糖
科学家找出细胞间物质运输通道 高质量柑橘砧木枳基因组发布
>>更多
 
一周新闻排行 一周新闻评论排行
 
编辑部推荐博文