随着信息技术的飞速发展,各个领域如电子通信、生物医学、移动互联网等源源不断地产生形式多样的数据。这些数据最显著的特点是体量极大且维数极高,使得之前的数据分析与挖掘技术不再有效。幸运的是,这些高维数据并不是毫无结构的,典型的特点是它们经常存在着一些本质低维结构特征。因此,有效地挖掘出数据分布的本质低维表达来鲁棒高效地处理高维数据成为统计学、电子通信工程学以及计算机科学等领域的研究者广泛关注的基本问题。
自上世纪90年代以来,随着小波分析技术的发展,人们逐渐发现高维数据中,特别是在一些高维图像数据中,通常都隐含着一些本质的稀疏性特征。另一方面,由于高维数据与生俱来的复杂性以及实际应用场景的条件限制,人们往往很难完整地获得其所有信息,而仅能获得其部分采样信息,这使得通常意义的估计方法(如最小二乘法)无法给出关于原始高维目标数据的准确估计。然而,压缩感知(Compressive Sensing)研究的兴起表明,在建模过程中考虑数据隐含的稀疏性特征,可使得高维数据分析简单可行,并且在一定条件下可以精确恢复原始高维目标。通常这样的估计问题被称为稀疏恢复(Sparse recovery)问题。本质来说,在稀疏恢复问题中需要解决的四个核心子问题为:(1)如何针对具体数据选择合适的稀疏性度量函数;(2)如何针对具体实际场景设计有助于恢复的采样算子;(3)如何设计相应稀疏优化问题的高性能求解算法;(4)如何运用合适的数学分析工具建立精确恢复理论。
《国家科学评论》今年第5期发表了西安交通大学王尧、孟德宇与美国哥伦比亚大学袁明等3位作者共同撰写的综述文章“Sparse recovery: from vectors to tensors”。文章围绕稀疏恢复的四个核心子问题,总结了关于一阶向量与二阶矩阵的稀疏恢复问题的最新结果与研究状况,并分析了关于高阶张量的稀疏恢复问题研究的必要性以及存在的困难与挑战,并且展现了作者在张量本质稀疏性刻画、监控视频压缩以及高光谱压缩感知等高阶张量稀疏恢复问题上的最新研究进展。(来源:科学网)
相关论文信息:https://doi.org/10.1093/nsr/nwx069