| 《国际计算机视觉杂志》2008年76卷1期 |
|
| 单幅静止图像三维重建 |
|
从图像中恢复三维深度是计算机视觉研究中的一个基本问题,这项技术也在机器人、场景理解和三维重建中有着重要的应用。以往,三维重建的研究集中在双目镜视觉和其他一些需要多重图像的算法上,并且只关注几何上的差异。从单幅静止图像中预测深度是一件极其困难的事情,因为在仅仅知道局部图像特征的条件下,深度仍然是不明确的。事实上,除了立体上的信息外,也存在着大量的单目镜的信息,例如纹理变化和梯度、散焦和颜色。
美国斯坦福大学教授Ashutosh Saxena等科学家利用图像的整体结构和场景的先验知识,提出了新的算法解决了这一难题。他们将深度预测看成是图像理解过程中微小但很关键的一步,有效地利用深度信息来理解图像的空间布局,寻找可以行走的区域和检测目标。试验证明,Saxena等提出的有监督学习的单幅静止图像深度预测方法,能够很好地应付室内室外结构混乱的环境,包括森林、人行道、建筑物、行人和树丛等。
原文链接:http://www.springerlink.com/content/3800p5q612311m31/?p=88b2575670ef4b77ae2110bf338b1172&pi=3(张叶银/编译)