三维重建_点云重建方法及开源框架推荐

通过深度估计和反投影生成点云，再经过优化得到最终模型。Open3D、COLMAP等开源框架可辅助实现这一过程。

惊鸿一博 · 2025-02-24 22:30:00 发布

1. 点云重建的核心算法

问：

点云重建，给定图像的位姿，给定图像，没有特征提取的结果和对应的匹配关系，如何做点云重建？核心算法是什么？整体方法是什么？有什么开源框架可以使用？

答：

在给定图像及其位姿但缺乏特征提取和匹配关系的情况下，点云重建的核心算法和方法如下：

深度估计：
- 单目深度估计：使用深度学习模型从单张图像预测深度图。
- 多视图立体匹配（MVS）：通过多张图像的位姿信息，利用几何约束生成深度图。
点云生成：
- 反投影：将深度图中的像素反投影到3D空间，生成点云。
点云优化：
- 滤波：去除噪声点。
- 配准：将不同视角的点云对齐到同一坐标系。
- 融合：合并多个点云，生成完整模型。

通过深度估计和反投影生成点云，再经过优化得到最终模型。Open3D、COLMAP等开源框架可辅助实现这一过程。

多视图立体匹配（Multi-View Stereo, MVS）是一种从多张已知位姿的图像中生成深度图的技术。MVS通过利用多视角图像的几何约束和光度一致性，计算每个像素的深度信息，从而生成稠密的深度图。以下是MVS生成深度图的核心原理和流程：

几何约束：
- 通过已知的相机位姿（位置和姿态），可以建立图像之间的几何关系。
- 对于图像中的每个像素，MVS通过多视角图像的极线几何（Epipolar Geometry）搜索其对应的像素点。
光度一致性：
- 假设场景表面是漫反射的，同一物理点在多张图像中的颜色（或亮度）应该一致。
- MVS通过比较不同图像中对应像素的颜色差异，找到最匹配的深度值。
深度图生成：
- 对每个像素，MVS在其可能的深度范围内搜索最佳深度值，使得多视角图像中的对应像素颜色差异最小。
- 最终生成一张稠密的深度图，表示每个像素到相机的距离。

输入数据：
- 多张图像及其对应的相机位姿（通常通过SFM，Structure from Motion获得）。
- 相机内参（焦距、主点、畸变参数等）。
图像对选择：
- 选择与当前图像视角相近的图像对，用于深度估计。
- 通常选择基线（Baseline）适中的图像对，避免视角差异过大或过小。
深度假设：
- 对当前图像的每个像素，假设一组可能的深度值（深度范围通常由场景的尺度决定）。
- 深度范围可以通过稀疏点云或场景的粗略估计得到。
匹配代价计算：
- 对于每个深度假设，将当前图像的像素反投影到其他图像中，计算对应像素的颜色差异。
- 常用的代价函数包括：
  - 光度一致性：像素颜色差异（如SSD、NCC）。
  - 几何一致性：多视角图像的深度一致性。
深度优化：
- 通过优化算法（如Winner-Takes-All、Graph Cut、PatchMatch等）选择每个像素的最佳深度值。
- 常用的优化方法：
  - 局部优化：对每个像素独立优化。
  - 全局优化：考虑像素之间的空间一致性，生成更平滑的深度图。
深度图后处理：
- 滤波：去除噪声和异常值（如通过一致性检查、中值滤波等）。
- 插值：填补缺失的深度值（如通过平面拟合或插值算法）。
输出：
- 生成稠密的深度图，每个像素的深度值表示其到相机的距离。

COLMAP：
- 支持SFM和MVS，能够从图像生成稠密点云和深度图。
- 官网：COLMAP — COLMAP 3.12.0.dev0 documentation
OpenMVS：
- 一个完整的MVS框架，支持深度图生成、点云融合和网格重建。
- 官网：https://github.com/cdcseacave/openMVS
AliceVision：
- 一个开源的摄影测量框架，支持MVS和纹理映射。
- 官网：AliceVision | Photogrammetric Computer Vision Framework
- https://github.com/alicevision/AliceVision
PMVS (Patch-based Multi-View Stereo)：
- 经典的MVS算法，适合小规模场景。
- 官网：PMVS2