3D 生成重建025-CRM开源的3Dmesh生成大模型

🕗 发布于 2024-12-11 02:46 3d AIGC 人工智能

3D 生成重建025-CRM开源的3D生成大模型型

文章目录

0 论文工作

基于Transformer的生成模型，例如大型重建模型（LRM），在生成速度方面表现出色。然而，这些基于Transformer的方法并没有利用其架构中三平面组件的几何先验信息，在三维数据有限的情况下，往往导致次优的质量。在这项工作中，论文提出了一种卷积重建模型（CRM），这是一种高保真度的从单图像到三维纹理网格的前馈生成模型。我们强调了将**几何先验信息融入网络设计的必要性。**CRM基于这样的关键观察结果：三平面的可视化显示了六个正交图像的空间对应关系。首先，它从单个输入图像生成六个正交视图图像，然后将这些图像输入到一个卷积U-Net中，利用其强大的像素级对齐能力和显著的带宽来创建高分辨率的三平面。CRM进一步采用Flexicubes作为几何表示，从而可以直接对纹理网格进行端到端优化。模型在短短10秒内就能从一张图像中生成高保真度的纹理网格，无需任何测试时间的优化。
论文的主要创新点是直接可以生成mesh，然后还有将几何知识添加到这个过程中，但是在我的认识中wonder3d更早一些。随后在CRM的基础上unique3d整体上是在wonder3d跟这个CRM的基础上做了一个融合，用融入法线信息。这个跟我们年中的时候在尝试的一个工作相近，实际上也是收到wonder3d的启发。
paper
github

1 论文方法

下面是论文的流程图，生成六个环绕视图和六个标准空间的坐标图输入CRM中
请添加图片描述

有一说一，这个论文的配色虽然不能说优雅，但是画的很详细，让不懂这个方向的人一眼也能看懂这个论文是怎么实现这个功能的。
CRM 旨在解决现有基于Transformer的三维生成模型在利用几何先验知识和处理有限的三维数据方面存在的不足。该模型利用三平面结构的几何特性，巧妙地将单图像的三维重建问题转化为六个正交视图图像的重建问题。具体来说，CRM 首先使用一个多视图扩散模型，从单张输入图像生成六个正交视图图像以及对应的规范坐标图 (CCM)，然后利用一个卷积 U-Net 网络将这些图像和 CCM 映射到一个展开的三平面表示。最后，通过 Flexicubes 表示和双边 Marching Cubes 算法，直接生成最终的纹理网格。整个过程是端到端的，并且在推理阶段无需任何优化过程。
利用三平面几何先验: CRM 的核心创新在于充分利用三平面结构中六个正交视图图像的空间对应关系，将单图像重建问题转化为多视图重建问题。这使得模型能够更好地利用图像中的几何信息，提高重建的准确性和鲁棒性，尤其是在三维数据有限的情况下。
高效的卷积神经网络架构: CRM 使用卷积 U-Net 作为核心架构，而非 Transformer。这使得模型能够更好地处理图像数据的局部特征和像素级对齐信息，在保证效率的同时提高重建精度。卷积网络的并行计算能力也比 Transformer 更高，有利于快速生成。
Flexicubes 表示与端到端优化: CRM 使用 Flexicubes 表示三维几何，并直接对纹理网格进行端到端优化，避免了其他方法中需要额外步骤生成网格的低效过程。 Flexicubes 的高效性和可微性，使其适用于端到端训练和快速推理。
多视图扩散模型辅助: CRM 利用多视图扩散模型生成六个正交视图图像和 CCM，有效地解决了单视图图像信息不足的问题，并提供了更丰富的几何信息用于三维重建。
快速高效的推理: CRM 在推理阶段无需任何优化，能够在 10 秒内生成高质量的三维纹理网格，这在速度和效率方面显著优于许多现有方法。

2 实验结果

实际上在这个阶段的所有工作中效果来说，实际上都差不多，只有后面使用多视图比原来LRM好些。整体上效果相近。
请添加图片描述

原文地址：https://blog.csdn.net/weixin_41871126/article/details/144339988

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：go 集成nacos注册中心、配置中心
下一篇：unity 让文字呈现弧度变化

.NET(C#) 如何配置用户首选项及保存用户设置
.NET(C#) 如何配置用户首选项及保存用户设置
阅读更多2024-12-14
【最新】北大数字普惠金融指数数据集-省市县（2011-2023年）
郭峰,王靖一,王芳,孔涛,张勋,程志云.测度中国数字普惠金融发展:指数编制与空间特征[J].经济学(季刊),2020,19(04):1401-1418.时间跨度：省级和城市级指数时间跨度为2011-2
阅读更多2024-12-14
GESP202412 四级【Recamán】题解（AC）
a11ak−1−kkakak−1−kak−1k小杨想知道 Recamán 数列的前n项从小到大排序后的结果。手动计算非常困难，小杨希望你能帮他解决这个问题。
阅读更多2024-12-14
IDEA遇到EasyConnect中的网络资源无法访问的问题
版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。原文链接：https://blog.csdn.net/wanshanyu_/article/de
阅读更多2024-12-14
双目摄像头标定方法
此时已经完成标定，左下角为反投影误差，右边为外参可视化。将双目左右目拍的图像上传（左右目最好不少于20张）此时回到主页面，即可看到成功导出。把这些误差大的删除即可。
阅读更多2024-12-14
Servlet、omcat服务器架构与工作原理
Servlet是运行在服务器端的Java程序，它的主要职责之一是接收并处理来自客户端（如浏览器）的HTTP请求。当客户端发送一个请求到服务器时，Servlet可以解析请求中的信息，例如请求的URL路径
阅读更多2024-12-14
Vue生命周期钩子函数：深入解析与实践
作为高级Vue前端开发人员，对Vue组件的生命周期钩子函数有着深刻的理解是至关重要的。生命周期钩子函数是指在Vue组件的创建、更新、销毁等过程中，Vue自动调用的一系列方法。通过这些钩子函数，我们可以
阅读更多2024-12-14
安卓开发--使用android studio发布APP
app发布
阅读更多2024-12-14
数据结构与算法学习笔记----拓扑排序
@ author: 明月清了个风。
阅读更多2024-12-14
python 将数据保存到现有的Excel文件的新工作表
out_file = ‘query.xlsx’df1 = pd.DataFrame(out_data)若直接写入：df1.to_excel(out_file, index=False, sheet_n
阅读更多2024-12-14

3D 生成重建025-CRM开源的3Dmesh生成大模型

文章目录

0 论文工作

1 论文方法

2 实验结果

相关文章