3D 生成重建023-DMV3D用扩散模型做3D生成大模型

🕗 发布于 2024-12-11 01:20 3d 人工智能 AIGC

文章目录

0 论文工作

这个论文提出了一种新的三维生成方法DMV3D，它利用基于Transformer 的大型三维重建模型对多视图扩散进行去噪处理。重建模型包含三平面NeRF表示，并能够通过NeRF重建和渲染对噪声多视图图像进行去噪处理，在单块A100 GPU上实现约30秒的单阶段三维生成。使用图像重建损失在大规模多视图图像数据集上训练DMV3D，而无需访问三维资产。在需要对看不见的物体部分进行概率建模以生成具有清晰纹理的各种重建结果的单图像重建问题上展示了较好的结果，还展示了高质量的文本到三维生成结果，其性能优于以前的三维扩散模型。
跟前面的方法相比的话，论文整体上来说是把用图像特征预测三平面特征变成了一个扩散模型的任务。在这一点上这个任务跟我们在23年的论文imagebind3d在思路上相近，都是通过扩散模型预测一种隐藏空间中的3d表示，论文中使用的前面方法延续的三平面特征，我们当时使用的是一个GAN的隐变量。
paper

1 论文方法

请添加图片描述
DMV3D 旨在解决现有三维生成方法在效率和质量上的不足。它并非直接训练一个三维扩散模型，而是利用一个预训练的三维重建模型作为桥梁，将多视图图像的去噪过程转化为三维重建过程。具体来说，DMV3D 首先使用一个多视图扩散模型生成多视角的噪声图像；然后，利用一个基于三平面神经辐射场 (NeRF) 的大型三维重建模型对这些噪声图像进行去噪处理，并直接重建出三维模型。整个过程仅依赖图像重建损失进行端到端训练，无需额外标注的三维数据。此外，DMV3D 也被拓展应用于文本到三维的生成任务，通过结合文本到图像的生成模型，实现从文本描述生成三维模型。
结合三维重建模型进行三维扩散去噪: 这是 DMV3D 最主要的创新点。它避免了直接训练三维扩散模型的困难，而是利用一个强大的预训练三维重建模型来引导扩散过程，将多视图图像的去噪问题转化为一个相对更容易解决的三维重建问题。这有效地降低了训练难度，并提高了生成质量和效率。
单阶段三维生成: DMV3D 采用单阶段的生成流程，直接从噪声多视图图像生成三维模型，避免了多阶段方法中存在的误差累积问题，提高了生成效率。
无需三维数据标注: DMV3D 的训练过程仅依赖图像重建损失，无需额外标注的三维数据，这大大降低了数据获取和标注的成本。

2 实验效果

每次看到大家用坤坤展示生成效果都有一种喜感。
请添加图片描述

原文地址：https://blog.csdn.net/weixin_41871126/article/details/144339073

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：OpenCV相机标定与3D重建(9)相机标定函数calibrateCameraRO()的使用
下一篇：vue地址解析+虚拟手机号解析

.NET(C#) 如何配置用户首选项及保存用户设置
.NET(C#) 如何配置用户首选项及保存用户设置
阅读更多2024-12-14
【最新】北大数字普惠金融指数数据集-省市县（2011-2023年）
郭峰,王靖一,王芳,孔涛,张勋,程志云.测度中国数字普惠金融发展:指数编制与空间特征[J].经济学(季刊),2020,19(04):1401-1418.时间跨度：省级和城市级指数时间跨度为2011-2
阅读更多2024-12-14
GESP202412 四级【Recamán】题解（AC）
a11ak−1−kkakak−1−kak−1k小杨想知道 Recamán 数列的前n项从小到大排序后的结果。手动计算非常困难，小杨希望你能帮他解决这个问题。
阅读更多2024-12-14
IDEA遇到EasyConnect中的网络资源无法访问的问题
版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。原文链接：https://blog.csdn.net/wanshanyu_/article/de
阅读更多2024-12-14
双目摄像头标定方法
此时已经完成标定，左下角为反投影误差，右边为外参可视化。将双目左右目拍的图像上传（左右目最好不少于20张）此时回到主页面，即可看到成功导出。把这些误差大的删除即可。
阅读更多2024-12-14
Servlet、omcat服务器架构与工作原理
Servlet是运行在服务器端的Java程序，它的主要职责之一是接收并处理来自客户端（如浏览器）的HTTP请求。当客户端发送一个请求到服务器时，Servlet可以解析请求中的信息，例如请求的URL路径
阅读更多2024-12-14
Vue生命周期钩子函数：深入解析与实践
作为高级Vue前端开发人员，对Vue组件的生命周期钩子函数有着深刻的理解是至关重要的。生命周期钩子函数是指在Vue组件的创建、更新、销毁等过程中，Vue自动调用的一系列方法。通过这些钩子函数，我们可以
阅读更多2024-12-14
安卓开发--使用android studio发布APP
app发布
阅读更多2024-12-14
数据结构与算法学习笔记----拓扑排序
@ author: 明月清了个风。
阅读更多2024-12-14
python 将数据保存到现有的Excel文件的新工作表
out_file = ‘query.xlsx’df1 = pd.DataFrame(out_data)若直接写入：df1.to_excel(out_file, index=False, sheet_n
阅读更多2024-12-14

3D 生成重建023-DMV3D用扩散模型做3D生成大模型

文章目录

0 论文工作

1 论文方法

2 实验效果

相关文章