3D 生成重建030-SV3D合成环绕视频以生成3D

🕗 发布于 2024-12-11 12:51 3d AIGC 人工智能

文章目录

0 论文工作

论文提出了Stable Video 3D (SV3D)——一个用于生成围绕三维物体的高分辨率图像到多视角视频的潜在视频扩散模型。最近关于三维生成的文献提出了将二维生成模型应用于新视图合成 (NVS) 和三维优化的技术。然而，这些方法由于视角有限或 NVS 不一致而存在一些缺点，从而影响了三维物体的生成性能。在这项工作中，作者提出了SV3D，它采用图像到视频的扩散模型进行新视图合成和三维生成，从而利用视频模型的泛化能力和多视角一致性，并为 NVS 添加显式相机控制。作者还提出了改进的三维优化技术，利用 SV3D 及其 NVS 输出进行图像到三维生成。在包含二维和三维指标的多个数据集上的大量实验结果以及用户研究表明，与之前的工作相比，SV3D 在 NVS 和三维重建方面具有最先进的性能。
就目前看到的一些工作来说，在测试中，一半以上的情况视频扩散模型在3D数据上的微调效果没有明显超过直接生成多视图。
paper
github
相关论文
video LDM

1 论文方法

请添加图片描述
SV3D 旨在解决现有图像到三维重建方法中新视角合成(NVS)不一致和三维优化效率低下的问题。它主要包含两个阶段：
新视角合成 (NVS): 首先，利用一个预训练的、图像到视频的潜在视频扩散模型 (SVD)，从单张输入图像生成围绕目标物体的多视角一致的视频帧。该模型具有良好的泛化能力和多视角一致性，并通过显式控制相机参数来实现可控的新视角生成。
三维模型优化: 然后，利用改进的三维优化技术，结合生成的视频帧，优化三维模型（例如NeRF或DMTet网格）。该优化过程使用了改进的遮挡感知分数蒸馏采样(SDS)损失函数，以提高不可见区域的三维重建质量。
利用潜在视频扩散模型进行新视角合成: 这是SV3D最主要的创新点。它不同于以往使用图像扩散模型生成新视角的方法，而是巧妙地利用了潜在视频扩散模型(SVD)的优势。视频模型天生具有时间一致性和泛化能力强的特点，这使得SV3D生成的新视角在一致性和质量上都优于现有方法，并且对不同类型的输入图像具有更好的鲁棒性。
显式相机参数控制: SV3D在生成新视角时，可以显式控制相机参数（例如，方位角和仰角），从而实现对生成视角的精确控制，这在以往的图像到三维重建方法中并不常见，极大提升了可控性。
改进的三维优化技术和遮挡感知SDS损失: SV3D采用改进的三维优化技术，并结合遮挡感知SDS损失函数，能够更有效地利用多视角信息进行三维重建，特别是对于在输入图像中不可见的部分，提高了重建的精度和完整性。

2 实验结果

感觉生成结果在很多种类上不是很好。应该说不如理想那么好，首先视频扩散模型在3d数据上微调的时候，可能造成计算量大很多倍，微调后后3D感知还是不够。请添加图片描述

原文地址：https://blog.csdn.net/weixin_41871126/article/details/144385829

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【Python】函数
下一篇：【openwrt】openwrt-21.02 基于MWAN3实现load balance流量不均衡问题修改

.NET(C#) 如何配置用户首选项及保存用户设置
.NET(C#) 如何配置用户首选项及保存用户设置
阅读更多2024-12-14
【最新】北大数字普惠金融指数数据集-省市县（2011-2023年）
郭峰,王靖一,王芳,孔涛,张勋,程志云.测度中国数字普惠金融发展:指数编制与空间特征[J].经济学(季刊),2020,19(04):1401-1418.时间跨度：省级和城市级指数时间跨度为2011-2
阅读更多2024-12-14
GESP202412 四级【Recamán】题解（AC）
a11ak−1−kkakak−1−kak−1k小杨想知道 Recamán 数列的前n项从小到大排序后的结果。手动计算非常困难，小杨希望你能帮他解决这个问题。
阅读更多2024-12-14
IDEA遇到EasyConnect中的网络资源无法访问的问题
版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。原文链接：https://blog.csdn.net/wanshanyu_/article/de
阅读更多2024-12-14
双目摄像头标定方法
此时已经完成标定，左下角为反投影误差，右边为外参可视化。将双目左右目拍的图像上传（左右目最好不少于20张）此时回到主页面，即可看到成功导出。把这些误差大的删除即可。
阅读更多2024-12-14
Servlet、omcat服务器架构与工作原理
Servlet是运行在服务器端的Java程序，它的主要职责之一是接收并处理来自客户端（如浏览器）的HTTP请求。当客户端发送一个请求到服务器时，Servlet可以解析请求中的信息，例如请求的URL路径
阅读更多2024-12-14
Vue生命周期钩子函数：深入解析与实践
作为高级Vue前端开发人员，对Vue组件的生命周期钩子函数有着深刻的理解是至关重要的。生命周期钩子函数是指在Vue组件的创建、更新、销毁等过程中，Vue自动调用的一系列方法。通过这些钩子函数，我们可以
阅读更多2024-12-14
安卓开发--使用android studio发布APP
app发布
阅读更多2024-12-14
数据结构与算法学习笔记----拓扑排序
@ author: 明月清了个风。
阅读更多2024-12-14
python 将数据保存到现有的Excel文件的新工作表
out_file = ‘query.xlsx’df1 = pd.DataFrame(out_data)若直接写入：df1.to_excel(out_file, index=False, sheet_n
阅读更多2024-12-14

3D 生成重建030-SV3D合成环绕视频以生成3D

文章目录

0 论文工作

1 论文方法

2 实验结果

相关文章