[大语言模型] LINFUSION：1个GPU，1分钟，16K图像

🕗 发布于 2024-09-23 04:58 语言模型 人工智能 自然语言处理

1. 文章

2409.02097 (arxiv.org)https://arxiv.org/pdf/2409.02097

LINFUSION: 1 GPU, 1 MINUTE, 16K IMAGE

摘要

本文介绍了一种新型的扩散模型LINFUSION，它能够在保持高分辨率图像生成性能的同时显著降低时间和内存复杂度。该模型采用了基于Transformer的UNet进行去噪，并且通过引入线性注意力机制替代了传统的自注意力操作，以解决高分辨率视觉内容生成中的挑战。研究者们从最近引入的具有线性复杂度的模型中获得灵感，提出了一种新的线性注意力范式，该范式可作为多种流行的线性令牌混合器的低秩近似。通过从预训练的StableDiffusion (SD)模型中初始化并进行知识蒸馏，LINFUSION在适度训练后即可达到或超过原始SD的性能，同时显著减少时间和内存复杂度。实验表明，LINFUSION能够生成高达16K分辨率的高分辨率图像，并且与预训练的SD组件（如ControlNet和IP-Adapter）高度兼容。

创新点

提出了一种新的线性注意力机制，作为传统自注意力方法的替代，以解决高分辨率图像生成中的时间和内存复杂度问题。
引入了注意力归一化和非因果推理两个关键特性，以增强高分辨率视觉生成性能。
通过知识蒸馏的方式，从预训练的StableDiffusion模型中初始化并优化LINFUSION，减少了训练成本并提高了与现有模型的兼容性。

算法模型

LINFUSION模型基于Stable Diffusion (SD)，通过以下关键技术构建：
- 线性注意力机制：替代SD中的自注意力层，以线性复杂度处理空间令牌。
- 注意力归一化：确保不同输入规模下的总影响保持一致。
- 非因果推理：允许模型同时访问所有噪声空间令牌并基于整个输入生成去噪令牌。
- 知识蒸馏：从预训练的SD模型中转移知识，以优化LINFUSION模型。

实验效果

生成速度和内存消耗：在8步去噪和单GPU情况下，与原始SD-v1.5相比，LINFUSION在不同分辨率下的生成速度更快，内存消耗更低。
跨分辨率生成性能：在SD-v1.5、SD-v2.1和SD-XL上的实验表明，LINFUSION在零样本跨分辨率生成性能上令人满意，能够生成高达16K分辨率的图像。
与预训练组件的兼容性：LINFUSION与SD的现有组件（如ControlNet和IP-Adapter）高度兼容，无需额外训练成本。

原文地址：https://blog.csdn.net/fyf2007/article/details/142436542

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：C++容器list底层迭代器的实现逻辑~list相关函数模拟实现
下一篇：js基础语法详解

谷歌推出设备内置人工智能，实时向手机用户发出诈骗电话警报
Google 宣布推出适用于 Android 的新安全功能，可实时防御诈骗和有害应用。
阅读更多2024-11-16
动手学深度学习70 BERT微调
13 bert一般可以用工具转成c++ 开销大。考虑怎么提升bert性能。14 设备性能不高，可以用蒸馏bert。模型中有大量冗余的东西。9 10, 一般不固定，固定参数可以使训练速度加快，可以尝试
阅读更多2024-11-16
怎么改变网络IP地址：实用指南与注意事项
在数字化时代，IP地址作为设备连接互联网的“身份证”，扮演着至关重要的角色。无论是出于隐私保护、访问限制绕过，还是网络安全考虑，有时我们需要更改设备的IP地址。然而，对于许多非技术用户而言，这一过程可
阅读更多2024-11-16
huggingface 下载方法测试ok
huggingface 下载方法：
阅读更多2024-11-16
计算机网络（10）网络性能
在计算机网络中，网络性能是指网络传输数据的效率、速度和稳定性。
阅读更多2024-11-16
Springboot校园失物招领平台
Springboot校园失物招领平台
阅读更多2024-11-16
HarmonyOS 如何获取设备信息（系统、版本、网络连接状态）
HarmonyOS 提供了一个强大的 API 集，方便开发者获取设备的硬件和软件信息。通过模块的deviceInfo接口，开发者可以访问设备的型号、品牌、系统版本等详细信息。本文将详细介绍如何使用这些
阅读更多2024-11-16
Vue3集成搜索引擎智能提示API
问题：因为API返回的是JSONP数据，JSONP是跨域访问的一种方式，网上很多都是用的原生的 js 代码去发送请求，嵌入到vue中不太方便，因此我想着vue能不能直接发送jsonp 请求，后面发现v
阅读更多2024-11-16
【Linux】Linux 权限的理解
本文简单介绍了Linux的基础知识--权限。
阅读更多2024-11-16
Python 中.title()函数和.lower()函数
将字符串中的每一大写字母都变成的小写字母。将字符串中的每一单词的首字母大写。1.lower()函数的功能。1.title()函数的功能。一.title()函数。二.lower()函数。
阅读更多2024-11-16

[大语言模型] LINFUSION：1个GPU，1分钟，16K图像

摘要

创新点

算法模型

实验效果

相关文章