Stable Diffusion 3.5重磅开源三个最新版本，文生图模型霸主归来！

🕗 发布于 2024-11-13 21:34 stable diffusion midjourney AI作画 photoshop macos

前言：

终于，Stability AI发布了自家最强的模型Stable Diffusion 3.5，而且是一个全家桶，包含三个版本。

链接：https://huggingface.co/stabilityai

Stable Diffusion 3.5 可以满足科研人员、业务爱好者、初创公司和企业的多样化需求，其中包括：

这份完整版的SD整合包已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

Stable Diffusion 3.5 Large：该基础模型拥有 80 亿参数，性能优于竞品模型并且响应迅速，是 Stable Diffusion 系列中最强大的模型。该模型非常适合 1 百万像素分辨率的专业用例。

Stable Diffusion 3.5 Large Turbo：该模型是 Stable Diffusion 3.5 Large 的蒸馏版本，只需四步即可生成高质量图像，速度远快于Stable Diffusion 3.5 Large。

Stable Diffusion 3.5 Medium：该模型拥有 25亿参数，采用改进的MMDiT-X架构和训练方法，可在消费级硬件上「开箱即用」，在质量和定制易用性之间实现了平衡。该模型能够生成分辨率在0.25到2百万像素之间的图像。

可以看到，以上模型均有较大幅度的升级。Stability AI 表示，在今年 6 月发布Stable Diffusion 3 Medium后发现模型没有满足社区的期望。因此在听到反馈意见后没有采取快速修复措施，而是「花时间进一步开发了一个新版本，以推进改造视觉媒体的使命。」

模型开发技巧

在开发模型时，Stability AI优先考虑可定制性，以提供灵活的构建基础。为了实现这一点，他们将Query-Key Normalization集成到transformer块中，稳定了模型训练过程并简化了进一步的微调和开发。

为了支持下游灵活性，Stability AI还必须做出一些权衡。使用不同种子的同一提示可能会产生很大的输出差异，这是有意为之，因为它有助于在基础模型中保留更广泛的知识库和多样化的风格。不过，缺乏特异性的提示可能会导致输出不确定性增加，并且美学水平可能会有所不同。

尤其是针对Medium版本，Stability AI 对架构和训练协议进行了一些调整，以提高质量、连贯性和多分辨率生成能力。

模型的优势

据介绍，Stable Diffusion 3.5各版本模型在以下多个方面表现出色：

可定制性：轻松微调模型以满足特定创作需求，或根据定制的工作流程构建应用程序。

高效性能：经过优化，均可在标准消费级硬件上运行，尤其是 Stable Diffusion 3.5 Medium 和 Stable Diffusion 3.5 Large Turbo 型号。

多样化输出：无需大量提示，即可创建代表全世界的图像，而不仅仅是一种肤色和特征的人。

风格多样：能够生成各种风格和美感的图片，如 3D、摄影、绘画、线条艺术以及几乎任何可以想象到的视觉风格。

在这里插入图片描述

可见，在这一代的模型中，Stability AI已经提前考虑好了手机等设备的运行。

此外，Stability AI表示，Stable Diffusion 3.5 Large在prompt adherence方面处于领先地位，并且在图像质量方面可与更大的型号相媲美。

Stable Diffusion 3.5 Large Turbo在同类模型中，推理速度最快，同时在图像质量和及时性方面保持了高度竞争力，即使与类似尺寸的非蒸馏模型相比也是如此。

Stable Diffusion 3.5 Medium 的表现优于其他中型型号，在prompt adherence和图像质量之间实现了平衡，使其成为高效、高质量性能的首选。

在这里插入图片描述

有人第一时间对比了Stable Diffusion 3.5 Large与FLUX 1.1 pro的生图效果。

除了Hugging Face上托管的模型以外，还有更多访问新模型的方式：

Stability AI API：https://platform.stability.ai/docs/api-reference#tag/Generate/paths/_1v2beta1stable-image_1generate1sd3/post
Replicate：https://replicate.com/stability-ai/stable-diffusion-3.5-large
ComfyUI：https://blog.comfy.org/sd3-5-comfyui/
以及DeepInfra

此外，在新版本模型中，Stability AI 从开发的早期阶段就引入了安全、负责任的 AI 实践。

最后，Stability AI 表示，Stable Diffusion 3.5 Medium 将在 10 月 29 日公开发布。不久之后，ControlNets 也将推出，为各种专业用例提供高级控制功能。

这份完整版的SD整合包已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

原文地址：https://blog.csdn.net/ice829/article/details/143736921

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：若依笔记（九）：商城系统apk打包与调试
下一篇：一台服务器最大能打开的文件数

算数基本定理@质因数分解原理
把自然数写成素数的乘积，结论就是著名的算术基本定理。此定理建立了自然数与素数之间的一个重要的关系式。算数基本定理是整除理论性质和结论的精华,是整个初等数论的基础证明一些方程是否有整数解能够从公式的角度
阅读更多2024-11-15
用 Python 从零开始创建神经网络（六）：优化（Optimization）介绍
在随机初始化的模型中，或者即使是采用更复杂方法初始化的模型中，我们的目标是随着时间的推移培训或教育一个模型。为了训练一个模型，我们调整权重和偏差以提高模型的准确性和置信度。为此，我们需要计算模型的错误
阅读更多2024-11-15
海思3403对RTSP进行目标检测
用ss928 实现rtsp流的目标检测
阅读更多2024-11-15
亮数据——助力全球数据抓取的高效代理平台
特别是在需要跨境数据采集的场景中，亮数据的全球代理池能够让用户根据目标网站的地域需求，选择不同地区的IP地址，以此提升数据抓取的稳定性和成功率。亮数据不仅提供了丰富的IP资源，还内置了智能管理系统，可
阅读更多2024-11-15
【卡尔曼滤波】递归算法Recursive的应用 C语言、Python实现（Kalman Filter）
【卡尔曼滤波】递归算法Recursive的应用 C语言、Python实现（Kalman Filter）
阅读更多2024-11-15
记一次工作中订单幂等处理方案
当然可以考虑在数据库新增一张表，这张表上有第三方订单号的字段，并为此字段建立唯一索引，每次下单前预先往这张表插入数据，如果此第三方订单号已存在，那么插入数据必然报错。第一次是通过分布式锁检测，这是在
阅读更多2024-11-15
大数据湖项目建设方案（100页WORD）
随着信息技术的飞速发展，数据量呈现出爆炸性增长的趋势。企业、政府机构及科研单位在运营过程中积累了大量的数据资源，这些数据中蕴含着巨大的价值，但如何高效地存储、处理和分析这些数据，成为了一个亟待解决的问
阅读更多2024-11-15
深度学习笔记14-卷积神经网络2
卷积神经网络，是包含卷积运算且具有深度结构的前馈神经网络。在卷积神经网络中，包含卷积层、池化层和全连接层三种重要的结构。相比前馈神经网络，卷积层和池化层是新增的网络结构，在提取特征时，卷积神经网络使用
阅读更多2024-11-15
[Mysql基础] 表的操作
1.1 语法说明：field表示列名datatype表示列的类型字符集，如果没有指定字符集，则以所在数据库的字符集为准collate校验规则，如果没有指定校验规则，则以所在数据库的校验规则为准。
阅读更多2024-11-15
Mysql-DDL语句
Mysql DDL语句的使用方法和配置命令，可以更加快速熟悉的掌握Mysql基本操作命令
阅读更多2024-11-15

Stable Diffusion 3.5重磅开源三个最新版本，文生图模型霸主归来！

前言：

模型开发技巧

模型的优势

相关文章