浅谈人工智能之基于容器云进行文生图大模型搭建

🕗 发布于 2024-11-27 07:11 人工智能

浅谈人工智能之基于容器云进行文生图大模型搭建

引言

随着深度学习技术的不断发展，文生图（Text-to-Image）大模型成为了计算机视觉和自然语言处理领域的一个研究热点。文生图模型可以根据输入的文本描述生成高质量的图像，广泛应用于艺术创作、广告设计、虚拟现实等领域。本文将介绍如何搭建一个基于iic/cv_cartoon_stable_diffusion_design的文生图大模型。

模型效果展示

我们首先看一下我们对搭建好的模型的效果进行展示，我们的提示词如下：

a beautiful girl with sun glasses

我们得到的图片结果如下：
在这里插入图片描述

环境搭建

基于上述结果以后，我们就可以开始进行文生图环境搭建。
第一步：模型克隆

git clone https://www.modelscope.cn/iic/cv_cartoon_stable_diffusion_design.git

第二步：依赖包下载

pip install opencv-python
pip install modelscope
pip install packaging
pip install addict
pip install oss2

第三步：下载依赖包datasets，但是这里会有版本的限制，如果我们直接通过pip install datasets安装，我们会出现以下报错内容

from datasets.utils.file_utils import (OfflineModeIsEnabled,
ImportError: cannot import name ‘OfflineModeIsEnabled’ from ‘datasets.utils.file_utils’

因此我们需要指定版本：pip install datasets==2.16.0
第四步：继续安装其他依赖

pip install torch
pip install pillow
pip install simplejson
pip install sortedcontainers
pip install diffusers
pip install torchvision
pip install transformers

第五步：编写应用代码

import cv2
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

pipe = pipeline(Tasks.text_to_image_synthesis, model='damo/cv_cartoon_stable_diffusion_design', model_revision='v1.0.0')
output = pipe({'text': 'a beautiful girl with sun glasses'})
cv2.imwrite('result.png', output['output_imgs'][0])
print('Image saved to outImage.png')

至此，整个环境搭建完成。

原文地址：https://blog.csdn.net/u012151594/article/details/143866251

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：线上＋线下≠新零售，6大互通诠释新零售的核心要点-亿发
下一篇：NLP 1、人工智能与NLP简介

基于spring boot的医院挂号就诊系统论文
第二点：设计有效的导航，这个包括每个页面上都有导航条的显示，有时也可以在页面的底部设计导航条，当用户进入具体页面时，要设计相应的位置提示，在页面中比较特殊的位置，需要设计返回链接，可以返回上个页面，也
阅读更多2024-11-28
【Unity踩坑】Unity中父对象是非均匀缩放时出现倾斜或剪切现象
本文解决了Unity中父对象是非均匀缩放时出现倾斜或剪切的问题
阅读更多2024-11-28
「Mac玩转仓颉内测版29」基础篇9 - 数组类型详解
本篇将介绍 Cangjie 中的数组类型，包括数组的定义、创建、访问、常见操作以及在数据管理中的应用，帮助开发者熟练掌握数组的使用。
阅读更多2024-11-28
创建mapreduce项目使用maven
创建mapreduce项目使用maven
阅读更多2024-11-28
Python开源项目周排行 2024年第16周
注:当前文章会不定期进行更新。标签： ERP PDF OCR。
阅读更多2024-11-28
使用EFK收集k8s日志
首先我们使用EFK收集Kubernetes集群中的日志，本次实验讲解的是在Kubernetes集群中启动一个Elasticsearch集群，如果企业内已经有了Elasticsearch集群，可以直接将
阅读更多2024-11-28
C#基础41-45
求n以内（不包括n）同时能被3和7整数的所有自然数之和的平方根s，并作为函数值返回，最后结果s输出到控制台。44.数组x中有n个数，求出奇数的个数cn1和偶数的个数cn2以及数组x下标为奇数的元素值的
阅读更多2024-11-28
JavaScript：遍历一个对象数组，获取每个对象中 mainKeyId 对应的值，并以这个值作为新属性的键名，给该对象添加一个新属性。
假设我们有一个对象数组，每个对象包含一个mainKeyId字段，以mainKeyId的值作为新的键名，并给它添加一个新的属性。
阅读更多2024-11-28
【AI系统】谷歌 TPU v4 与光路交换
TPU v4 通过采用 7nm 工艺，翻倍的 MXU 数量，以及显著增加的内存容量和带宽，实现了性能的大幅提升。特别引人注目的是 Sparse Core 的引入，它专门针对稀疏计算进行了优化，使得 T
阅读更多2024-11-28
SpringBoot文件上传之秒传、断点续传、分片上传
比如，在线教育平台上的视频资源上传，社交平台上的图片分享，以及企业内部的知识文档管理等。这些场景对文件上传的要求也各不相同，有的追求速度，有的注重稳定性，还有的需要考虑文件大小和安全性。这对于大文件上
阅读更多2024-11-28

浅谈人工智能之基于容器云进行文生图大模型搭建