背景替换大模型图像处理gradio部署服务

🕗 发布于 2024-11-16 06:31 图像处理 人工智能 图像 gradio 背景

愿我们终有重逢之时，而你还记得我们曾经讨论的话题。

group 868373192

second group 277356808

1. 导入库

import gradio as gr
from PIL import Image
from modelscope_studio import encode_image, decode_image, call_demo_service
import json
import os
from skimage import io
import numpy as np

gradio: 用于创建交互式Web界面的库。
PIL: Python Imaging Library，用于图像处理。
modelscope_studio: 自定义库，包含图像编码、解码和调用模型服务的功能。
json: 用于处理JSON数据。
os: 用于处理文件路径。
skimage.io: 用于读取图像。
numpy: 用于数值计算。

2. 定义推理函数 `inference`

def inference(image: Image, bk: Image) -> Image:
    if image is None or bk is None:
        return None, None
    input_url = encode_image(image)

    data = {
        "task": "portrait-matting",
        "inputs": [
            input_url
        ],
        "urlPaths": {
            "inUrls": [
                {
                    "value": input_url,
                    "fileType": "png",
                    "type": "image",
                    "displayType": "ImgUpload",
                    "displayProps": {
                        "label": {
                            "text": "原图",
                            "style": {
                                "background": "rgba(98,74,255,0.8)",
                                "color": "#fff"
                            }
                        }
                    },
                    "validator": {
                        "max_resolution": "3000*3000",
                        "max_size": "10M"
                    },
                    "name": "",
                    "title": ""
                }
            ],
            "outUrls": [
                {
                    "outputKey": "output_img",
                    "type": "image"
                }
            ]
        }
    }
    model_id = 'cv_unet_image-matting'
    result = call_demo_service(path='damo', name=model_id, data=json.dumps(data))
    print(result)
    res_url = result['data']['output_img']

    res_img = io.imread(res_url)
    alpha = res_img[:, :, 3:4] / 255.0
    w, h = image.size
    bk = bk.resize((w, h))
    combine_img = image * alpha + bk * (1 - alpha)
    combine_img = combine_img.astype(np.uint8)
    return res_img, combine_img

功能: 该函数接收两张图像（人像和背景），使用模型对输入的人像进行抠图，然后将抠图结果与背景图像进行合成，生成新的图像。
步骤:
1. 检查输入: 确保输入图像不为空。
2. 图像编码: 将输入图像编码为URL。
3. 构建请求数据: 构建包含任务类型、输入图像URL等信息的JSON数据。
4. 调用模型服务: 使用call_demo_service函数调用模型服务进行抠图。
5. 读取结果: 从模型服务返回的结果中获取抠图结果的URL，并读取该图像。
6. 处理图像: 提取抠图结果的Alpha通道，调整背景图像大小，将抠图结果与背景图像合成。
7. 返回结果: 返回抠图结果和合成后的新图像。

3. 定义Gradio界面

css_style = "#fixed_size_img {height: 240px;} " \
            "#overview {margin: auto;max-width: 400px; max-height: 400px;}"

title = "一键人像抠图换背景"
description = "输入一张人像照片和背景图，本空间能生成抠图结果，并进行换背景，一键穿越！欢迎使用！"
examples = [[os.path.dirname(__file__) + 'input1.jpg', os.path.dirname(__file__) + 'bk1.jpg'],
            [os.path.dirname(__file__) + 'input2.jpg', os.path.dirname(__file__) + 'bk2.jpg'],
            [os.path.dirname(__file__) + 'input3.jpg', os.path.dirname(__file__) + 'bk3.jpg']]

with gr.Blocks(title=title, css=css_style) as demo:
    gr.HTML('''
      <div style="text-align: center; max-width: 720px; margin: 0 auto;">
                  <div
                    style="
                      display: inline-flex;
                      align-items: center;
                      gap: 0.8rem;
                      font-size: 1.75rem;
                    "
                  >
                    <h1 style="font-family:  PingFangSC; font-weight: 500; font-size: 36px; margin-bottom: 7px;">


                      一键人像抠图换背景
                    </h1>       
      ''')

    gr.Markdown(description)
    with gr.Row():
        img_input1 = gr.Image(label="人像", type="pil", elem_id="fixed_size_img")
        img_output1 = gr.Image(label="抠图", type="pil", elem_id="fixed_size_img")
    with gr.Row():
        img_input2 = gr.Image(label="背景", type="pil", elem_id="fixed_size_img")
        img_output2 = gr.Image(label="新图", type="pil", elem_id="fixed_size_img")
    with gr.Row():
        btn_submit = gr.Button(value="一键抠图换背景", elem_id="blue_btn")
        # btn_clear = gr.Button(value="清除")

    examples = gr.Examples(examples=examples, inputs=[img_input1, img_input2], outputs=[img_output1, img_output2])
    btn_submit.click(inference, inputs=[img_input1, img_input2], outputs=[img_output1, img_output2])

demo.launch()

功能: 创建一个Gradio界面，允许用户上传人像和背景图像，并展示抠图结果和合成后的新图像。
界面元素:
- 标题: 显示“一键人像抠图换背景”。
- 描述: 显示功能的简要说明。
- 输入框: 用户上传人像和背景图像。
- 输出框: 显示抠图结果和合成后的新图像。
- 按钮: 用户点击按钮后，调用inference函数进行抠图和合成。
- 示例: 提供一些示例图像供用户参考。

4. 启动Gradio界面

demo.launch()

功能: 启动Gradio界面，用户可以在浏览器中访问并使用该工具。

总结

该代码实现了一个基于Gradio的Web界面，用户可以通过上传人像和背景图像，使用预训练的模型进行人像抠图，并将抠图结果与背景图像合成，生成新的图像。界面简洁直观，适合用于展示和体验人像抠图换背景的功能。

原文地址：https://blog.csdn.net/SPESEG/article/details/143801831

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：如何设置MySQL 数据库的默认字符集和默认排序规则
下一篇：ubuntu 22.04 安装 docker 阿里云源 LTS

Java-异步方法@Async+自定义分布式锁注解Redission例子
确保锁的超时时间足够长，能够覆盖业务逻辑的执行时间。锁的超时时间设置不当：锁的超时时间可能设置得太短，导致锁在业务逻辑执行完成之前就已经自。问题在于使用分布式锁时，第一个请求获取到锁并执行异步方法，但
阅读更多2024-11-19
C++和C中的类型转换方式以及带来的问题
例如，将一个较大的unsigned long long类型的值转换为unsigned int类型，这里b的值超出了unsigned int所能表示的最大值（4294967295），在隐式转换时会发生数
阅读更多2024-11-19
OMV7 树莓派 tf卡安装
配置好树莓派初始化设置，用户名、密码、wifi、ssh等都正确配置并启用。提示中明确提醒了，要给用户授权，否则之前能用ssh远程登录，现在就不行了。升级7之后，问题多多，不是docker不行了，就是代
阅读更多2024-11-19
P1048 [NOIP2005 普及组] 采药
【代码】P1048 [NOIP2005 普及组] 采药。
阅读更多2024-11-19
ssh.service could not be found“
ssh.service could not be found"
阅读更多2024-11-19
Java 类型转换（Type Casting）
类型转换是将一种数据类型（如整数int、浮点数float或双精度浮点数double）的值转换为另一种数据类型的过程。这种转换可以自动进行，也可以手动进行。编译器执行自动转换，而程序员则执行手动转换。为
阅读更多2024-11-19
学习大数据DAY61 宽表加工
建模: 使用建模工具 PowerDesigner Navicat 在线画图工具... 把表结构给绘。设计: excel 文档去编写。大表 - 把很多数据整合起来。共享\项目课工具\pd。
阅读更多2024-11-19
深入解析 Vue 3 中的 `v-model` 与相关知识点
默认情况下，v-model会使用的事件形式。例如上例中的和。开发者可以随意定义事件名称。v-model开发者可以在自定义组件中，灵活地支持v-model，以下是具体实现步骤。Vue 3 中的v-mod
阅读更多2024-11-19
xpath表达式学习总结
比如：获取a标签的所有父节点中所有class属性为"bird"的父节点，使用//a/parent::[contains(@class,“bird”)]比如：获取a标签的所有父亲节点
阅读更多2024-11-19
111页PPT丨服装零售行业数字化时代的业务与IT转型规划
安踏的数字化转型项目在方法论、计划和组织方面展现出了明确的目标、系统的规划和有效的执行。
阅读更多2024-11-19