【计算机视觉】FusionGAN

🕗 发布于 2024-11-15 22:07 计算机视觉 人工智能

1. FusionGAN论文阅读

abreheret/FusionGAN: Pytorch implementation of "Generating a Fusion Image: One’s Identity and Another’s Shape"

1.1. WHY

在现实世界中，将对象或人物转换为期望的形状是一种常用技术，但现有的图像翻译方法在处理身份和形状时存在不足，如现有图像翻译学习映射函数时缺乏明确的形状匹配损失函数，可能导致形状无法保持。因此需要新的框架来有效处理身份和形状问题，以生成融合图像，例如将一个人的身份与另一个人的姿势相结合，将合成眼图像转换为真实图像并保持形状，或实现不同风格图像（如照片、素描、卡通）之间的转换等。

1.2. HOW

1.2.1. FusionGAN

基于生成对抗网络（GANs）提出新网络，可从多个无标签图像集中获取两个输入图像，生成具有一个输入图像身份和另一个输入图像形状的融合图像，且能同时在多个图像数据集上进行无监督训练。具体地，对于两个输入图像 $x=(I_x,S_x)$ 和 $y=(I_y,S_y)$ ，目标是生成融合图像 $G(x=(I_x,S_x),y=(I_y,S_y))=(I_x,S_y)$ ，即输出图像具有 $x$ 的身份和 $y$ 的形状。网络不限于两个图像集之间的转换，可用于多个无标签图像集。这里身份可视为图像集级别的特征（如在 VGG YouTube Pose 数据集里是人物身份），形状为实例级别的特征（如人物姿势）。

1.2.2. 损失函数

身份损失 $L_{I}$

通过判别器 $D$ 区分输入对是真实对还是生成对，使生成图像的分布与第一个输入图像所属集合的分布相似，以获取图像 $x$ 的身份。采用 $L_2$ 损失替代负对数似然，让生成器 $G$ 最大化

原文地址：https://blog.csdn.net/Winkyyyyyy/article/details/143356156

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：了解springboot国际化用途以及使用
下一篇：PostgreSQL 创建相同结构的表

【大数据学习 | flume】flume Sink Processors与拦截器Interceptor
比如：一个日志文件(多个系统的日志都在该文件中)，根据日志中某个字段值，比如type=1，是系统A日志，sink to hdfs；type=2，是系统B日志，sink to kafka，此时就可以使用
阅读更多2024-11-17
5. langgraph中的react agent使用 (从零构建一个react agent)
首先，我们需要定义 Agent 的状态，这包括 Agent 所持有的消息。Annotated,Sequence,TypedDict,我们需要定义工具节点和模型调用节点，以便在 Agent 工作流中使用
阅读更多2024-11-17
37.超级简易的计算器 C语言
超级简单，简单到甚至这个计算器输入都比较反人类。
阅读更多2024-11-17
TCP Analysis Flags 之 TCP Dup ACK
TCP 段大小为 0窗口大小非零且没有改变，或者有有效的 SACK 数据下一个期望的 Seq Num 和 LastACK Num 是非 0 的（即连接已经建立）没有设置 SYN、FIN、RST具体的代
阅读更多2024-11-17
【AI图像生成网站&Golang】雪花算法
使用更精准的时间单位。提供了自定义机器 ID 的能力。支持长时间运行，且避免了时钟回拨问题。改进点Snowflake 的问题Sonyflake 的优化符号位固定占用 1 位，没有实际用途去掉符号位，增
阅读更多2024-11-17
【go从零单排】Directories、Temporary Files and Directories目录和临时目录、临时文件
在 Go 语言中，path/filepath 包提供了一组用于处理文件路径的函数，特别是与文件系统路径相关的操作。这个包是 Go 标准库的一部分，主要用于跨平台的路径操作，确保在不同操作系统上（如 W
阅读更多2024-11-17
菜叶子芯酸笔记4：大模型训练、分布式训练、显存估算
大模型训练任务主要分为以下三种模型训练过程。预训练pretrain监督微调 supervised finetune training奖励模型 reward model。
阅读更多2024-11-17
前端面试笔试（四）
RADIUS是一种分布式的、客户端/服务器结构的信息交互协议，"100"是一个有效的数字，它等于十进制的4。哈希表有10个元素，采用的hash函数为H(key)=key%10，用线
阅读更多2024-11-17
力扣-Hot100-链表其一【算法学习day.34】
##我做这类文档一个重要的目的还是给正在学习的大家提供方向（例如想要掌握基础用法，该刷哪些题？）我的解析也不会做的非常详细，只会提供思路和一些关键点，力扣上的大佬们的题解质量是非常非常高滴！！！
阅读更多2024-11-17
机器学习实战笔记30-31：逻辑回归及对应调参实验代码
Class_weight:输入{0:1,1:3}则代表1类样本的每条数据在计算损失函数时都会*3，当输入balanced，则调整为真实样本比例的反比，以达到平衡，但实际情况中不常用。#UI多迭代10的
阅读更多2024-11-17