Deepfake detection【Datawhale AI夏令营】数据增强方法

🕗 发布于 2024-07-21 02:11 人工智能

deepfake detection比赛链接https://www.kaggle.com/competitions/multi-ffdi

训练分类模型判别图片是否为AI生成图片，探究不同数据增强方法对模型表现的影响。

1、数据增强方法

图像分类任务中常见的数据增强方法：
（1）几何变换：

随机裁剪（Random Cropping）：随机从原始图像中裁剪出固定大小的区域，这有助于模型学习不同位置的特征。
transforms.RandomCrop(128)

在这里插入图片描述

随机缩放（Random Scaling）：对图像进行随机缩放，增加模型对不同尺度对象的识别能力。在本次任务中，将训练和验证数据统一resize到（256， 256），使所有数据相同大小的分辨率，又能够减少显存占用。
transforms.RandomResizedCrop(256)
随机旋转（Random Rotation）：随机选择一个角度对图像进行旋转，有助于模型学习不同角度的视觉特征。
transforms.RandomRotation(degrees=(-45, 45))
随机翻转（Random Flip）：以一定的概率对图像进行水平或垂直翻转，增加数据的多样性。
transforms.RandomHorizontalFlip()

transforms.RandomVerticalFlip()

（2）颜色和光照变换

颜色抖动（Color Jittering）：随机调整图像的亮度、对比度、饱和度和色调，使模型更具鲁棒性。
transforms.ColorJitter(brightness=0.4, contrast=0.4, saturation=0.4, hue=0.1)
随机灰度变换（Random Grayscale）：以一定概率将图像转换为灰度图像，这种变换可以降低模型对颜色的依赖，增加泛化能力。
transforms.RandomGrayscale(0.8)
随机色彩噪声（Random Color Noise）：向图像中添加随机颜色噪声，模拟真实场景中的光照变化和传感器噪声。

在这里插入图片描述

（3）空间变换

弹性变形（Elastic Distortion）：通过对图像进行局部扭曲，模拟图像变形的情况，增加模型对形变的鲁棒性。

（4）混合增强

Mixup：将两幅图像按照一定比例进行混合，即生成一个新的图像，标签则按照比例混合。这有助于模型更好地处理类别之间的边界和提升泛化能力。
Cutmix：通过将一个图像的一部分剪切并粘贴到另一个图像上来创建新的训练样本。

2、实验对比不同数据增强方法的效果

代码来自：https://www.kaggle.com/code/chg0901/0-98-deepfake-ffdi-ways-to-defeat-0-86-beseline

数据增强方法	验证集acc
水平方向和垂直房向的翻转	78.75%
RandomCrop(128)	79.22%

原文地址：https://blog.csdn.net/weixin_43227526/article/details/140572052

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

【Git】深入理解 Git 版本回退：方法与实践
Git 提供了多种版本回退的方法，合理使用这些工具能够有效管理项目历史。无论是git reset还是git revert，了解其工作机制和适用场景至关重要。在进行操作前，务必评估可能的后果，尤其是在处
阅读更多2024-09-23
DevOps在提升软件质量方面的作用
持续部署作为DevOps的核心实践之一，对于提升软件质量具有显著的作用。它通过在自动化测试通过后自动将应用部署到生产环境，实现了软件交付的持续性和高效性。在实施持续部署的过程中，需要重点关注以下几个方
阅读更多2024-09-23
MySQL 8 查看 SQL 语句的执行进度
MySQL 8 查看 SQL 语句的执行进度
阅读更多2024-09-23
华为云DevSecOps和DevOps
DevOps注重开发和运维的协作以及提高软件交付效率，而DevSecOps则将安全性整合进了整个软件开发和运维流程，使得系统在不断演进中能保持高效的交付能力，同时确保系统的安全性和质量。这使得DevS
阅读更多2024-09-23
FreeRTOS学习——链表list
FreeRTOS学习——链表（列表）list，仅用于记录自己阅读与学习源码*list_t只能存储指向list_item_t的指针。每个list_item_t都包含一个数值（xItemValue）。大多
阅读更多2024-09-23
P6户外LED显示屏的特点
P6户外LED显示屏的像素点间距为6毫米，较大间距使得其成本较低，但仍能在较远距离内提供清晰的画质。与P8、P10甚至P16等规格相比，P6在保持较低成本的同时，能够保证在8至10米远的距离内观看到清
阅读更多2024-09-23
第三章掌握MySQL数据库的基本操作
第三章掌握MySQL数据库的基本操作
阅读更多2024-09-23
【jvm】动态链接为什么需要常量池
在Java源文件被编译成字节码文件时，所有的变量和方法引用都作为符号引用保存在class文件的常量池中。通过存储符号引用而不是直接引用，可以减少内存的使用，并在需要时通过动态链接机制快速找到实际的方法
阅读更多2024-09-23
等保测评中的安全策略与政策制定
等保测评中的风险评估是一个系统的过程，旨在识别、分析、评价和应对信息系统中可能存在的风险。：根据风险评估的结果，制定相应的风险管理策略，包括风险规避、降低、转移和接受等。：记录系统的安全事件，包括审计
阅读更多2024-09-23
LCD屏JD9853各个接口最大支持速率
LCD屏最大传输速率计算方法
阅读更多2024-09-23

Deepfake detection【Datawhale AI夏令营】数据增强方法

1、数据增强方法

2、实验对比不同数据增强方法的效果

相关文章