自学内容网 自学内容网

【CViT】Deepfake Video Detection Using Convolutional Vision Transformer

Deepfake Video Detection Using Convolutional Vision Transformer

会议/期刊:2021
作者:
在这里插入图片描述

key points

提出了一种用于检测深度伪造的卷积视觉变压器【CNN+VIT】

CNN提取可学习的特征,而ViT将学习到的特征作为输入,并使用注意机制对其进行分类。

我们的工作基于[10,11]指出的Deepfake检测方法的两个弱点:数据预处理和通用性。

我们提出了一种广义卷积视觉变压器(CViT)架构,使用卷积神经网络和变压器架构来检测Deepfake视频。

称我们的方法是一般化的,主要有三个原因。
1)我们提出的模型利用Transformer的注意力机制,利用CNN和Transformer架构学习局部和全局图像特征[6]。
2)我们在训练和分


原文地址:https://blog.csdn.net/sinat_39223177/article/details/142661459

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!