FlexMatch: Boosting Semi-Supervised Learning with Curriculum Pseudo Labeling

🕗 发布于 2024-10-13 06:58 boosting 人工智能 集成学习

FlexMatch: Boosting Semi-Supervised Learning with Curriculum Pseudo Labeling

摘要：

最近提出的FixMatch在大多数半监督学习（SSL）基准上取得了最先进的结果。然而，像其他现代SSL算法一样，FixMatch为所有类别使用预定义的恒定阈值来选择有助于训练的未标记数据，忽略了不同类别的学习状态和难度差异。为了解决这个问题，我们提出了课程伪标签（Curriculum Pseudo Labeling, CPL），这是一种基于课程学习的方法，根据模型的学习状态利用未标记数据。CPL的核心是动态调整不同类别的阈值，使得有价值的未标记数据及其伪标签得以通过。CPL不引入额外的参数或计算（前向或反向传播）。我们将CPL应用于FixMatch，称为FlexMatch。FlexMatch在多个SSL基准上表现出色，尤其是在标注数据极其有限或任务困难时表现突出。例如，FlexMatch在CIFAR-100和STL-10数据集上分别实现了比FixMatch高13.96%和18.96%的错误率降低，当每类仅有4个标签时。CPL还显著提高了收敛速度，例如，FlexMatch只需FixMatch 1/5的训练时间即可获得更好的性能。此外，我们还展示了CPL可以轻松适配其他SSL算法并显著提高其性能。我们的代码已开源，地址为：https://github.com/TorchSSL/TorchSSL。

引言：

半监督学习（SSL）由于其在利用大量未标记数据上的优势，近年来引起了越来越多的关注。特别是在标记数据数量有限或获取过程繁琐的情况下，这种方法具有很大优势。一致性正则化[1–3]和伪标签[4–8]是两种利用未标记数据的强大技术，已广泛应用于现代SSL算法中[9–13]。最近提出的FixMatch[14]通过结合弱增强和强增强技术以及使用交叉熵损失作为一致性正则化标准，取得了具有竞争力的结果。

然而，FixMatch以及其他流行的SSL算法如伪标签法[4]和无监督数据增强（UDA）[11]的一个缺点是，它们依赖于固定的阈值来计算无监督损失，仅使用预测置信度高于阈值的未标记数据。虽然这一策略可以确保只有高质量的未标记数据用于模型训练，但它忽略了大量其他未标记数据，特别是在训练过程的早期阶段，此时只有少量未标记数据的预测置信度高于阈值。此外，现代SSL算法对所有类别一视同仁，未考虑到不同类别的学习难度差异。

为了解决这些问题，我们提出了课程伪标签（Curriculum Pseudo Labeling，CPL），一种课程学习策略[15]，以考虑每个类别的学习状态用于半监督学习。CPL使用动态调整的灵活阈值替代预定义的固定阈值，这些阈值会根据当前的学习状态为每个类别动态调整。值得注意的是，这一过程不会引入任何额外的参数（超参数或可训练参数）或额外的计算（前向传播或反向传播）。我们将这种课程学习策略直接应用于FixMatch，并将改进后的算法称为FlexMatch。

尽管训练速度与FixMatch同样高效，FlexMatch的收敛速度显著更快，并在大多数SSL图像分类基准测试中实现了最先进的性能。引入CPL的好处在标签稀缺或任务具有挑战性时尤为显著。例如，在STL-10数据集上，当标签数量分别为400、2500和10000时，FlexMatch相对于FixMatch的性能分别提升了18.96%、16.11%和7.68%。此外，CPL通过加快收敛速度进一步显示了其优越性——使用CPL，FlexMatch仅需FixMatch不到1/5的训练时间即可达到最终准确度。将CPL应用于其他现代SSL算法，同样带来了准确性和收敛速度的提升。

总结来说，本文作出了以下三点贡献：

我们提出了课程伪标签（CPL），这是一种课程学习方法，能够动态利用未标记数据用于半监督学习。CPL几乎无需额外成本，且能够轻松集成到其他SSL方法中。
CPL显著提升了多个常见基准测试上流行SSL算法的准确性和收敛性能。具体而言，FixMatch与CPL结合后的FlexMatch算法达到了最先进的结果。
我们开源了TorchSSL，一个基于PyTorch的统一半监督学习代码库，用于公平研究SSL算法。TorchSSL包含了流行SSL算法的实现及其相应的训练策略，易于使用或定制。

背景

一致性正则化遵循半监督学习（SSL）的连续性假设[1, 2]。在SSL中，最基本的一致性损失，如在Π模型[9]、Mean Teacher[10]和MixMatch[12]中使用的，是𝓵-2损失：
在这里插入图片描述
其中B是标记数据的批量大小，µ是未标记数据与标记数据的比例，ω是一个随机数据增强函数（因此公式（1）中的两个项是不同的），ub表示一条未标记数据，pm表示模型的输出概率。随着伪标签技术的引入[5, 7]，一致性正则化被转换为一个熵最小化过程[16]，这更适合分类任务。改进的一致性损失与伪标签结合可以表示为：
在这里插入图片描述
其中H是交叉熵，τ是预定义的阈值，ˆpm(y|ω(ub))是伪标签，可以是“硬”的一热标签[4, 14]或经过增强的“软”标签[11]。使用阈值的目的是为了屏蔽那些预测置信度低的噪声未标记数据。

FixMatch利用这种一致性正则化与强增强相结合，以实现竞争性能。对于未标记数据，FixMatch首先使用弱增强生成人工标签。这些标签随后被用作强增强数据的目标。因此，FixMatch中的无监督损失项呈现如下形式：
在这里插入图片描述
其中Ω是强增广函数而不是弱增广函数。

在上述工作中，预定义的

原文地址：https://blog.csdn.net/qq_22583741/article/details/142746985

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：MySQL的基础使用
下一篇：蓝桥杯模块三：蜂鸣器和继电器的基本控制

雷池社区版本SYSlog使用教程
雷池会对恶意攻击进行拦截，但是日志都在雷池机器上显示如何把日志都同步到相关设备进行统一的管理和分析呢？如需将雷池攻击日志实时同步到第三方服务器, 可使用雷池的 **Syslog 外发** 功能
阅读更多2024-10-13
小米电机与STM32——CAN通信
背景介绍：为了利用小米电机，搭建机械臂的关节，需要学习小米电机的使用方法。计划采用STM32驱动小米电机，实现指定运动，为此需要了解他们之间的通信方式，指令写入方法等。花了很多时间学习，但网络上相关资
阅读更多2024-10-13
Jenkins maven 编译一些问题
另外，要触发自动构建，需要勾选，Poll SCM (poll source code management) 以及 Build when a change is pushed to GitLab 或者
阅读更多2024-10-13
【Jenkins】2024 最新版本的 Jenkins 权限修改为 root 用户启动，解决 permission-denied 报错问题
【代码】【Jenkins】2024 最新版本的 Jenkins 权限修改为 root 用户启动，解决 permission-denied 报错问题。
阅读更多2024-10-13
Jenkins---01
一. 持续集成工具什么是敏捷开发敏捷开发以用户的需求进化为核心，采用迭代、循序渐进的方法进行软件开发。在敏捷开发中，软件项目在构建初期被切分成多个子项目，各个子项目的成果都经过测试，具备可视、可集成和
阅读更多2024-10-13
论文笔记：RelationPrompt :Zero-Shot Relation Triplet Extraction
提示学习关系三元组抽取
阅读更多2024-10-13
Javascript笔试题目（三）
在客户端（通常是浏览器），开发者定义一个全局函数，这个函数将作为回调函数来接收服务器返回的数据。
阅读更多2024-10-13
抖音小游戏画图&位置移动
抖音小游戏canvas画图
阅读更多2024-10-13
k8s、prometheus、grafana数据采集和展示的链路流程
对于k8s节点和pod的性能和资源使用情况的监控，常用prometheus和grafana的组合来实现。metrics server监控组件定期从kubelet获取这些数据，转换成k8s API可以识
阅读更多2024-10-13
基于GeoScene Pro的开源数据治理与二维制图规范化处理智能工具箱
该工具箱基于GeoScene4.0+/ArcGIS Pro平台，结合Python开源工具，提供了数据治理与二维制图规范化处理的全面解决方案，旨在解决GIS应用中数据转换、检查、治理和制图数据标准化处理
阅读更多2024-10-13

FlexMatch: Boosting Semi-Supervised Learning with Curriculum Pseudo Labeling

FlexMatch: Boosting Semi-Supervised Learning with Curriculum Pseudo Labeling

摘要：

引言：

背景

相关文章