李宏毅机器学习2023-HW11-Domain Adaptation

🕗 发布于 2024-09-27 18:55 机器学习 人工智能

文章目录

Task
Link
Baseline

Task

Domain Adaptation
通过训练真实图片得到分类模型，并将其应用到涂鸦图片上进行分类，来获得更高的精准度。
在这里插入图片描述

Link

kaggle
colab

Baseline

Simple Baseline

acc≥0.44280, < 1hour
Just run the code and submit answer.

Medium Baseline

acc≥0.65994, 2~4 hours
方法：增加epoch+ 改变 λ 值

Set proper λ in DaNN algorithm.
Training more epochs.
epoch从200增加到800，λ 从0.1变为0.7，提升lambλ 意味着更注重domain classifier的表现，让source domain和target domain的表现更一致，不过也不能一直提升，太大会影响label predictor的能力

Strong Baseline

acc≥0.75342, 5~6 hours
增加epoch+ 动态调整 λ 值。将epoch调整到1000。根据DANN论文，可使用动态调整的 λ 值，从0.02动态的调整为1，这样前期可让label predictor更准确，后期更注重domain classifier的表现

代码中输出了0, 199, 399, 599, 799, 999 epoch的训练效果图。在这些epoch，将5000张source和target图片，输入到feature_extractor模型，每张图片的输出是一个512维度的图片，然后利用t-SNE方法降维到2维，最后画出source图片的不同类别分布图和source target分布对比度。随着epoch增加，target和source的分布基本一致了，达到了DANN模型的目的。这里不展示，具体可见代码

for epoch in range(epochs):
    lamb = np.log(1.02 + 1.7*epoch/epochs)
    train_D_loss, train_F_loss, train_acc = train_epoch(source_dataloader, target_dataloader, lamb=lamb)

def visualization(features):
    for i, feature in enumerate(features):
        data = np.concatenate([feature.X, feature.TX])
        num_source = len(feature.labels)
        X_tsne = manifold.TSNE(n_components=2, init='random', random_state=5, verbose=1).fit_transform(data)
        # Normalization the processed features 
        x_min, x_max = X_tsne.min(0), X_tsne.max(0)
        X_norm = (X_tsne - x_min) / (x_max - x_min)
    
        plt.figure(figsize=(16, 8))
        plt.subplot(121)
        plt.title(f'epoch {marked_epoch[i]}:distribution of features accross different class')
        plt.scatter(X_norm[:num_source, 0], X_norm[:num_source, 1], c=feature.labels, label='source domain')
        plt.subplot(122)
        plt.title(f'epoch {marked_epoch[i]}:distribution of features accross different domain')
        plt.scatter(X_norm[:num_source, 0], X_norm[:num_source, 1], c='b', label='source domain')
        plt.scatter(X_norm[num_source:, 0], X_norm[num_source:, 1], c='r', label='target domain', alpha=0.5)
        plt.legend()
    plt.show()

Boss Baseline

acc ≥0.81072

调整参数：optimizer, learning rate, set lr_scheduler, etc…
Ensemble： Ensemble the model or output you tried.
其他advanced adversarial training，比如DALN
Semi-supervised learning
Universal Domain Adaptation

借鉴DIRT的两步训练法
这里利用DANN模型生成伪标签（pseudo-label）。第一步用adversarial的方法训练一个模型，这里我们使用strong baseline得到的模型；第二步是利用第一步产生的模型，对target图片生成伪标签，有了标签，就可以对target做有监督学习，该方法能充分利用模型的潜在价值。
在具体的实现环节，为了保证伪标签的可靠性，设计了一个超参数赋值0.95，所产生的伪标签概率高于该值才被使用，另外为保证训练的稳定性，使用了teacher网络，利用teacher网络生成伪标签，teacher网络的初始值也来自strong base模型，在训练过程中，teacher网络更新比较慢，做法是设计了一个超参数赋值0.9，teacher网络的更新中0.9的权重来自于自己，0.1的权重来自于主干网络

原文地址：https://blog.csdn.net/qq_42875127/article/details/142415019

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：一种求解城市场景下无人机三维路径规划的高维多目标优化算法，MATLAB代码
下一篇：word中的表格全部设置宽度100%

支持分页的环形队列
最近我因工作需要使用环形队列，并在常规环形队列上拓展为支持分页环形队列，用于高效地管理大量数据，支持高效的元素添加、删除及分页数据的访问。通过分页的方式，它可以有效地管理大规模的数据集合。
阅读更多2024-09-27
Mybatis
MyBatis 是一款优秀的持久层框架MyBatis 避免了几乎所有的 JDBC 代码和手动设置参数以及获取结果集的过程MyBatis 可以使用简单的 XML 或注解来配置和映射原生信息，将接口和 J
阅读更多2024-09-27
pysim-4-1.1.17 eUICC ISD-R commands
pySim-trace 利用 pySim-shell 对 SIM 卡相关知识的现有了解，包括 SIM/USIM/ISIM/HPSIM 卡上各种文件的结构/编码，并将其应用于解码协议跟踪。相反，所有与卡
阅读更多2024-09-27
Vert.x，Databases
Vert.x提供了数据库相关模块(扩展包)，方便我们通过异步方式访问数据库。数据库扩展主要包括：响应式数据库客户端(vertx-xxx-client)和通用JDBC客户端(vertx-jdbc-cli
阅读更多2024-09-27
Python | 第五章节 | 进制
关键字的定义和特点(提示:不用背)定义:被Python语言赋予了特殊含义，用做专门用途的字符串(单词)–对于整数，有如下表示方式2进制: 0,1﹐满2进1. 以0b或0B开头。8进制: 0-7，满8进
阅读更多2024-09-27
【Python】The Algorithms：开源算法的宝库
The Algorithms 是一个开源项目，旨在为开发者提供各种编程语言的算法实现。该项目汇集了数千种算法的实现，涵盖了数据结构、排序算法、数学算法、机器学习、密码学等领域。通过该平台，开发者可以学
阅读更多2024-09-27
普通光耦合器和线性光耦合器之间的区别
光耦合器，也称为光隔离器，在电子电路中起着至关重要的作用，它可以隔离系统的不同部分，同时允许信号在它们之间传递。
阅读更多2024-09-27
SQL - 函数
本文讲解SQL的函数，包含操作函数类别，Aggregate函数类别，Saclar函数类别。针对SQL数据查询更自定义话，针对化。
阅读更多2024-09-27
从零开学C++：二叉搜索树
C++实现搜索二叉树！！
阅读更多2024-09-27
【JAVA 笔记】06 车辆属性抽象类
封装是面向对象编程的一个基本特性，它指的是将数据和操作数据的方法捆绑在一起，形成一个整体（即对象）。类中，我们定义了一个构造函数来初始化父类的属性和自身的属性。好的，我们将进一步拓展这篇文章的内容，深
阅读更多2024-09-27