多模态 Multi-Module的创新点

🕗 发布于 2024-04-14 18:45 人工智能 机器学习 深度学习 多模态

最近在改论文

用了多模态

记得最早找创新点时

记录了关于多模态相关的一些值得深入研究的方向

记录于此

希望分享交流

*注：多模态不止多信息源；

除了不同的感知模态（如视觉、听觉、触觉等）之外，多模态还可以涉及到不同的数据表示、不同的特征空间、不同的数据类型等。

在更广义的理解中，多模态可以包括以下几个方面的内容：

不同的感知模态：这是最常见的多模态定义，涉及到不同的感官输入，如视觉、听觉、触觉等。
不同的数据表示或特征空间：即使是同一种感知模态，也可以有不同的数据表示方式或特征空间。比如，在视觉领域，可以使用图像像素值作为一种表示，也可以使用深度学习中的特征向量作为另一种表示。
不同的数据类型：除了传统的数据类型（如图像、文本、声音等），还可以涉及到其他类型的数据，如时间序列数据、结构化数据、空间数据等。
不同的模态间关系：多模态系统中的不同信息源之间可能存在复杂的关系，可以是互补的、冗余的、竞争的等各种关系。

多模态融合的渐进式融合

多模态学习中的正交序列融合

视听融合中多任务学习的集成框架

量化半监督多模态学习中的交互

基于Hypergraph的自监督多模态表示学习

可扩展的多模态融合

多模态嵌入式问答

从多任务混合视角看待缺失模态

多模态学习单模态偏差理论

交替单模态适应

深度平衡方法

多模态攻

原文地址：https://blog.csdn.net/chongnannan/article/details/137722543

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【无标题】
下一篇：geekos-project3

管家婆工贸ERP BR039.采购订单关联MRP明细表
ⅲ. 由于以上报表是复制系统原有功能的基础上增加定制功能，所以如果在以后版本升级中复制参考的系统中的原报表增加了新功能，该定制插件虽然可以支持升级到新版本，但是升级后不包含新版本中增加的新功能，如需变
阅读更多2024-11-17
3271.哈希分割字符串
这个问题通过简单的字符串处理和数学运算实现了字符串的哈希转换。算法时间复杂度为 O(n)，其中 n 是字符串的长度。这种方法高效且易于理解，非常适合用来解决类似的字符串处理问题。
阅读更多2024-11-17
Java核心知识体系-线程管理
在Java程序开发中，线程管理是一个至关重要的方面。它涉及到如何有效地创建、调度、同步和销毁线程，以确保程序的性能、响应性和稳定性。以下是对Java线程管理的详细探讨。
阅读更多2024-11-17
WebChromeClient 方法分类及其功能
`WebChromeClient` 是 Android `WebView` 的关键组件，处理网页交互事件。本文介绍了其主要回调方法及注意事项，帮助开发者提升 Web 应用的用户体验。
阅读更多2024-11-17
服务端高并发分布式结构进阶之路
服务端高并发分布式结构演进之路
阅读更多2024-11-17
物理hack
手把手教你黑进你朋友的电脑，然后给他关机，哈哈哈，来玩吧网络安全红队（成长ing）,学习分享
阅读更多2024-11-17
R 语言科研配色 --- 第 15 期
在使用 R 语言进行科研绘图时，颜色的选择是一件让人特别纠结的事情。本系列文章介绍了 R 语言科研绘图时常用的一些配色。本账号内所有原创内容，未经允许禁止转载和用于商业用途，违者必究。为了解决 R 语
阅读更多2024-11-17
【Android、IOS、Flutter、鸿蒙、ReactNative 】静态数组
Android Java 静态数组、Android Kotlin 静态数组、IOS Object-c 静态数组、IOS Swift 静态数组、鸿蒙静态数组、React Native 静态数组。
阅读更多2024-11-17
蓝牙 HFP 协议详解及 Android 实现
蓝牙免提协议（HFP，Hands-Free Profile）是用于支持免提通话的标准协议，广泛应用于车载蓝牙系统、蓝牙耳机等设备。HFP提供了拨号接听电话挂断电话以及语音拨号等功能，同时支持同步手机电
阅读更多2024-11-17
lua实现雪花算法
雪花算法（Snowflake Algorithm）是一种用于生成唯一ID的分布式生成算法，最初由Twitter开发。它的主要目的是在分布式系统中生成唯一的、时间有序的ID，这些ID通常用于数据库的主键
阅读更多2024-11-17

多模态 Multi-Module的创新点

相关文章