召回06 双塔模型two-tower(DSSM)

🕗 发布于 2024-09-28 13:08 算法

双塔模型的结构

相比于矩阵补充模型，双塔模型考虑了id之外的多种特征作为输入。

对于每个离散特征用单独的enbadding层得到向量，对于性别等类别较少的特征直接使用one-hot编码；对于连续特征，最简单的直接归一化，对于长尾分布的特征取log或做分桶等。

神经网络可以是简单的全连接网络，或更复杂的结构，例如深度交叉网络等。输出向量，即表征，用于召回。

余弦相似度范围 [-1 ，1]，相当于对两个向量a b归一化然后求内积。

双塔模型的训练

pointwise: 把正样本和负样本组成一个数据集，在数据集上做随机梯度下降训练双塔模型；

pairwise: 每次取一个正样本和负样本组成一个二元组，损失函数用triplet hinge loss或者 triplet logistic loss；

listwise: 每次取一个正样本和多个负样本组成一个list，训练类似于多元分类。

pointwise训练

正负样本数量约定俗成

pairwise训练

正负样本embadding层使用一样的参数

m是超参数，可以调整，例如设置为1。训练就是最小化损失函数，用梯度更新双塔神经网络的参数，triplet hinge loss是一种损失函数；triplet logistic loss函数中的sigma是一个大于0的超参数，控制损失函数的形状，手动设置。

listwise训练：

鼓励正样本余弦相似度接近1，负样本都接近于-1。输入到softmax激活函数，输出分数s介于0-1之间。希望s+接近1，s-接近0，鼓励s接近y。用y和s的交叉熵-logs+作为损失函数，训练来最小化交叉熵，即鼓励softmax输出s接近标签y，也就是最大化s+。

总结：

这是粗排和精排，前期融合，将特征在神经网络之前就拼接融合，不适用于召回，适用于排序模型；召回使用双塔模型，是在最终输出相似度的时候才融合。

原文地址：https://blog.csdn.net/DEVIL_hym/article/details/142593904

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：LeetCode讲解篇之5. 最长回文子串
下一篇：zookeeper 服务搭建（集群）

PHP 中，将 JSON 数据与二进制数据之间进行相互转化主要涉及两个步骤：
要将 JSON 数据转换为二进制数据，首先需要将 JSON 数据解析成 PHP 数组或对象，然后使用 PHP 的。函数将二进制字符串转换为 PHP 数组或对象，然后将其编码为 JSON 数据。如果你只
阅读更多2024-09-28
JavaEE: 探索网络世界的核心-IP协议
13位分片偏移: 是分片相对于原始IP报文开始处的偏移.其实就是在表示当前分片在原报文中处在哪个位置.实际偏移的字节数是这个值 * 8 得到的.因此,除了最后一个报文之外,其他报文的长度必须是8的整数
阅读更多2024-09-28
数据库常见概念
PostgreSQL 支持联合索引和聚簇索引，联合索引可以加速多列条件的查询，而聚簇索引控制数据在磁盘上的排列。适当地使用这些索引可以提高查询性能。
阅读更多2024-09-28
BEV学习---LSS4-模型训练
LSS训练测试
阅读更多2024-09-28
SpringCloud第六章(服务保护CircuitBreaker) -2024
CircuitBreaker是断路器的意思，由于原来的SpringCoud的hystrix停更，所以springcloud社区推出了的新断路器，用来进行springcloud的服务降级、限流、熔断由于
阅读更多2024-09-28
ubuntu 开启root
【代码】ubuntu 开启root。
阅读更多2024-09-28
MySQL数据查询（基础）
SELECT语句用于从表中查询数据。可以选择特定的列，也可以选择所有列。：使用表示选择所有列。
阅读更多2024-09-28
区块链可投会议CCF C--FC 2025 截止10.8 附录用率
CCF C：2025：2023年 39 full and 2 short papers selected from 182 submissions.
阅读更多2024-09-28
第1章 C语言概述
4.打开项目后，右击"源文件"并选择"添加"的"新建项"6.在"hello_word"文件下编写代码并点击运行。1.打开
阅读更多2024-09-28
Git 与 GUI 工具
当我们对 Git 的提交、分支已经非常熟悉，可以熟练使用命令操作 Git 后，再使用 GUI 工具，就可以更高效。
阅读更多2024-09-28