协同过滤——当前推荐技术和算法中使用最广泛和认可度最高的算法之一

🕗 发布于 2024-11-06 01:01 算法

一、定义与原理

协同过滤指的是根据与某个人（或商品）的相似物的分析，来判断此人（或商品）的特点、价值和潜在属性。简单来说就是它给A推荐与A兴趣相似的人的东西，或与A喜欢的物品相似的其他物品。

二、分类

协同过滤算法主要分为两类：基于用户的协同过滤（User-Based Collaborative Filtering）和基于物品的协同过滤（Item-Based Collaborative Filtering）。

基于用户的协同过滤：这种方法首先找到与目标用户相似的其他用户，然后根据这些用户的喜好来推荐项目。计算用户之间的相似性时，可以使用余弦相似度、皮尔逊相关系数等方法。得到相似性后，根据相似性排序找到与目标用户最相似的其他用户，进而计算目标用户对其他项目的预测评分。该方法的优点是可以直接利用用户之间的相似性进行推荐，缺点是需要存储大量的用户信息，且计算成本较高。（举个例子，比如用户A喜欢看的电影类型和你相似，那么它会把A喜欢看的电影推荐给你，可能你也喜欢）
基于物品的协同过滤：这种方法首先找到与目标项目相似的其他项目，然后根据这些项目的用户喜好来推荐用户。计算项目之间的相似性同样可以使用余弦相似度、皮尔逊相关系数等方法。该方法的优点是可以直接利用项目之间的相似性进行推荐，且计算成本相对较低。（举个例子，比如你特别喜欢吃甜的水果，比如香蕉、梨，那么它可能会给你推荐芒果、甘蔗，可能你也喜欢）

三、实现步骤

数据准备：收集用户的行为数据，如评分、购买记录等。
相似度计算：根据用户或物品之间的相似性计算方法，得到用户或物品之间的相似度矩阵。
预测评分：根据相似用户的评分来预测目标用户对未评分物品的兴趣程度，或根据相似物品的评分来预测目标用户对未接触过物品的兴趣程度。
推荐生成：根据预测评分，为用户生成推荐列表。

四、优缺点

优点：

能够过滤机器难以自动内容分析的信息，如艺术品、音乐等。
能够基于一些复杂的、难以表达的概念（如信息质量、品位）进行过滤。
有推荐新信息的能力，可以发现内容上完全不相似的信息。
可以发现用户潜在的但自己尚未发现的兴趣偏好。
推荐个性化、自动化程度高，能够有效地利用其他相似用户的回馈信息，加快个性化学习的速度。

缺点：

稀疏性问题：用户对商品的评价非常稀疏，基于用户的评价所得到的用户间的相似性可能不准确。
新用户和新项目问题：对于新用户或新项目，由于缺乏足够的历史数据，难以进行准确的推荐。
系统延伸性问题：随着用户数量和项目数量的增加，计算成本会显著增加，可能导致系统性能下降。

五、应用领域

协同过滤主要应用于电子商务、社交网络、视频推荐等领域，以提高用户体验和增加销售额。

原文地址：https://blog.csdn.net/a486368464/article/details/143529490

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：信号与噪声分析——第三节：随机过程的统计特征
下一篇：git创建分支、删除分支、推送分支到远程等操作

防火墙----iptables
防火墙会从以上至下的顺序来读取配置的策略规则，在找到匹配项后就立即结束匹配工作并去执行匹配项中定义的行为（即放行或阻止）。如果在读取完所有的策略规则之后没有匹配项，就去执行默认的策略。iptables
阅读更多2024-11-18
Python代码热流系统进行建模分析
从指定的Excel文件中读取与热流相关的数据，包括管径、长度、压力、流量、入口过冷焓等参数。根据读取的数据，利用库计算多种水的物性参数，如饱和焓值、密度、比热容、粘度等。通过一系列复杂的物理公式和迭代
阅读更多2024-11-18
二、vue指令
点击展开或收起时，把内容区域显⽰或者隐藏。v-bind:属性名="vue变量"指代事件对象传给事件处理函数。⽅便通过变量控制⼀套标签出现。修饰符给事件扩展额外功能。修饰符名即可使⽤
阅读更多2024-11-18
信奥学习规划（CSP-J/S)
CSP - J/S（非专业级软件能力认证 - 入门级 / 提高级）的信奥学习规划
阅读更多2024-11-18
ctfshow DSBCTF web部分wp
需要值不同而 md5 相同，有长度限制不能进行强碰撞，尝试数组绕过也不行，这里注意到可以让其类型不同而值相同进行绕过，构造 pop 链最后得到 flag。
阅读更多2024-11-18
【Linux】进程的优先级
cpu资源分配的先后顺序，就是指进程的优先权（priority）。优先权高的进程有优先执行权利。配置进程优先权对多任务环境的linux很有用，可以改善系统性能。还可以把进程运行到指定的CP
阅读更多2024-11-18
Linux—进程学习-02
进程相关的概念的学习【利用系统调用fork创建子进程】【利用fork实现多进程】【操作系统层面上进程状态运行、阻塞、挂起的理解和学习】【Linux操作系统具体的进程状态的理解和学习（R、S、T、t、D
阅读更多2024-11-18
HMI FUXA测试
FUXA是基于Web的，过程（SCADA、HMI、看板等）可视化软件。可创建现代的过程可视化，使用独立的设计器，显示机器和实时数据。。
阅读更多2024-11-18
基于Java Springboot城市交通管理系统
城市交通管理系统的目的是让使用者可以更方便的将人、设备和场景更立体的连接在一起。能让用户以更科幻的方式使用产品，体验高科技时代带给人们的方便，同时也能让用户体会到与以往常规产品不同的体验风格。这就意味
阅读更多2024-11-18
pytorch中的ImageFolder 用法
是 PyTorch 中模块提供的一个常用类，用于从文件夹中加载图像数据。它是一种非常方便的方式来加载按文件夹结构组织的图像数据集。这个类能够自动将文件夹中的子目录作为标签，并且将其中的图像文件加载为
阅读更多2024-11-18