自学内容网 自学内容网

机器学习常见概念整理

目录

1.图度量学习:

2.基于图的机器学习

4.基于图相似度计算的图分类方法

5.基于图神经网络的图分类方法

通过学习图的节点特征和图结构来进行分类。GNN通过聚合每个节点及其邻居节点的信息,生成图的全局表示。

6.基于图相似度计算的图分类方法和基于图神经网络的图分类方法之间的区别和联系

7.高斯过程,深度高斯过程,神经网络高斯过程,神经网络深度高斯过程都是用于建模和推断的不同层次的统计模型和概率模型

8.表示学习

9.图神经网络的特征聚合

10.PAC学习

11.归纳学习


1.图度量学习:

通过学习一个映射函数,将数据点映射到一个新的空间,使得在该空间中,相似的数据点(同类)距离较近,而不相似的数据(不同类)点距离较远。

2.基于图的机器学习

基于图的机器学习是处理和分析图结构数据的机器学习方法。图是一种用节点和边表示实体及其关系的数学结构。主要的基于图的机器学习方法:传统图算法、图嵌入方法和图神经网络。

3.基于图的机器学习

基于图的机器学习方法的应用场景

节点分类:给定图结构以及部分节点的标签,预测其他节点的标签

边预测:预测图中那些节点之间可能存在边

图分类:给定多个图样本,预测每个图的类别

4.基于图相似度计算的图分类方法

主要通过比较不同图之间的相似性来进行分类。相似度是通过图的结构和特征来度量的,例如节点、边、图的拓扑结构等。相似度方法通常涉及计算图之间的相似矩阵或距离矩阵,然后将这些相似性作为特征输入到传统的机器学习模型中(如支持向量机)来进行分类。

5.基于图神经网络的图分类方法
通过学习图的节点特征和图结构来进行分类。GNN通过聚合每个节点及其邻居节点的信息,生成图的全局表示。

6.基于图相似度计算的图分类方法基于图神经网络的图分类方法之间的区别联系

区别

计算方式:图相似度计算方法基于图之间的显示相似性通过度量距离或相似性进行分类,而GNN是通过学习节点和图的表示来隐式捕捉图的特征。

拓扑结构处理:图相似度方法直接通过图的结构进行相似性度量,更加注重拓扑结构的相似性。GNN通过神经网络对局部结构进行特征学习,能够灵活地捕捉复杂的图拓扑和特征关系。

联系:

图结构的利用:两种方法都依赖于图的拓扑结构来进行分类,只是方式不同。图相似度方法显式利用拓扑,而GNN通过学习拓扑来生成更高层次的表示。

目标一致:两者的最终目标都是为每个图生成一种表示,并利用该表示进行图分类。不同的是,图相似度方法通过预定义的距离或核函数来进行,而GNN通过学习优化的特征表示来完成这一目标。

7.高斯过程,深度高斯过程,神经网络高斯过程,神经网络深度高斯过程都是用于建模和推断的不同层次的统计模型和概率模型

高斯过程是一个非参数化的概率模型,它用来定义函数的分布。换句话说,它不是直接学习一个确定的函数,而是学习所有可能函数的分布。

深度高斯过程是高斯过程的深度扩展,它通过多层的高斯过程构建起更强的表达能力。类似于神经网络的层次结构,深度高斯过程由多个嵌套的高斯过程组成,每一层的输出作为下一层的输入。

神经网络高斯过程是一种与神经网络和高斯过程理论相关联的模型。它通过将无限宽神经网络与高斯过程联系起来,表明当神经网络中的隐藏层单元数趋向于无穷时,神经网络的输出趋于一个高斯过程的分布。

神经网络深度高斯过程结合了深度神经网络与深度高斯过程的优点,旨在通过深层结构增强模型的表达能力,同时通过高斯过程提供不确定性估计。

8.表示学习

表示学习是一种机器学习方法,旨在自动从原始数据中学习有效的特征表示,以便于后续的任务(如分类、回归或聚类)。其核心思想是通过训练模型提取出数据中潜在的重要特征,而无需手动设计特征。

主要特点:自动化特征提取:表示学习能够自动识别和学习数据中的关键特征,减少了人工特征工程的需求。多层次结构:许多表示学习方法(如深度学习)使用多层结构来捕捉从低级特征到高级特征的复杂模式。降维和压缩:通过表示学习,模型能够将高维数据映射到低维空间,保留重要信息,从而实现降维。

9.图神经网络的特征聚合

用来捕捉每个节点及其邻居之间的信息传递和依赖关系。特征聚合通过从节点的邻居中收集信息并整合进自身节点的表示,从而使节点不仅能表达自身的特征,还能反映它所在的局部图结构。具体来说:在图数据结构中,每个节点都可以被看作是有特征的点(例如,节点可以是一个用户,特征可以是用户的属性)。但是,图中节点之间的连接关系反映了某种特定的关联(如用户之间的朋友关系)。为了让模型理解这种图结构以及节间的相互关系,GNN通过特征聚合机制逐步将每个节点及其邻居节点的特征融合在一起,生成新的表示。特征聚合可以分为两个关键步骤:消息传递(每个节点从其邻居节点接收信息,即特征)和特征更新(接收到的邻居信息与节点自身的特征结合,更新节点的表示)

10.PAC学习

关注在多大程序上学习算法能够在有限的样本上进行有效学习。PAC学习的目标是保证算法在给定的误差和置信度下,以高概率找到一个接近最佳的解。贝叶斯推断:通过先验知识和观察数据来更新对某个模型或参数的信念。PAC-贝叶斯方法利用这一点通过引入先验分布来分析模型的泛化性能。

11.归纳学习

其目标是通过训练数据训练一个模型,然后将这个模型应用到未见过的新数据上。在归纳学习中,模型在训练阶段不知道测试数据,目标是从训练数据中推导出一个可以推广的决策函数决策函数是机器学习或统计学习中用于分类或回归的一种函数,它根据输入数据生成输出,帮助模型做出预测或决策。决策函数的主要任务是基于输入特征(或变量)来确定输出类别(在分类问题中)或输出值(在回归问题中)。

注:该帖的目的是给大家分享,也是为了方便我自己以后回顾学习,不定时更新~


原文地址:https://blog.csdn.net/weixin_45325693/article/details/143078014

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!