什么是机器学习?

🕗 发布于 2024-09-25 17:28 机器学习 人工智能 算法

一、概念（维基百科）

机器学习是人工智能的一个分支。机器学习算法是一类从数据中自动分析获得规律，并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论，机器学习与推断统计学联系尤为密切，也被称为统计学习理论。

二、主要特点

机器学习的主要特点包括：

1、数据驱动：机器学习模型的性能主要依赖于输入的数据。数据的质量和数量直接影响模型的准确性和泛化能力，所谓“Garbage in, garbage out”。

2、模式识别：机器学习算法能够识别数据中的模式，这些模式可以是显式的（如分类标签）或隐式的（如特征之间的关系）。

3、自动化：机器学习减少了人工/手工解决问题的需要，使计算机能够自动从数据中学习和改进，从而在生活中替代人工操作，提升效能。

4、适应性：机器学习模型可以适应新的数据（即泛化能力），这也是其能够广泛应用于业务实践中的重要原因。

三、机器学习的主要分支

1、监督学习：有监督的机器学习指的是模型从标记的训练数据中学习，并尝试预测未见过数据的标签（即训练数据是有标签的）。

2、无监督学习：模型在没有标签的数据上进行训练，试图发现数据中的结构和模式。比如聚类学习，模型不需要关注数据是否有标签，仅仅通过特定的指标（如余弦相似度等）对样本进行类别聚合。

3、半监督学习：半监督学习结合少量标记数据和大量未标记数据进行学习，涉及多种算法，包括自训练（Self-training）、标签传播（Label Propagation）、伪标签（Pseudo-Labeling）、一致性正则化（Consistency Regularization）等。

4、强化学习：模型通过与环境的交互来学习，目标是最大化某种累积奖励。

5、深度学习：一种特殊的机器学习方法，使用多层神经网络来学习数据的复杂模式。

四、机器学习与深度学习

深度学习虽然从概念上是机器学习的子集，但笔者感觉深度学习在某些场合已经与机器学习有一定的界限了。比如在实际工作中，我们说用了一些机器学习模型，对方想到的基本都是逻辑回归、决策树、支持向量机等模型，却并不会想到CNN、LSTM这样的神经网络（对于这些模型，我们会说用了神经网络/深度学习模型）。因此，还是有必要对机器学习和深度学习做一个简单的对比：

1、特征工程

（1）机器学习：对数据质量要求高，往往需要大量的特征工程选出有效特征；

（2）深度学习：特征工程显得不那么重要，部分场景下可以直接对数据建模；

2、模型复杂度

（1）机器学习：模型复杂度较低，参数较少，可解释性强；

（2）深度学习：参数量较大，模型的决策过程存在“黑匣子”问题，可解释性较差；

3、计算资源

（1）机器学习：计算资源需求低，消费级cpu即可，推理速度快；

（2）深度学习：计算资源要求高，部分模型需要GPU加速运算，推理速度相对较慢；

五、总结

不论是机器学习模型还是深度学习模型都各有其优劣，我们很难说深度学习模型一定比机器学习模型要好，在实际工作中我们也不会一上来就用神经网络。具体问题还是要具体分析，很多时候我们会同时进行机器学习和深度学习的建模，比较更优者进行后续的优化和部署。有时候，对于标签量小、特征数少、特征取值有限的数据，机器学习模型表现远优于深度学习，果然你大爷还是你大爷！

原文地址：https://blog.csdn.net/ChaneMo/article/details/142359231

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：开源项目 GAN 漫画风格化 UGATIT
下一篇：开源呼吸机设计- 基于TMC4671

QML使用Qt自带软键盘例子
VirtualKeyboardSettings.locale = "eesti" // 复古键盘样式。// 这种集成方式下点击隐藏键盘的按钮是没有效果的，只会改变active，因此
阅读更多2024-09-28
Pinia只能存储简单数据类型
Pinia是一个Vue的状态管理库，它允许开发者跨组件或页面共享状态。为了实现数据的持久化，即让数据在页面刷新或重新加载后依然保持，可以使用pinia-plugin-persistedstate插件。
阅读更多2024-09-28
Maven常见解决方案
idea中maven本地仓库jar包打包失败和无法引用的问题解决_java_脚本之家
阅读更多2024-09-28
无线感知会议系列【4】【基于WiFi和4G/5G的非接触无线感知：挑战、理论和应用-2】
本篇重点分享一下该论文接 2020年北京智源大会张大庆老师的一个报告。
阅读更多2024-09-28
ResNet50V2:口腔癌分类
本文为为内部文章原作者：K同学啊。
阅读更多2024-09-28
【AI大模型】Kimi API大模型接口实现
Kimi API 是一套基于RESTful风格的大模型调用接口，支持文本生成、语音合成、图像识别等任务。开发者可以通过简单的API调用，快速地将AI大模型功能集成到自己的应用中。多模型支持：支持多个大
阅读更多2024-09-28
【C++】模板、宏、命名空间、
模板就是基于你给定的一套规则让编译器为你写代码。或者通俗的说就是，你写个模板，里面抠出一些空，这些空填上不同的东西，就是一个可用的对象。或者我举个例子，比如开发票，其实发票的格式都是一样的，只有抬头、
阅读更多2024-09-28
【锁住精华】MySQL锁机制全攻略：从行锁到表锁，共享锁到排他锁，悲观锁到乐观锁
是最低粒度的的锁，锁住指定行的数据，加锁的开销较大，加锁较慢，可能会出现死锁的情况，锁的竞争度会较低，并发度相对较高。但是如果where条件里的字段没有加索引，则加的行锁会自动升级为表锁，因为行锁是基
阅读更多2024-09-28
校园外卖系统SpringBoot免费分享
今天我们分享一个非常实用的校园外卖系统，基于 SpringBoot 和 Vue 的开发。这一系统源于黑马的瑞吉外卖案例项目，经过站长的进一步改进和优化，提供了更丰富的功能和更高的可用性。
阅读更多2024-09-28
vue3 vite模式配置测试，开发、生产环境以及代理配置
vue3 vite模式配置测试，开发、生产环境以及代理配置
阅读更多2024-09-28