【机器学习】机器学习基础

🕗 发布于 2024-11-28 19:34 机器学习 人工智能

什么是机器学习？

机器学习（Machine Learning, ML）是一种人工智能（AI）的分支，指计算机通过数据学习规律并做出预测或决策，而无需明确编程。它的核心目标是让机器能够从经验中学习，逐渐提高自身表现。

机器学习的基本分类

根据任务类型，机器学习主要分为以下几类：

监督学习（Supervised Learning）
- 目标：通过已有的标注数据（输入与输出的对应关系）学习一个函数，预测新数据的输出。
- 应用场景：
  - 分类：邮件是否是垃圾邮件（垃圾邮件/非垃圾邮件）
  - 回归：预测房价、股票走势等
- 常用算法：线性回归、逻辑回归、支持向量机、神经网络等。
无监督学习（Unsupervised Learning）
- 目标：处理无标注数据，发现数据的潜在结构或分组规律。
- 应用场景：
  - 聚类：客户分组、图像分割
  - 降维：数据可视化、特征提取
- 常用算法：K-means、主成分分析（PCA）、自编码器等。
强化学习（Reinforcement Learning）
- 目标：通过与环境交互，学习如何采取行动以最大化累计奖励。
- 应用场景：
  - 游戏 AI（如 AlphaGo）
  - 机器人控制
- 常用算法：Q-learning、深度 Q 网络（DQN）、策略梯度方法。
半监督学习（Semi-supervised Learning）
- 目标：结合少量标注数据和大量未标注数据来提高学习效果。
- 应用场景：标注成本高但未标注数据充足的场景（如医学图像分析）。
自监督学习（Self-supervised Learning）
- 目标：通过从数据本身生成伪标签，进行无标注数据的预训练。
- 应用场景：自然语言处理（BERT）、图像识别（SimCLR）。

机器学习的主要步骤

数据准备
- 收集数据：来自数据库、日志或外部来源。
- 数据预处理：清洗、归一化、填补缺失值、特征工程。
模型选择
- 根据任务选择合适的算法（如回归、分类或聚类模型）。
模型训练
- 使用训练集数据调整模型的参数，使其表现最佳。
模型验证
- 通过验证集评估模型性能，调整超参数（如学习率、正则化系数）。
模型测试与部署
- 使用测试集检验模型泛化能力，部署于实际应用中。

常用工具和框架

编程语言：Python（主流）、R、Julia
框架：
- Scikit-learn（经典算法）
- TensorFlow、PyTorch（深度学习）
- XGBoost、LightGBM（梯度提升树）

应用场景

图像识别（如人脸识别、物体检测）
自然语言处理（如机器翻译、文本生成）
推荐系统（如电影推荐、电商个性化推荐）
医疗诊断（如癌症预测、药物研发）
自动驾驶（如路径规划、环境感知）

原文地址：https://blog.csdn.net/IT_ORACLE/article/details/144082390

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：作业3-基于pytorch的非线性模型设计
下一篇：git源码安装

UE5 Line Trace By Channel(通道线条追踪)节点
是一个非常强大的节点，可以广泛应用于射击、检测、交互等场景中。通过合理设置起点、终点、碰撞通道以及处理返回的碰撞信息，你可以实现各种有趣的游戏机制和功能。
阅读更多2024-11-28
23种设计模式-原型(Prototype)设计模式
软考中级-软件设计师原型模式
阅读更多2024-11-28
使用 exe4j 将 Spring Boot 项目打包为 EXE 可执行文件
使用 exe4j 将 Spring Boot 项目打包为 EXE 可执行文件
阅读更多2024-11-28
VOS3000历史话单的非法呼叫话单解决方案，IPSS模块安装详细说明，新增随机端口，新增海外功能，可大幅度提高安全性！
安装之前的准备工作，IPSS是专门为VOS3000设计的服务器安全管理守护者模块，因此在安装之前你需要确保VOS已经安装好并在运行了！到这里就表示已经安装成功了！都是随机的端口，随机的密码，请记录下面
阅读更多2024-11-28
优化DevOps环境中的容器化交付流程：实践指南
优化DevOps环境下的容器交付流程是一个持续迭代的过程，需要企业根据自身业务需求和技术栈不断调整和完善。通过实施标准化环境配置、持续集成/持续部署、强化版本管理和依赖控制、加强安全性以及优化资源分配
阅读更多2024-11-28
nginx静态资源优化配置
三个指令都开的好处：sendfile开启高效的文件传输模式，tcp_nopush开启可以确保在发送到客户端之前数据包已经充分填满，大大减少了网络开销，并加快了文件传输的速度。客户端请求welcome.
阅读更多2024-11-28
容器和它的隔离机制
是一种轻量化的虚拟化技术，它允许多个应用程序共享同一个操作系统（OS）内核，同时为每个应用程序提供自己的运行环境。容器中的进程运行在用户空间，但它们调用的是宿主机的内核空间功能。因此，如果容器中的进程
阅读更多2024-11-28
应急响应靶机——Windows近源攻击
复制粘贴“解题.exe”到本机windows中运行（虚拟机看起来比较难受），不过问的md5是小写，但答案必须填大写。我测，不兼容啊，没事，那就将一些可疑的东西下载到本地windows中，比如桌面上的几
阅读更多2024-11-28
14、保存与加载PyTorch训练的模型和超参数
【代码】14、保存与加载PyTorch训练的模型和超参数。
阅读更多2024-11-28
数据结构：链表进阶
LinkedList的底层是双向链表结构(链表后面介绍)，由于链表没有将元素存储在连续的空间中，元素存储在单独的节点中，然后通过引用将节点连接起来了，因此在在任意位置插入或者删除元素时，不需要搬移元素
阅读更多2024-11-28