自学内容网 自学内容网

机器学习的基本概述

概念

        人工智能、机器学习、深度学习的关系:机器学习是人工智能的一个分支, 深度学习是实现机器学习的一种技术。

        机器学习研究的是如何让计算机模拟人类学习,通过大量数据发现规律、提取知识,并不断改进自身能力。它是机器获取知识的关键途径,赋予计算机类似人类的学习能力,以实现人工智能的目标。

机器学习模型 = 数据 + 机器学习算法

  • 基于规则的学习:在机器学习出现之前,预测通常依赖于明确的、可解释的规则。这些规则是基于专家经验和数据分析手工制定的
  • 基于模型的学习:通过编写机器学习程序,使机器从历史数据中学习和训练模型

       机器学习的数据集描述:

       假设我们要构建一个模型来预测房屋价格:

  • 样本:每个房屋作为一个样本。
  • 特征:房屋的大小、位置、卧室数量、浴室数量等。
  • 目标:房屋的销售价格。
  • 训练集:包含已知房屋销售价格的数据样本及其特征。
  • 测试集:包含未知房屋销售价格的数据样本及其特征,用于评估模型预测的准确性。

        学习机器学习的两个重要目的:利用机器学习对数据进行价值化提取;实现数据的预测和规范性分析。

分类

        机器学习分为:

  • 监督学习:任务驱动——分类、回归
  • 无监督学习:数据驱动——聚类、降维
  • 强化学习:算法学习对环境做出反应
输入输出目的案例
监督学习有标签有反馈预测结果鸢尾花分类、房价预测
无监督学习无标签无反馈发现潜在结构物以类聚、人以群分
半监督学习部分有标签有反馈降低数据标记难度
强化学习决策流程和激励系统一系列行动长期利益最大化学下棋

开发环境

        scikit-learn 的主要功能:

  • 分类:支持 SVM、KNN、随机森林等多种分类算法。
  • 回归:支持线性回归、岭回归、Lasso 等回归算法。
  • 聚类:提供 K-means、层次聚类、DBSCAN 等聚类方法。
  • 降维:包括 PCA、LDA 等降维技术。
  • 模型选择:支持交叉验证、网格搜索等模型选择方法。
  • 预处理:数据标准化、缺失值处理、特征选择等预处理工具。

 

 


原文地址:https://blog.csdn.net/weixin_74254879/article/details/140360191

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!