机器学习的基本概述
概念
人工智能、机器学习、深度学习的关系:机器学习是人工智能的一个分支, 深度学习是实现机器学习的一种技术。
机器学习研究的是如何让计算机模拟人类学习,通过大量数据发现规律、提取知识,并不断改进自身能力。它是机器获取知识的关键途径,赋予计算机类似人类的学习能力,以实现人工智能的目标。
机器学习模型 = 数据 + 机器学习算法
- 基于规则的学习:在机器学习出现之前,预测通常依赖于明确的、可解释的规则。这些规则是基于专家经验和数据分析手工制定的
- 基于模型的学习:通过编写机器学习程序,使机器从历史数据中学习和训练模型
机器学习的数据集描述:
假设我们要构建一个模型来预测房屋价格:
- 样本:每个房屋作为一个样本。
- 特征:房屋的大小、位置、卧室数量、浴室数量等。
- 目标:房屋的销售价格。
- 训练集:包含已知房屋销售价格的数据样本及其特征。
- 测试集:包含未知房屋销售价格的数据样本及其特征,用于评估模型预测的准确性。
学习机器学习的两个重要目的:利用机器学习对数据进行价值化提取;实现数据的预测和规范性分析。
分类
机器学习分为:
- 监督学习:任务驱动——分类、回归
- 无监督学习:数据驱动——聚类、降维
- 强化学习:算法学习对环境做出反应
输入 | 输出 | 目的 | 案例 | |
监督学习 | 有标签 | 有反馈 | 预测结果 | 鸢尾花分类、房价预测 |
无监督学习 | 无标签 | 无反馈 | 发现潜在结构 | 物以类聚、人以群分 |
半监督学习 | 部分有标签 | 有反馈 | 降低数据标记难度 | |
强化学习 | 决策流程和激励系统 | 一系列行动 | 长期利益最大化 | 学下棋 |
开发环境
scikit-learn 的主要功能:
- 分类:支持 SVM、KNN、随机森林等多种分类算法。
- 回归:支持线性回归、岭回归、Lasso 等回归算法。
- 聚类:提供 K-means、层次聚类、DBSCAN 等聚类方法。
- 降维:包括 PCA、LDA 等降维技术。
- 模型选择:支持交叉验证、网格搜索等模型选择方法。
- 预处理:数据标准化、缺失值处理、特征选择等预处理工具。
原文地址:https://blog.csdn.net/weixin_74254879/article/details/140360191
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!