【机器学习基础】西瓜书阅读笔记task01
机器学习的基本概念
机器学习:研究如何通过计算的手段,利用经验来改善系统自身的性能
计算机系统中,经验通常以数据形式存在。机器学习研究的主要内容:计算机从数据中产生模型的算法,即“学习算法”
把经验(经验数据)提供给这个算法,算法就可以基于数据产生模型,在面对新情况时,模型就会给我们提供相应的判断。机器学习就是研究这种“学习算法”的学问。模型就指从数据中学得的结果。
基本术语
数据集(data set):记录的集合,每条记录是关于一个事件或对象的描述,称为一个示例(instance) 或 样本(sample)
也把一个示例称为一个特征向量,以属性为坐标轴,属性值确定在坐标系中的位置的点
不同学习任务的叫法
欲预测的是离散值:分类(classification)
欲预测的是连续值:回归(regression)
对于分类任务,
只涉及两个类别的“二分类”(binary classfication),两个类通常被称为正类和反类
涉及多个类别:多分类(multi-class classification)
预测任务通常希望对训练集进行学习,建立一个从输入控件到输出空间的映射f
聚类(clustering)将训练集中的西瓜分成若干组,每组称为一个簇(cluster),簇是自动形成的,聚类的依据是我们事先不知道的,而且学习过程中使用的样本通常不拥有标记信息
监督学习和无监督学习:根据训练数据中有无标记信息。
分类和回归是监督学习(supervised learning)的代表,聚类是无监督学习(unsupervised learning)的代表
原文地址:https://blog.csdn.net/m0_52682586/article/details/143755470
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!