机器学习(2):机器学习的相关术语
场景示例:
你周日约了小李、老王打牌,小李先来了,老王没来。你想打电话叫老王过来。小李说:“你别打电话啦,昨天老王喜欢的球队皇马输球了,他的项目在上个礼拜也没成功上线,再加上他儿子期末考试不及格,他肯定没心情来。
”这种情况下,你觉得老王会来吗?一般情况下,我们都会觉得老王大概率不会来了。不过,你有想过我们是怎么得出这个结论的吗?
要预测老王的状况,我们就需要建立一个“预测老王会不会来”的函数,而“皇马输赢”、“项目情况”、“儿子成绩”都是输入到这个函数的自变量,我们设为 x1, x2, x3。这些自变量每一个发生变化,都会影响到函数的结果,也就是因变量 y。
相关术语:
特征:即自变量,上述例子中的“皇马输赢”、“项目情况”、“儿子成绩”都是自变量
标签:即因变量,上述例子中的“老王会来”,“老王不会来”即为标签
数据集:一批历史特征和一批历史标签的集合
训练(拟合):在已知数据集的基础上,通过反复的计算,选择最贴切的函数来描述自变量和因变量之间的因果关系。
训练数据集:最初用来训练的数据集
验证和评估:用另一批同类数据集来测试机器能否通过找到的函数推出这批数据的标签。
验证数据集:验证和评估中用到的另一批的同类数据集
测试数据集:已找到的函数在通过验证和评估后,使用测试数据集做最终的测试。
原文地址:https://blog.csdn.net/m0_55939576/article/details/142621236
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!