【机器学习】代价函数的几种误差以及代价函数的几个简单示例

🕗 发布于 2024-07-25 09:03 机器学习 人工智能 学习 开发语言 numpy

引言

在机器学习中，代价函数（Cost Function）是一个评估模型性能的关键工具，它衡量了模型预测值与实际值之间的差异。代价函数通常用于监督学习，特别是在需要预测目标值的情况下，如回归问题或分类问题

文章目录

引言
一、代价函数的几种误差
二、代价函数的功能
三、代价函数的使用方法
四、代价函数的示例

一、代价函数的几种误差

1.1 均方误差（Mean Squared Error, MSE）

$\frac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2$
其中 $y_i$ 是实际值， $\hat{y}_i$ 是预测值， $n$ 是数据点的数量。MSE 被广泛用于回归问题

1.2 均方根误差（Root Mean Squared Error, RMSE）

$\sqrt{MSE}$
RMSE 是 MSE 的平方根，它提供了与原始数据单位一致的误差度量

1.3 平均绝对误差（Mean Absolute Error, MAE）

$\frac{1}{n}\sum_{i=1}^{n}|\,y_i - \hat{y}_i\,|$
MAE 计算了预测值与实际值之间差的绝对值的平均

1.4 交叉熵（Cross-Entropy）

对于二分类问题，交叉熵通常表示为：
$\hat{y}) = -\frac{1}{n}\sum_{i=1}^{n}[y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i)]$
其中 $y_i$ 是实际的标签（0 或 1）， $\hat{y}_i$ 是预测的概率。交叉熵用于分类问题，尤其是当输出是概率分布时

1.5 对数似然损失（Log-Likelihood Loss）

在某些情况下，特别是涉及到概率模型时，会使用对数似然损失
代价函数的选择取决于具体问题，包括问题的类型（回归或分类）、数据的分布以及我们希望模型优化的目标。在训练过程中，我们通常通过最小化代价函数来调整模型参数，从而提高模型的预测性能

二、代价函数的功能

代价函数的主要功能是

提供了一种量化模型预测误差的方法。
在训练过程中，通过最小化代价函数，可以优化模型的参数，从而改善模型的预测性能。

三、代价函数的使用方法

使用代价函数的步骤通常包括：

定义代价函数：根据你的模型和数据，选择合适的代价函数。
计算代价：使用代价函数来计算模型在训练数据上的预测误差。
优化代价：通过调整模型的参数（如权重和偏置），以最小化代价函数，从而优化模型。

四、代价函数的示例

示例 1: 线性回归 - 均方误差 (MSE)

线性回归是一种用于预测连续目标的模型。在这个示例中，我们将使用均方误差 (MSE) 作为代价函数

假设我们有一个线性回归模型 𝑓(𝑥)=𝑤𝑥+𝑏，其中 𝑤 和 𝑏 是模型的参数。我们的目标是找到一组参数 𝑤 和 𝑏，使得模型的预测尽可能接近实际值。
MSE 代价函数定义如下：
$\frac{1}{2m} \sum_{i=1}^{m} (f(x_i) - y_i)^2$
其中：

m 是训练数据的数量。
$x_i$ 和 $y_i$ 分别是第 $i$ 个训练样本的输入和目标值。
$f(x_i)$ 是模型对第 $i$ 个样本的预测值。
为了找到最优的 $w$ 和 $b$ ，我们需要最小化代价函数 $J (w, b)$ 。这通常通过梯度下降等优化算法来实现。
在Python中，我们可以使用NumPy库来定义代价函数并计算它：

import numpy as np
# 假设我们有以下数据
x = np.array([1, 2, 3, 4, 5])
y = np.array([2, 4, 5, 4, 5])
# 定义线性回归模型
def linear_regression(x, w, b):
    return w * x + b
# 定义均方误差代价函数
def mse_cost(w, b, x, y):
    m = len(x)
    cost = 0.5 * sum((linear_regression(x[i], w, b) - y[i]) ** 2 for i in range(m))
    return cost
# 初始化参数
w = 0
b = 0
# 计算代价
cost = mse_cost(w, b, x, y)
print(f"初始代价: {cost}")

在这个示例中，我们定义了一个简单的代价函数，并用一些示例数据来计算初始代价
在实际应用中，我们通常会使用更复杂的代价函数，并且通过优化算法来找到最小化代价的参数
当然可以。我将提供几个不同的机器学习模型及其对应的代价函数的示例，并详细解释每个示例。

在这个示例中，我们定义了一个简单的线性回归模型和一个均方误差代价函数。代价函数计算模型在给定数据上的预测误差

示例 2: 逻辑回归 - 对数损失 (Log Loss)

逻辑回归是一种用于预测二分类问题的模型。在这个示例中，我们将使用对数损失 (Log Loss) 作为代价函数

import numpy as np
# 假设我们有以下数据
y = np.array([0, 1, 0, 1, 1])  # 真实的标签
y_pred = np.array([0.1, 0.9, 0.2, 0.8, 0.7])  # 模型的预测概率
# 定义对数损失代价函数
def log_loss(y_true, y_pred):
    m = len(y_true)
    cost = -1/m * sum(y_true[i] * np.log(y_pred[i]) + (1 - y_true[i]) * np.log(1 - y_pred[i]) for i in range(m))
    return cost
# 计算代价
cost = log_loss(y, y_pred)
print(f"初始代价: {cost}")

在这个示例中，我们定义了一个简单的逻辑回归模型和一个对数损失代价函数
代价函数计算模型在给定数据上的预测概率与真实标签之间的差异

示例 3: 支持向量机 (SVM) - hinge 损失

支持向量机 (SVM) 是一种用于解决分类问题的模型。在这个示例中，我们将使用 hinge 损失作为代价函数。

import numpy as np
# 假设我们有以下数据
y = np.array([1, -1, 1, -1, 1])  # 真实的标签
y_pred = np.array([1, -1, 1, 1, 1])  # 模型的预测标签
# 定义 hinge 损失代价函数
def hinge_loss(y_true, y_pred, margin):
    m = len(y_true)
    cost = sum(max(0, 1 - y_true[i] * y_pred[i]) for i in range(m)) / m
    return cost
# 计算代价
cost = hinge_loss(y, y_pred, 1)
print(f"初始代价: {cost}")

在这个示例中，我们定义了一个简单的支持向量机模型和一个 hinge 损失代价函数代价函数计算模型在给定数据上的预测标签与真实标签之间的差异
这些示例展示了不同类型的机器学习模型及其对应的代价函数。通过调整模型参数我们可以最小化代价函数，从而提高模型的性能

原文地址：https://blog.csdn.net/m0_49243785/article/details/140674236

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：C语言之理解指针（1）
下一篇：机器学习中的 K-均值聚类算法及其优缺点

excel如何快速选中某个数字或者某串数字
鼠标光标放在某个数字或者某串数字的末尾，进行双击鼠标左键即可（就会选中当前鼠标光标前相邻的所有数字）：
阅读更多2024-09-17
面试官问：请描述一次你成功解决问题的经历？
面试官为什么要这么问？面试官问你描述一次成功解决问题的经历，主要是为了评估你的几个关键方面：问题解决能力：了解你在面对挑战时的思维方式和应对策略。决策能力：考察你在压力下做出明智决定的能力。沟通技巧：
阅读更多2024-09-17
VLMEvalKit 评测实践:InternVL2 VS Qwen2VL
多模态技术的突破，正在改变我们理解和交互世界的方式。无论是强大的感知能力、复杂的推理分析，还是图文融合的创新应用，InternVL2 与 Qwen2-VL 展现了大模型的无限可能。
阅读更多2024-09-17
mybatis开启日志
步骤很详细，直接上教程……
阅读更多2024-09-17
MySQL——数据库的高级操作（一）数据备份与还原（1）数据的备份
MySQL——数据库的高级操作（一）数据备份与还原（1）数据的备份
阅读更多2024-09-17
Blender渲染太慢怎么办？blender云渲染已开启
此次，渲染101云渲染农场正式加入了对Blender的全面支持，涵盖Blender的所有版本，不论是较新的Blender 4.0还是早期版本，都可轻松对接渲染101平台服务。不论是小型独立项目还是大型
阅读更多2024-09-17
ubuntu安装mysql 8.0忘记root初始密码，如何重新修改密码
修改my.cnf文件，在文件新增 skip-grant-tables，在启动mysql时不启动grant-tables，授权表。5.注释掉skip-grant-tables后重启mysql。2、修改m
阅读更多2024-09-17
JVM面试真题总结（十一）
总的来说，Java内存模型主要解决了多线程环境下共享数据的一致性、可见性等问题，是Java并发编程的基础。这种模型的好处是，由于启动类加载器是最顶部的加载器，因此它加载的都是最可信任的类库（Java的
阅读更多2024-09-17
Ubuntu 软件仓库镜像使用帮助
选择镜像。
阅读更多2024-09-17
用于稀疏自适应深度细化的掩码空间传播网络 CVPR2024
图像引导的深度补全是一项通过利用稀疏深度测量和RGB图像来估计密集深度图的任务；它通过估算深度来填充未测量的区域。由于许多深度传感器（如LiDAR和飞行时间相机（ToF））只能提供稀疏的深度图，这项任
阅读更多2024-09-17