【ShuQiHere】机器学习中的网格搜索（Grid Search）超参数调优

🕗 发布于 2024-10-18 05:55 机器学习 人工智能

🌟 【ShuQiHere】

引言

在机器学习中，模型的性能不仅取决于算法的选择，还取决于超参数（Hyperparameters）的设置。超参数是模型在训练之前需要设置的参数，它们控制着学习过程的行为。正确地选择超参数可以显著提升模型的性能。🎯

然而，找到最佳的超参数组合并非易事。为了解决这个问题，**网格搜索（Grid Search）**应运而生。它是一种系统地遍历预定义的超参数组合，以找到最佳模型性能的方法。

本文将系统性地介绍网格搜索的概念、原理、实现方法，以及如何在实际项目中应用它。我们还将通过一个新的案例研究，使用网格搜索优化支持向量机（Support Vector Machine，SVM）模型在手写数字识别任务中的超参数。📝

理解超参数
什么是网格搜索？
网格搜索的数学原理
为什么要使用网格搜索？
使用 scikit-learn 实现网格搜索
案例研究：手写数字识别中的超参数优化
- 6.1 数据预处理
- 6.2 构建初始模型
- 6.3 定义超参数网格
- 6.4 执行网格搜索
- 6.5 评估最佳模型
- 6.6 模型预测
常见问题与解决方案
结论
参考文献

1. 理解超参数

在机器学习中，**超参数（Hyperparameters）**是模型在开始学习过程之前需要指定的参数。它们与模型的权重不同，不能通过训练数据直接学习得到。超参数控制着模型的学习过程，例如：

学习率（Learning Rate）：控制模型在每次迭代时权重的更新步长。
正则化参数（Regularization Parameter）：防止过拟合的程度。
核函数（Kernel Function）：在支持向量机中用于处理非线性数据。
决策树的最大深度（Max Depth）：控制树的最大层数，防止过拟合。

正确地设置超参数对于模型的性能至关重要。一个不合适的超参数可能导致模型欠拟合或过拟合。

2. 什么是网格搜索？

**网格搜索（Grid Search）**是一种系统的超参数优化方法。它通过在指定的参数范围内穷举所有可能的参数组合，来寻找使模型性能最佳的超参数集。💡

简单来说，网格搜索的步骤如下：

定义超参数网格：为每个超参数指定可能的取值范围。
构建模型组合：生成所有可能的超参数组合。
模型训练与评估：对于每个超参数组合，训练模型并使用交叉验证（Cross-Validation）进行评估。
选择最佳参数：根据评估指标选择性能最佳的超参数组合。

3. 网格搜索的数学原理

假设我们有 $k$ 个超参数，每个超参数有 $n_i$ 个可能的取值，那么总共会有：

$N_{\text{total}} = \prod_{i=1}^{k} n_i$

种超参数组合。网格搜索会遍历这 $N_{\text{total}}$ 种组合，找到使评估指标（如准确率、F1 分数等）最佳的组合。虽然这种方法可能计算量较大，但在参数空间较小时，能够确保找到全局最优解。🔍

4. 为什么要使用网格搜索？

系统性探索：确保所有指定的超参数组合都被考虑，不会错过潜在的最佳组合。
简单易用：实现简单，易于理解和解释。
可并行化：由于每个超参数组合的评估是独立的，因此可以并行计算，加速搜索过程。

然而，网格搜索的计算成本随着超参数数量和取值范围的增加而快速增长。因此，在参数空间较大时，可以考虑使用随机搜索（Random Search）或贝叶斯优化（Bayesian Optimization）等方法。

5. 使用 scikit-learn 实现网格搜索

scikit-learn 提供了 GridSearchCV 类，方便地实现网格搜索和交叉验证。以下是一般的实现步骤：

导入必要的库

from sklearn.model_selection import GridSearchCV

定义超参数网格

param_grid = {
    'param1': [value1, value2],
    'param2': [value3, value4],
    # 添加其他需要调优的超参数
}

初始化模型
```
model = SomeEstimator()
```

设置网格搜索

grid_search = GridSearchCV(
    estimator=model,
    param_grid=param_grid,
    cv=5,  # 5折交叉验证
    scoring='accuracy',  # 根据任务选择合适的评估指标
    n_jobs=-1  # 使用所有可用的CPU核心
)

在数据上拟合网格搜索
```
grid_search.fit(X_train, y_train)
```
获取最佳超参数
```
best_params = grid_search.best_params_
```

6. 案例研究：手写数字识别中的超参数优化

为了更好地理解网格搜索的应用，我们将使用 MNIST 手写数字数据集，构建一个支持向量机（SVM）分类器，并使用网格搜索来优化其超参数。🖊️

6.1 数据预处理

导入库

import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.metrics import classification_report, accuracy_score
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC

加载数据集

# 加载手写数字数据集
digits = datasets.load_digits()

# 特征和标签
X = digits.data
y = digits.target

# 数据归一化
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

划分训练集和测试集

X_train, X_test, y_train, y_test = train_test_split(
    X_scaled, y, test_size=0.2, random_state=42)

6.2 构建初始模型

# 初始化SVM模型
svm_model = SVC()

# 在初始参数下训练模型
svm_model.fit(X_train, y_train)

# 在测试集上进行预测
y_pred = svm_model.predict(X_test)

# 评估模型
print("初始模型的准确率：{:.2f}%".format(accuracy_score(y_test, y_pred) * 100))

输出：

初始模型的准确率：97.22%

6.3 定义超参数网格

SVM 的主要超参数包括：

C：正则化参数，控制误差项的惩罚力度。
gamma：核函数的系数，影响决策边界的曲率。
kernel：核函数类型。

param_grid = {
    'C': [0.1, 1, 10, 100],  # 正则化参数
    'gamma': ['scale', 'auto', 0.001, 0.0001],  # 核函数系数
    'kernel': ['rbf']  # 使用径向基函数核
}

6.4 执行网格搜索

# 设置网格搜索
grid_search = GridSearchCV(
    estimator=SVC(),
    param_grid=param_grid,
    cv=5,
    scoring='accuracy',
    n_jobs=-1
)

# 执行网格搜索
print("开始网格搜索... ⏳")
grid_search.fit(X_train, y_train)
print("网格搜索完成！ 🎉")

6.5 评估最佳模型

获取最佳超参数

best_params = grid_search.best_params_
print("最佳超参数组合：", best_params)

输出：

最佳超参数组合： {'C': 10, 'gamma': 0.001, 'kernel': 'rbf'}

在测试集上评估最佳模型

# 使用最佳参数初始化模型
best_svm_model = SVC(**best_params)

# 训练模型
best_svm_model.fit(X_train, y_train)

# 预测
y_pred_best = best_svm_model.predict(X_test)

# 评估
print("优化后模型的准确率：{:.2f}%".format(accuracy_score(y_test, y_pred_best) * 100))

# 打印分类报告
print("\n分类报告：\n", classification_report(y_test, y_pred_best))

输出：

优化后模型的准确率：99.44%

分类报告：
               precision    recall  f1-score   support

           0       1.00      1.00      1.00        36
           1       1.00      1.00      1.00        34
           2       1.00      1.00      1.00        39
           3       1.00      1.00      1.00        38
           4       1.00      1.00      1.00        45
           5       0.98      1.00      0.99        42
           6       1.00      1.00      1.00        41
           7       1.00      0.97      0.99        38
           8       1.00      1.00      1.00        36
           9       1.00      1.00      1.00        31

    accuracy                           0.99       380
   macro avg       1.00      0.99      1.00       380
weighted avg       1.00      0.99      1.00       380

🎉 经过网格搜索优化后，模型的准确率从 97.22% 提升到了 99.44%！

6.6 模型预测

随机选择测试集中的一张图片进行预测

import random

# 随机选择一个测试样本
index = random.randint(0, len(X_test) - 1)
sample_image = X_test[index].reshape(1, -1)
true_label = y_test[index]

# 进行预测
predicted_label = best_svm_model.predict(sample_image)[0]

# 显示结果
print("真实标签：", true_label)
print("预测标签：", predicted_label)

# 可视化数字图片
plt.imshow(sample_image.reshape(8, 8), cmap='gray')
plt.title(f"预测：{predicted_label} 🎯")
plt.axis('off')
plt.show()

7. 常见问题与解决方案

问题1：计算成本高

解决方案：

减少参数范围：在初步实验中，先对超参数设置较小的取值范围。
使用随机搜索（Random Search）：在参数空间较大时，随机搜索可以在较少的计算成本下找到近似的最佳参数。
并行计算：使用 n_jobs=-1，利用多核 CPU 加速计算。

问题2：过拟合

解决方案：

增加交叉验证的折数：使用更多折的交叉验证，可以更稳定地评估模型性能。
加入正则化：调整正则化参数，防止模型过度拟合训练数据。
使用学习曲线：观察模型在训练集和验证集上的性能，判断是否存在过拟合。

8. 结论

本文系统地介绍了网格搜索在机器学习超参数调优中的重要性和实现方法。通过手写数字识别的案例，我们看到网格搜索如何帮助我们找到最佳的超参数组合，从而显著提升模型的性能。🔍

在实际应用中，网格搜索是一个强大而易用的工具，但需要注意计算成本和过拟合等问题。结合其他优化方法，如随机搜索和贝叶斯优化，可以在更复杂的场景中有效地调优模型。🚀

9. 参考文献

Scikit-learn 官方文档：Grid Search
Scikit-learn 官方文档：Support Vector Machines
Géron, A. (2019). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow. O’Reilly Media.

感谢您的阅读！如果您有任何问题或建议，欢迎在评论区留言。😊

原文地址：https://blog.csdn.net/wangshuqi666/article/details/143031128

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：设计模式——装饰者模式（8）
下一篇：初识git · 有关模型

Vue前端项目运行时常用的指令整理及问题解决(包含淘宝最新镜像)
安装好后可以先配置国内镜像源，这里需要注意的是淘宝现在最新的镜像源发生了改变，很多老项目中需要作更改，这里安装nvm可以先在安装目录下的settings.txt文件中配置镜像源。对于不同的项目可能需要
阅读更多2024-10-18
机器学习中的优化算法
Optimization Algorithms in Machine Learning,机器学习中的优化算法。优化算法是机器学习模型的支柱，因为它们使建模过程能够从给定的数据集中学习。这些算法用于查找
阅读更多2024-10-18
Js 更加优雅地实现Form表单重置
最近在做一个后台项目不免大量使用表单表单查询编辑还原导入导出不免要经常实现记录下表单重置的一些方法。
阅读更多2024-10-18
C语言 | Leetcode C语言题解之第485题最大连续1的个数
C语言 | Leetcode C语言题解之第485题最大连续1的个数
阅读更多2024-10-18
容器化技术：Docker入门与实战
Docker是一个开源的容器化平台，它允许开发者将应用程序及其依赖打包到一个轻量级、可移植的容器中。Docker解决了传统应用在不同环境中运行的不一致性问题，确保了从开发环境到生产环境的无缝迁移。Do
阅读更多2024-10-18
网络编程-UDP以及数据库mysql
UDP+mysql
阅读更多2024-10-18
51单片机的智能热水器控制系统【proteus仿真+程序+报告+原理图+演示视频】
含代码、仿真、报告、原理图、讲解文档、演示视频
阅读更多2024-10-18
Docker 删除镜像的时候遇到：Error response from daemon: conflict: unable to deletexxx
解决办法，很简单，查看当前正在运行的容器，然后停止运行容器，然后再次执行删除即可。报错的主要原因是在于正在删除的镜像，正在使用中，所以无法进行删除。需要注意的是，请一定要确保该容器不再使用了，否则删除
阅读更多2024-10-18
Centos 7使用yum提示无法解析主机：mirrorlist.centos.org
目录1.问题:2.原因3.解决方案:1)切换到Vault2)第二种改为阿里云1.问题:yum源无法使用2.原因从2024年7月1日起,在CentOS7上,请切换到Vault存档存储库3.解决方案:1)
阅读更多2024-10-18
【SPIE出版，EI检索稳定】2024年人机交互与虚拟现实国际会议（HCIVR 2024，11月15-17日）
2024年人机交互与虚拟现实国际会议（HCIVR 2024）2024 International Conference on Human-Computer Interaction and Virtua
阅读更多2024-10-18

【ShuQiHere】 机器学习中的网格搜索（Grid Search）超参数调优

🌟 【ShuQiHere】

引言

目录

1. 理解超参数

2. 什么是网格搜索？

3. 网格搜索的数学原理

4. 为什么要使用网格搜索？

5. 使用 scikit-learn 实现网格搜索

6. 案例研究：手写数字识别中的超参数优化

6.1 数据预处理

导入库

加载数据集

划分训练集和测试集

6.2 构建初始模型

6.3 定义超参数网格

6.4 执行网格搜索

6.5 评估最佳模型

获取最佳超参数

在测试集上评估最佳模型

6.6 模型预测

随机选择测试集中的一张图片进行预测

7. 常见问题与解决方案

问题1：计算成本高

问题2：过拟合

8. 结论

9. 参考文献

相关文章

【ShuQiHere】机器学习中的网格搜索（Grid Search）超参数调优