全连接神经网络案例——手写数字识别

🕗 发布于 2024-11-13 01:17 神经网络 人工智能 深度学习

文章目录

1.我们导入需要的工具包
2.数据加载
3.数据处理
4.模型构建
5.模型编译
6.模型训练
7.模型测试
8.模型保存

在这里插入图片描述
使⽤⼿写数字的MNIST数据集如上图所示，该数据集包含60,000个⽤于训练的样本和10,000个⽤于测试的样本，图像是固定⼤⼩(28x28像素)，其值为0到255。

整个案例的实现流程是：

数据加载
数据处理
模型构建
模型训练
模型测试
模型保存

1.我们导入需要的工具包

# 1.导入所需的工具包
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
# 构建模型
from tensorflow.keras.models import Sequential
# 相关的网络层
from tensorflow.keras.layers import Dense, Dropout, Activation, BatchNormalization
# 导入辅助工具包
from tensorflow.keras import utils
# 正则化
from tensorflow.keras import regularizers
# 数据集
from tensorflow.keras.datasets import mnist

2.数据加载

首先我们加载手写数字图像

# 2.数据加载
# 加载数据集
(x_train, y_train), (x_test, y_test) = mnist.load_data()
print(x_train.shape, y_train.shape, x_test.shape, y_test.shape)

在这里插入图片描述
数据展示：

3.数据处理

神经⽹络中的每个训练样本是⼀个向量，因此需要对输⼊进⾏重塑，使每个28x28的图像成为⼀个的784维向量。另外，将输⼊数据进⾏归⼀化处理，从0-255调整到0-1。
在这里插入图片描述
另外对于⽬标值我们也需要进⾏处理，将其转换为热编码的形式（本）：

# 3.数据处理
# 数据维度的调整
x_train = x_train.reshape(60000, 784)
x_test = x_test(10000, 784)
# 数据类型调整
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
# 归一化
x_train = x_train/255
x_test = x_test/255
# 将目标值转换成热编码的形式
y_train = utils.to_categorical(y_train, 10)
y_test = utils.to_categorical(y_test, 10)

4.模型构建

在这⾥我们构建只有3层全连接的⽹络来进⾏处理：
在这里插入图片描述
构建模型如下所示：

# 4.模型构建
# 使用序列模型进行构建
model = Sequential()
# 全连接层，2个隐藏层，一个输出层
# 第一个隐藏层，512个神经元，先BN再激活，随机失活
model.add(Dense(512, input_shape=(784,)))
model.add(BatchNormalization())
model.add(Activation('relu'))
model.add(Dropout(0.2))
# 第二个隐藏层，512个神经元，先BN再激活，随机失活
model.add(Dense(512, kernel_regularizer=regularizers.l2(0.01)))
model.add(BatchNormalization())
model.add(Activation('relu'))
model.add(Dropout(0.2))
# 输出层
model.add(Dense(10, activation='softmax'))
# 查看模型架构
model.summary()

在这里插入图片描述

5.模型编译

设置模型训练使⽤的损失函数交叉熵损失和优化⽅法adam，损失函数⽤来衡量预测值与真实值之间的差异，优化器⽤来使⽤损失函数达到最优：

# 5.模型编译
# 损失函数（交叉熵损失），优化器，评价指标
model.compile(loss=tf.keras.losses.categorical_crossentropy, optimizer=tf.keras.optimizers.Adam(),
              metrics=tf.keras.metrics.Accuracy())

6.模型训练

# 6.模型训练
# 使用fit，指定训练集，epochs，batch_size，val，verbose
history = model.fit(x_train, y_train, epochs=4, batch_size=128, validation_data=(x_test, y_test), verbose=1)

在这里插入图片描述
我们将损失绘制成曲线：

# 绘制损失函数
plt.figure()
plt.plot(history.history['loss'], label='train')
plt.plot(history.history['val_loss'], label='val')
plt.legend()
plt.grid()
plt.show()

在这里插入图片描述

我们再来绘制一下准确率变化曲线：

# 绘制准确率变化曲线
plt.figure()
plt.plot(history.history['accuracy'], label='train')
plt.plot(history.history['val_accuracy'], label='val')
plt.legend()
plt.grid()
plt.show()

在这里插入图片描述
其中，history会保存loss的变化和在compile中指定的评价指标的结果。

7.模型测试

# 7.模型测试
model.evaluate(x_test, y_test, verbose=1)

8.模型保存

# 8.模型保存
model.save("my_model.h5")

之后要是想要想在这个模型时，只需要使用model = tf.keras.models.load_model('my_model.h5')即可。

原文地址：https://blog.csdn.net/qq_59702185/article/details/143595902

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Vue3 组件通信
下一篇：Ansible剧本检测Windows防火墙状态

GOLANG笔记第四周
原本的本地函数放到另一个服务器上运行，但是引入了很多新问题Call 的id映射序列化和反序列化网络传输。
阅读更多2024-11-16
redis集群主备模式的快速搭建
redis主备集群可以有效的实现节点的冗余备份，提高redis的负载压力的同时，又有效的实现了故障切换。
阅读更多2024-11-16
Python实现贪吃蛇经典解压小游戏！附源码
大家应该都玩过诺基亚上面的贪吃蛇吧，那是一段美好的童年回忆，本文将带你一步步用python语言实现一个snake小游戏！版本：Python3●系统：Windows●相关模块：pygamepip ins
阅读更多2024-11-16
Unity中HDRP设置抗锯齿
在Unity的高清渲染管线（HDRP）中，Post Anti-Aliasing（后期抗锯齿）提供了几种不同的抗锯齿选项，以减少图像中的锯齿效果并提升视觉质量。FXAA是一种基于像素的抗锯齿方法，通过模
阅读更多2024-11-16
嘎嘎快充php版服务端部署配置注意玉阳软件
6、需要移除PHP禁用函数：proc_open、pcntl_alarm、pcntl_fork、pcntl_wait、pcntl_signal、pcntl_signal_dispatch。7、不需要cd
阅读更多2024-11-16
Docker 容器常见故障排查及处理
Docker 容器常见故障排查及处理。
阅读更多2024-11-16
Python实现人脸识别算法并封装为类库（续）
本文将介绍如何使用Python实现一个人脸识别系统，并将其封装为一个类库。我们将逐步扩展和完善这个类库，增加代码优化、人脸照片存储到数据库、对特殊场景（如戴口罩、眼镜）的优化，以及灵活的识别距离设置。
阅读更多2024-11-16
CentOS虚拟机使用记录
1.安装 Vmtool ,重启后可显示U盘2.安装minicomcentOs 安装使用yum minicom ,没有apt-get 命令通过ssh网口root 2440ssh root@192.16
阅读更多2024-11-16
MATLAB中的绘图技巧
综上所述，MATLAB凭借其强大的绘图功能，为用户提供了丰富多样的可视化选择。从基础的二维图形到复杂的三维动画，MATLAB都能够胜任。掌握这些绘图技巧，不仅能够提升数据分析的可读性，也能够增强报告和
阅读更多2024-11-16
Win11 终端执行 python xxx.py 没反应
在 Win11 上写了一段 Python 代码来分析日志文件，发现执行没反应。是在 VSCode 里的终端中执行的。, 是 PowerShell；也尝试了 cmd，情况一样。WindowsApps
阅读更多2024-11-16