TensorFlow与Pytorch的转换——2手写数字识别

🕗 发布于 2024-10-07 21:32 tensorflow pytorch 人工智能 计算机视觉

数据处理

import tensorflow as tf

mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 将像素值缩放到0到1之间
x_train, x_test = x_train / 255.0, x_test / 255.0

# 将标签转换为one-hot编码
y_train = tf.keras.utils.to_categorical(y_train, num_classes=10)
y_test = tf.keras.utils.to_categorical(y_test, num_classes=10)

构建模型

model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

训练模型

model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])
model.fit(x_train, y_train, epochs=10)

测试模型

test_loss, test_acc = model.evaluate(x_test, y_test)
print('Test accuracy:', test_acc)

import matplotlib.pyplot as plt
import numpy as np

predictions = model.predict(x_test)


# 随机选择一些测试图像
indices = np.random.choice(range(len(x_test)), 10)

predictions = model.predict(x_test)
fig, axs = plt.subplots(2,5, figsize=(20,8))

# 可视化测试图像及其预测标签
for i, ax in zip(indices, axs.flatten()):
    ax.imshow(x_test[i], cmap='gray')
    ax.set_title(f"Predicted label: {np.argmax(predictions[i])}")
plt.show()

Pytorch版本

import torch  
import torch.nn as nn  
import torch.optim as optim  
import torchvision  
import torchvision.transforms as transforms  
import matplotlib.pyplot as plt  
import numpy as np  
  
# 加载MNIST数据集  
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])  
trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)  
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True)  
  
testset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)  
testloader = torch.utils.data.DataLoader(testset, batch_size=64, shuffle=False)  
  
# 定义神经网络模型  
class Net(nn.Module):  
    def __init__(self):  
        super(Net, self).__init__()  
        self.fc1 = nn.Linear(28*28, 128)  
        self.fc2 = nn.Linear(128, 64)  
        self.fc3 = nn.Linear(64, 10)  
  
    def forward(self, x):  
        x = x.view(-1, 28*28)  # 将图像展平为向量  
        x = torch.relu(self.fc1(x))  
        x = torch.relu(self.fc2(x))  
        x = torch.softmax(self.fc3(x), dim=1)  # 使用softmax输出概率分布  
        return x  
  
net = Net()  
  
# 定义损失函数和优化器  
criterion = nn.CrossEntropyLoss()  # 注意：CrossEntropyLoss内部进行了log_softmax操作，因此输出层不需要再softmax  
optimizer = optim.Adam(net.parameters(), lr=0.001)  
  
# 训练模型  
for epoch in range(10):  # 迭代10个epoch  
    running_loss = 0.0  
    for i, data in enumerate(trainloader, 0):  
        inputs, labels = data  
        optimizer.zero_grad()  # 清空梯度  
        outputs = net(inputs)  # 前向传播  
        loss = criterion(outputs, labels)  # 计算损失  
        loss.backward()  # 反向传播  
        optimizer.step()  # 更新参数  
        running_loss += loss.item()  
    print(f'Epoch [{epoch+1}/10], Loss: {running_loss/len(trainloader):.4f}')  
  
# 在测试集上评估模型  
correct = 0  
total = 0  
with torch.no_grad():  # 评估模式，不需要计算梯度  
    for data in testloader:  
        images, labels = data  
        outputs = net(images)  
        _, predicted = torch.max(outputs.data, 1)  
        total += labels.size(0)  
        correct += (predicted == labels).sum().item()  
  
print(f'Accuracy of the network on the 10000 test images: {100 * correct / total:.2f}%')  
  
# 可视化测试图像及其预测标签  
predictions = []  
test_images, test_labels = next(iter(testloader))  # 一次性加载整个测试集可能会占用大量内存，这里只取一个batch  
with torch.no_grad():  
    test_outputs = net(test_images)  
    _, predicted_labels = torch.max(test_outputs, 1)  
    predictions.append(predicted_labels.numpy())  
  
predictions = np.concatenate(predictions)  # 虽然这里只有一个batch，但为了与TensorFlow代码风格一致，仍然使用concatenate  
indices = np.random.choice(range(len(test_images)), 10)  
  
fig, axs = plt.subplots(2, 5, figsize=(20, 8))  
for i, ax in zip(indices, axs.flatten()):  
    ax.imshow(test_images[i].squeeze().numpy(), cmap='gray')  # 转换回numpy数组并去除多余的维度  
    ax.set_title(f"Predicted label: {predictions[i]}")  
plt.show()

原文地址：https://blog.csdn.net/Zsusan7/article/details/142734421

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：MathType快捷键
下一篇：【浏览器】HTTP 状态码

Spring WebFlux 响应式概述(1)
响应式编程是使用异步、事件驱动构建非阻塞式应用的，此类应用仅需要少量的线程用于横向扩展。该定义的关键一点是：借助背压技术，防止生产者压垮消费者。如服务A需要从服务B获取数据。对于响应式编程，服务A向服
阅读更多2024-10-09
ADAS中的安全性功能与舒适性功能总结
请注意，一些功能如自适应巡航控制（ACC）和交通拥堵辅助（TJA）既有安全性也有舒适性，既能提高驾驶安全又能减轻驾驶负担。
阅读更多2024-10-09
TCP（Transmission Control Protocol，传输控制协议）整理
TCP（Transmission Control Protocol，传输控制协议）是一种面向连接的、可靠的传输协议，它是OSI（Open System Interconnection，开放式系统互联）
阅读更多2024-10-09
网页前端开发之Javascript入门篇(8/9)：数组
什么是数组？答：数组是一种数据结构，它对应生活中的一种现象就是：队列。换句话说：数组在编程中就是用来存储带有队列特征的数据。
阅读更多2024-10-09
rpm软件包的制作方法
源码包制作成rpm包可以在centos系列系统上平移其他机器需要这个环境把包发过去就可以yum -y installnew_pkg_namerpm安装比较方便rpm包构建过程：第一步下载targz源码
阅读更多2024-10-09
成像基础 -- 景深计算
在这个例子中，当使用 50mm 焦距、f/2.8 光圈值，并对焦在 2 米远的物体上时，总景深约为45.92米前景深（最近清晰的距离）为12.08米后景深（最远清晰的距离）为58米。
阅读更多2024-10-09
HarmonyOS学习(十五)——数据管理(四) 用户首选项封装
Arkts preferences进行封装，支持初始化，增加，修改，删除，查询
阅读更多2024-10-09
鸿蒙--知乎评论
这里我们将采用组件化的思想进行开发。
阅读更多2024-10-09
【基础篇】一个键值数据库包含什么？
今天，在构造这个简单的键值数据库时，我们只需要关注整体架构和核心模块。这就相当于医学上在正式解剖人体之前，会先解剖一只小白鼠。我们通过剖析这个最简单的键值数据库，来迅速抓住学习和调优 Redis 的关
阅读更多2024-10-09
【数字图像处理】第2章数字图像处理基础，彩色图像，灰度图像，图像的采样与量化，图像文件格式，灰度直方图
【数字图像处理】第2章数字图像处理基础，彩色图像，灰度图像，图像的采样与量化，图像文件格式，灰度直方图
阅读更多2024-10-09

TensorFlow与Pytorch的转换——2手写数字识别

数据处理

构建模型

训练模型

测试模型

Pytorch版本

相关文章