实战深度学习--进行蘑菇分类

🕗 发布于 2024-07-26 11:28 深度学习 分类 人工智能

数据集：https://pan.quark.cn/s/4d3526600c0c

概述

本笔记将介绍如何使用Python和深度学习库（如TensorFlow和Keras）来构建一个卷积神经网络（CNN）模型，以区分可食用和有毒的蘑菇。我们将从数据准备、模型构建、训练和评估等方面进行详细说明。

1. 导入必要的库

os: 用于文件路径操作。
cv2: OpenCV库，用于图像处理。
numpy: 用于数值计算。
train_test_split和LabelEncoder: 来自sklearn，用于数据集划分和标签编码。
Sequential, Conv2D, MaxPooling2D, Flatten, Dense, Dropout: 来自tensorflow.keras，用于构建神经网络。
to_categorical: 用于独热编码。
ImageDataGenerator: 用于数据增强。

2. 设置数据路径和图像大小

设置可食用和有毒蘑菇的图像文件夹路径，并定义图像大小为64x64像素。

edible_path = 'path_to_edible_mushrooms'
poisonous_path = 'path_to_poisonous_mushrooms'
img_size = 64

3. 读取图像并添加标签

遍历图像文件夹，读取图像，调整大小，并将其添加到数据列表中，同时为可食用和有毒蘑菇分配相应的标签。

X = []
y = []

# 读取并添加可食用蘑菇图像和标签
# ...

# 读取并添加有毒蘑菇图像和标签
# ...

4. 转换数据为NumPy数组

将图像列表和标签列表转换为NumPy数组，以便于后续处理。

X = np.array(X)
y = np.array(y)

5. 标签编码和独热编码

使用LabelEncoder将标签转换为数值，然后使用to_categorical进行独热编码。

le = LabelEncoder()
y = le.fit_transform(y)
y = to_categorical(y, 2)

6. 划分数据集

使用train_test_split将数据集划分为训练集和测试集。

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

7. 数据增强

使用ImageDataGenerator进行数据增强，包括旋转、平移和翻转。

datagen = ImageDataGenerator(
    rotation_range=20,
    width_shift_range=0.2,
    height_shift_range=0.2,
    horizontal_flip=True
)
datagen.fit(X_train)

8. 构建CNN模型

使用Sequential模型和不同的层（如Conv2D, MaxPooling2D, Flatten, Dense）构建CNN。

model = Sequential([
    # ...
    Dense(2, activation='softmax')
])

9. 编译模型

使用adam优化器和categorical_crossentropy损失函数编译模型。

model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

10. 训练模型

使用训练数据和数据增强训练模型。

history = model.fit(datagen.flow(X_train, y_train, batch_size=32), epochs=25, validation_data=(X_test, y_test))

11. 评估模型

评估模型在测试集上的性能。

loss, accuracy = model.evaluate(X_test, y_test)
print(f'Test accuracy: {accuracy:.2f}')

12. 打印分类报告

使用classification_report打印详细的分类性能报告。

y_pred = model.predict(X_test)
y_pred_classes = np.argmax(y_pred, axis=1)
y_true = np.argmax(y_test, axis=1)
print(classification_report(y_true, y_pred_classes, target_names=le.classes_))

13. 总代码

# 用于操作系统功能，如文件路径操作
import os
# OpenCV库的Python接口，用于图像处理
import cv2
import numpy as np
from sklearn.model_selection import train_test_split
# 用于将标签转换为数值编码
from sklearn.preprocessing import LabelEncoder
# 创建Keras模型的线性堆叠层结构
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
# 将整数类别标签转换为二进制矩阵（独热编码）
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.preprocessing.image import ImageDataGenerator
# 数据路径
edible_path = r'Mushroom dataset\Edible'
poisonous_path = r'Mushroom dataset\Poisonous'
# 图像大小
img_size = 64
# 初始化数据和标签列表
X = []
y = []
# 读取可食用蘑菇图片并添加标签
for filename in os.listdir(edible_path):
    img_path = os.path.join(edible_path, filename)
    image = cv2.imread(img_path)
    if image is not None:
        image = cv2.resize(image, (img_size, img_size))
        X.append(image)
        y.append('Edible')
# 读取毒蘑菇图片并添加标签
for filename in os.listdir(poisonous_path):
    img_path = os.path.join(poisonous_path, filename)
    image = cv2.imread(img_path)
    if image is not None:
        image = cv2.resize(image, (img_size, img_size))
        X.append(image)
        y.append('Poisonous')
# 转换为numpy数组
X = np.array(X)
y = np.array(y)
# 标签编码
le = LabelEncoder()
y = le.fit_transform(y)
y = to_categorical(y, 2)
# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 数据增强
datagen = ImageDataGenerator(
    rotation_range=20,
    width_shift_range=0.2,
    height_shift_range=0.2,
    horizontal_flip=True
)
datagen.fit(X_train)
# 构建CNN模型
model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(img_size, img_size, 3)),
    MaxPooling2D((2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Conv2D(128, (3, 3), activation='relu'),
    MaxPooling2D((2, 2)),
    Flatten(),
    Dense(512, activation='relu'),
    Dropout(0.5),
    Dense(2, activation='softmax')
])
# 编译模型
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
# 训练模型
history = model.fit(datagen.flow(X_train, y_train, batch_size=32), epochs=25, validation_data=(X_test, y_test))
# 评估模型
loss, accuracy = model.evaluate(X_test, y_test)
print(f'Test accuracy: {accuracy:.2f}')
# 打印分类报告
y_pred = model.predict(X_test)
y_pred_classes = np.argmax(y_pred, axis=1)
y_true = np.argmax(y_test, axis=1)
from sklearn.metrics import classification_report
print(classification_report(y_true, y_pred_classes, target_names=le.classes_))

结论

通过上述步骤，我们构建了一个能够区分可食用和有毒蘑菇的CNN模型。模型经过数据增强和多轮训练后，在测试集上达到了较高的准确率。分类报告提供了模型性能的详细分析，有助于进一步优化模型。

这份笔记提供了一个完整的流程，从数据准备到模型训练和评估，为使用深度学习进行图像分类提供了一个实用的参考。

原文地址：https://blog.csdn.net/mmd666/article/details/140692699

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：《Milvus Cloud向量数据库指南》——BGE-M3：多功能、多语言、多粒度的文本表示学习模型
下一篇：基于 HTML+ECharts 实现智慧销售数据可视化大屏（含源码）

代码随想录算法训练营第十六天|513. 找树左下角的值 112. 路径总和 106. 从中序与后序遍历序列构造二叉树
二叉树day4，涉及到一点点最简单的回溯
阅读更多2024-10-18
【学习】word保存图片
直接右键另存为的话，文件总是不清晰，截屏的话，好像也欠妥。可以另存为网页 .html。word中有想保存的照片。原图就放到了文件夹里面。
阅读更多2024-10-18
群晖前面加了雷池社区版，安装失败，然后无法识别出用户真实访问IP
有nas的相信对公网都不模式，在现在基础上传带宽能有100兆的时代，有公网代表着家里有一个小服务器，像百度网盘，优酷这种在线服务都能部署为私有化服务。但现在运营商几乎不可能提供公网ip，要么自己买个云
阅读更多2024-10-18
探索光耦：光耦——不间断电源（UPS）系统中的安全高效卫士
综上，光耦在不间断电源（UPS）系统中的应用，不仅提升了系统的安全性和可靠性，还为电源管理和信号传输提供了坚实保障。光耦通过光信号传输控制信号，确保信号在高频切换中保持稳定与准确，如电源切换时，光耦能
阅读更多2024-10-18
JavaFX学习系列--第一章: 简单Fx界面
版本为jdk8 （因为jdk8已经内置JavaFX库，高版本JDK中被剥离，需要额外下载jar 包），https://oc.gdufs.edu.cn 教学资源站点可下载JDK8（如果使用下面所述的i
阅读更多2024-10-18
力扣简单 876.快慢指针
while(fast!= null){
阅读更多2024-10-18
React 项目热更新失效问题的解决方案和产生的原因
通过以上的依赖升级、编码注意事项和预防措施，我们成功修复了 React 项目热更新失效的问题，并且为后续开发规避了类似的问提。在修复React项目热更新失效的问题时，经过一系列问题排查和依赖升级，最终
阅读更多2024-10-18
list转map常用方法
account -> account是一个返回本身的lambda表达式，其实还可以使用Function接口中的一个默认方法 Function.identity()，这个方法返回自身对象，更加简洁
阅读更多2024-10-18
Java 中简化操作集合的方法
通过本文的介绍，我们了解了如何在 Java 中简化集合操作，特别是在 Java 8 之后，StreamAPI 提供了一种更具表现力和简洁性的编程方式。与传统的显式循环和条件判断相比，使用流操作可以让代
阅读更多2024-10-18
vue3基础入门以及常用api使用
多个页面需要同一个功能就可以使用hooks,而且hooks里边能使用钩子例如onMounted等，还能用computeduseSum.ts。
阅读更多2024-10-18