AI实现葡萄叶片识别(基于深度学习的葡萄叶片识别)

🕗 发布于 2024-12-13 18:18 人工智能 深度学习 python

基于深度学习的图像识别：葡萄叶片识别

一、项目背景与介绍
图像识别是人工智能（AI）领域的一项关键技术，其核心目标是让计算机具备像人类一样“看”和“理解”图像的能力。借助深度学习、卷积神经网络（CNN）等先进算法，图像识别技术实现了从图像信息的获取到理解的全面提升。近年来，这一技术已在医疗、交通、安防、工业生产等多个领域取得了颠覆性突破，不仅显著提升了社会生产效率，还深刻改变了人们的生活方式。葡萄叶片识别的实际应用场景

农业生产与种植管理
葡萄叶识别技术可以帮助农民快速、准确地识别葡萄的品种和生长状态。通过分类不同种类的葡萄叶，农民可以优化种植策略，合理分配资源（如肥料和水分），从而提高葡萄的产量和品质。此外，该技术还可以用于监测葡萄植株的生长周期，指导科学化管理。
病虫害检测与诊断
通过对葡萄叶的图像进行分析，葡萄叶识别技术可以检测出叶片上是否存在病害或虫害的特征。例如，可以识别霜霉病、白粉病等常见葡萄病害的早期症状，及时提醒农民采取防治措施。这种技术可以大幅减少农药的使用量，提高生态友好性。
食品加工与质量评估
在食品加工行业，葡萄叶是某些传统美食（如中东的葡萄叶包饭）的关键原料。葡萄叶识别技术可以用于区分不同品种的叶片，以确保其口感、大小和质量符合加工要求，从而提升加工产品的一致性和市场竞争力。
葡萄品种的保护与追溯
不同品种的葡萄在外观、叶片形态等方面存在差异，通过葡萄叶识别技术，可以为葡萄品种建立数字化档案。这不仅有助于保护珍稀的葡萄品种，还可以通过图像识别追溯某批次葡萄的种植来源，满足消费者对产品质量和来源的追溯需求。
二、数据预处理

# 数据增强和预处理
train_transforms = transforms.Compose([
    transforms.RandomHorizontalFlip(),          # 随机水平翻转
    transforms.RandomRotation(10),             # 随机旋转 ±10°
    transforms.RandomResizedCrop(224),         # 随机裁剪并调整到 224x224
    transforms.ToTensor(),                     # 转换为张量
    transforms.Normalize(mean=[0.485, 0.456, 0.406],  # 归一化
                         std=[0.229, 0.224, 0.225])
])

test_transforms = transforms.Compose([
    transforms.Resize(256),                    # 调整图像大小到 256
    transforms.CenterCrop(224),               # 中心裁剪到 224x224
    transforms.ToTensor(),                    # 转换为张量
    transforms.Normalize(mean=[0.485, 0.456, 0.406],  # 归一化
                         std=[0.229, 0.224, 0.225])
])

三、数据读取与划分

from torch.utils.data import random_split, DataLoader

# 读取训练和测试数据
dataset = datasets.ImageFolder(root='data', transform=train_transforms)

train_size = int(0.6 * len(dataset))  
val_size = int(0.2 * len(dataset))  
test_size = len(dataset) - train_size - val_size  

train_dataset, val_dataset, test_dataset = random_split(dataset, [train_size, val_size, test_size])
# 创建 DataLoader
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True, num_workers=4)
val_loader = DataLoader(val_dataset, batch_size=32, shuffle=False, num_workers=4)
test_loader = DataLoader(test_dataset, batch_size=32, shuffle=False, num_workers=4)
# 获取类别列表
class_names = dataset.classes

四、数据可视化

import matplotlib.pyplot as plt
import numpy as np

def imshow(tensor, title=None):
    # 将张量转换为图像
    image = tensor.numpy().transpose((1, 2, 0))
    mean = np.array([0.485, 0.456, 0.406])
    std = np.array([0.229, 0.224, 0.225])
    image = std * image + mean  # 去归一化
    image = np.clip(image, 0, 1)
    plt.imshow(image)
    if title is not None:
        plt.title(title)
    plt.show()

# 获取一个批次的数据
data_iter = iter(train_loader)
images, labels = next(data_iter)

# 可视化
for i in range(4):  # 显示前4张图片
    imshow(images[i], title=class_names[labels[i]])

在这里插入图片描述

五、模型构建

import torch.nn as nn
import torch.nn.functional as F

class LightCNN(nn.Module):
    def __init__(self, num_classes):
        super(LightCNN, self).__init__()
        self.conv1 = nn.Conv2d(3, 16, kernel_size=3, stride=1, padding=1)  # 输入: RGB 图像
        self.conv2 = nn.Conv2d(16, 32, kernel_size=3, stride=1, padding=1)
        self.fc1 = nn.Linear(32 * 56 * 56, 128)  # 假设输入图像大小为 224x224
        self.fc2 = nn.Linear(128, num_classes)

    def forward(self, x):
        x = F.relu(F.max_pool2d(self.conv1(x), 2))
        x = F.relu(F.max_pool2d(self.conv2(x), 2))
        x = x.view(x.size(0), -1)  # 展平
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return x

# 初始化模型
num_classes = len(class_names)
model = LightCNN(num_classes=num_classes)

六、模型训练

import torch.optim as optim

# 设备配置
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model.to(device)

# 损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 训练模型
num_epochs = 10
for epoch in range(num_epochs):
    model.train()
    train_loss = 0.0
    correct = 0
    total = 0

    for images, labels in train_loader:
        images, labels = images.to(device), labels.to(device)
        
        # 前向传播
        outputs = model(images)
        loss = criterion(outputs, labels)

        # 反向传播和优化
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        train_loss += loss.item()
        _, predicted = outputs.max(1)
        total += labels.size(0)
        correct += predicted.eq(labels).sum().item()

    print(f"Epoch [{epoch+1}/{num_epochs}], Loss: {train_loss/len(train_loader):.4f}, Accuracy: {100 * correct / total:.2f}%")
# 验证模型
model.eval()
val_loss = 0.0
correct = 0
total = 0

with torch.no_grad():
    for images, labels in val_loader:
        images, labels = images.to(device), labels.to(device)
        outputs = model(images)
        loss = criterion(outputs, labels)
        val_loss += loss.item()

        _, predicted = outputs.max(1)
        total += labels.size(0)
        correct += predicted.eq(labels).sum().item()

print(f"Validation Loss: {val_loss/len(val_loader):.4f}, Accuracy: {100 * correct / total:.2f}%")

Epoch [1/10], Loss: 10.1663, Accuracy: 34.44%
Epoch [2/10], Loss: 2.1635, Accuracy: 37.22%
Epoch [3/10], Loss: 1.1604, Accuracy: 32.22%
Epoch [4/10], Loss: 1.1189, Accuracy: 41.11%
Epoch [5/10], Loss: 1.0591, Accuracy: 53.33%
Epoch [6/10], Loss: 1.0724, Accuracy: 33.89%
Epoch [7/10], Loss: 1.0264, Accuracy: 57.78%
Epoch [8/10], Loss: 0.9993, Accuracy: 55.56%
Epoch [9/10], Loss: 1.0055, Accuracy: 55.00%
Epoch [10/10], Loss: 0.9461, Accuracy: 59.44%
Validation Loss: 0.9202, Accuracy: 61.67%

可知，精度略低，模型效果欠佳，使用预训练模型优化模型性能

七、模型优化

import torch.nn as nn
from torchvision import models

class PretrainedMobileNet(nn.Module):
    def __init__(self, num_classes):
        super(PretrainedMobileNet, self).__init__()
        # 加载预训练的 MobileNet 模型
        self.model = models.mobilenet_v2(pretrained=True)

        # 冻结所有参数
        for param in self.model.parameters():
            param.requires_grad = False

        # 替换 MobileNet 的最后一层分类器
        in_features = self.model.last_channel
        self.model.classifier = nn.Sequential(
            nn.Linear(in_features, num_classes)
        )

    def forward(self, x):
        return self.model(x)
num_classes = len(class_names)
model = PretrainedMobileNet(num_classes=num_classes)
import torch.optim as optim

# 设备配置
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model.to(device)

# 损失函数和优化器
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 训练模型
num_epochs = 10
for epoch in range(num_epochs):
    model.train()
    train_loss = 0.0
    correct = 0
    total = 0

    for images, labels in train_loader:
        images, labels = images.to(device), labels.to(device)
        
        # 前向传播
        outputs = model(images)
        loss = criterion(outputs, labels)

        # 反向传播和优化
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        train_loss += loss.item()
        _, predicted = outputs.max(1)
        total += labels.size(0)
        correct += predicted.eq(labels).sum().item()

    print(f"Epoch [{epoch+1}/{num_epochs}], Loss: {train_loss/len(train_loader):.4f}, Accuracy: {100 * correct / total:.2f}%")

Epoch [1/10], Loss: 1.0287, Accuracy: 42.78%
Epoch [2/10], Loss: 0.9017, Accuracy: 56.11%
Epoch [3/10], Loss: 0.7832, Accuracy: 73.33%
Epoch [4/10], Loss: 0.6940, Accuracy: 81.67%
Epoch [5/10], Loss: 0.6381, Accuracy: 78.89%
Epoch [6/10], Loss: 0.5677, Accuracy: 85.56%
Epoch [7/10], Loss: 0.5053, Accuracy: 87.22%
Epoch [8/10], Loss: 0.4808, Accuracy: 83.33%
Epoch [9/10], Loss: 0.4640, Accuracy: 87.22%
Epoch [10/10], Loss: 0.4638, Accuracy: 84.44%

八、模型评估

from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score

# 测试模型
y_true = []
y_pred = []

model.eval()
with torch.no_grad():
    for images, labels in test_loader:
        images, labels = images.to(device), labels.to(device)
        outputs = model(images)
        _, predicted = outputs.max(1)

        y_true.extend(labels.cpu().numpy())
        y_pred.extend(predicted.cpu().numpy())

# 计算评价指标
accuracy = accuracy_score(y_true, y_pred)
precision = precision_score(y_true, y_pred, average='macro')
recall = recall_score(y_true, y_pred, average='macro')
f1 = f1_score(y_true, y_pred, average='macro')

print(f"Test Accuracy: {accuracy:.4f}")
print(f"Precision: {precision:.4f}")
print(f"Recall: {recall:.4f}")
print(f"F1 Score: {f1:.4f}")

Test Accuracy: 0.9500
Precision: 0.9508
Recall: 0.9530
F1 Score: 0.9507

from sklearn.metrics import confusion_matrix
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np

# 生成混淆矩阵
cm = confusion_matrix(y_true, y_pred)
cm_normalized = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis]  # 归一化

# 设置类别标签
class_labels = class_names

# 可视化混淆矩阵
plt.figure(figsize=(8, 6))
sns.heatmap(cm_normalized, annot=True, fmt=".2f", cmap="Blues", xticklabels=class_labels, yticklabels=class_labels)
plt.title("Normalized Confusion Matrix")
plt.xlabel("Predicted Label")
plt.ylabel("True Label")
plt.tight_layout()
plt.show()

在这里插入图片描述

原文地址：https://blog.csdn.net/qq_42492056/article/details/144413391

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：基于卷积神经网络的皮肤病识别系统（pytorch框架，python源码，GUI界面，前端界面）
下一篇：Ubuntu22.04安装英伟达驱动

.NET(C#) 如何配置用户首选项及保存用户设置
.NET(C#) 如何配置用户首选项及保存用户设置
阅读更多2024-12-14
【最新】北大数字普惠金融指数数据集-省市县（2011-2023年）
郭峰,王靖一,王芳,孔涛,张勋,程志云.测度中国数字普惠金融发展:指数编制与空间特征[J].经济学(季刊),2020,19(04):1401-1418.时间跨度：省级和城市级指数时间跨度为2011-2
阅读更多2024-12-14
GESP202412 四级【Recamán】题解（AC）
a11ak−1−kkakak−1−kak−1k小杨想知道 Recamán 数列的前n项从小到大排序后的结果。手动计算非常困难，小杨希望你能帮他解决这个问题。
阅读更多2024-12-14
IDEA遇到EasyConnect中的网络资源无法访问的问题
版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。原文链接：https://blog.csdn.net/wanshanyu_/article/de
阅读更多2024-12-14
双目摄像头标定方法
此时已经完成标定，左下角为反投影误差，右边为外参可视化。将双目左右目拍的图像上传（左右目最好不少于20张）此时回到主页面，即可看到成功导出。把这些误差大的删除即可。
阅读更多2024-12-14
Servlet、omcat服务器架构与工作原理
Servlet是运行在服务器端的Java程序，它的主要职责之一是接收并处理来自客户端（如浏览器）的HTTP请求。当客户端发送一个请求到服务器时，Servlet可以解析请求中的信息，例如请求的URL路径
阅读更多2024-12-14
Vue生命周期钩子函数：深入解析与实践
作为高级Vue前端开发人员，对Vue组件的生命周期钩子函数有着深刻的理解是至关重要的。生命周期钩子函数是指在Vue组件的创建、更新、销毁等过程中，Vue自动调用的一系列方法。通过这些钩子函数，我们可以
阅读更多2024-12-14
安卓开发--使用android studio发布APP
app发布
阅读更多2024-12-14
数据结构与算法学习笔记----拓扑排序
@ author: 明月清了个风。
阅读更多2024-12-14
python 将数据保存到现有的Excel文件的新工作表
out_file = ‘query.xlsx’df1 = pd.DataFrame(out_data)若直接写入：df1.to_excel(out_file, index=False, sheet_n
阅读更多2024-12-14

AI实现葡萄叶片识别(基于深度学习的葡萄叶片识别)

基于深度学习的图像识别：葡萄叶片识别

相关文章