智能犬种识别检测：基于YOLO和深度学习的全流程实现

🕗 发布于 2024-07-24 14:40 YOLO 深度学习 人工智能

引言

随着宠物市场的不断增长，犬种识别变得越来越重要。通过使用深度学习技术，我们可以快速而准确地识别不同品种的犬只。本文将详细介绍如何使用YOLO模型（YOLOv8/v7/v6/v5）构建一个基于深度学习的犬种识别系统，包括环境搭建、数据收集与处理、模型训练、系统实现及用户界面设计等步骤。

系统概述

本文系统的主要步骤如下：

环境搭建
数据收集与处理
模型训练
系统实现
用户界面设计

环境搭建

首先，需要搭建一个合适的开发环境，本文使用Python 3.8或以上版本。

安装必要的库

pip install numpy pandas matplotlib opencv-python
pip install torch torchvision torchaudio
pip install ultralytics
pip install PyQt5

验证安装

import torch
import cv2
import PyQt5
import ultralytics

print("All packages installed successfully.")

数据收集与处理

数据收集

可以从以下几个途径获取犬种识别数据集：

公开数据集：如Kaggle上的犬种识别数据集。
自定义数据集：通过拍摄犬只图片或视频。

数据标注

使用工具如LabelImg对数据进行标注，标注犬种类别和位置。

# 数据集目录结构
dataset/
  ├── images/
  │   ├── train/
  │   └── val/
  └── labels/
      ├── train/
      └── val/

模型训练

本文采用YOLOv8模型进行训练，其他版本可以通过相似方法实现。

配置YOLO数据集

创建一个YAML文件来配置数据集信息：

# dataset.yaml
train: path/to/train/images
val: path/to/val/images

nc: 10  # 假设检测十种犬种
names: ['Labrador', 'Poodle', 'Bulldog', 'Beagle', 'Chihuahua', 'Dachshund', 'German Shepherd', 'Golden Retriever', 'Shih Tzu', 'Yorkshire Terrier']

训练代码

from ultralytics import YOLO

# 加载预训练的YOLOv8模型
model = YOLO('yolov8.yaml')

# 配置训练参数
model.train(data='path/to/dataset.yaml', epochs=50, imgsz=640, batch=16)

# 保存训练后的模型
model.save('best.pt')

系统实现

犬种识别

利用训练好的模型进行犬种识别，并实现图片或视频流的实时检测。

import cv2
from ultralytics import YOLO

# 加载训练好的模型
model = YOLO('best.pt')

# 打开视频流
cap = cv2.VideoCapture(0)  # 使用摄像头作为视频输入

while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        break

    # 检测犬种
    results = model(frame)
    for result in results:
        bbox = result['bbox']
        label = result['label']
        confidence = result['confidence']
        
        # 画框和标签
        cv2.rectangle(frame, (bbox[0], bbox[1]), (bbox[2], bbox[3]), (0, 255, 0), 2)
        cv2.putText(frame, f'{label} {confidence:.2f}', (bbox[0], bbox[1] - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 255, 0), 2)
    
    # 显示视频
    cv2.imshow('Dog Breed Detection', frame)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()

用户界面设计

用户界面采用PyQt5实现，提供图片或视频播放和犬种识别结果显示。

界面代码

import sys
from PyQt5.QtWidgets import QApplication, QWidget, QVBoxLayout, QLabel, QPushButton, QFileDialog
from PyQt5.QtGui import QPixmap, QImage
import cv2
from ultralytics import YOLO

class DogBreedDetectionUI(QWidget):
    def __init__(self):
        super().__init__()
        self.initUI()
        
        self.model = YOLO('best.pt')
        
    def initUI(self):
        self.setWindowTitle('Dog Breed Detection System')
        
        self.layout = QVBoxLayout()
        
        self.label = QLabel(self)
        self.layout.addWidget(self.label)
        
        self.button = QPushButton('Open Image or Video', self)
        self.button.clicked.connect(self.open_file)
        self.layout.addWidget(self.button)
        
        self.setLayout(self.layout)
    
    def open_file(self):
        options = QFileDialog.Options()
        file_path, _ = QFileDialog.getOpenFileName(self, "Open File", "", "All Files (*);;MP4 Files (*.mp4);;JPEG Files (*.jpg);;PNG Files (*.png)", options=options)
        
        if file_path:
            if file_path.endswith('.mp4'):
                self.detect_breeds_video(file_path)
            else:
                self.detect_breeds_image(file_path)
    
    def detect_breeds_image(self, file_path):
        frame = cv2.imread(file_path)
        results = self.model(frame)
        for result in results:
            bbox = result['bbox']
            label = result['label']
            confidence = result['confidence']
                
            cv2.rectangle(frame, (bbox[0], bbox[1]), (bbox[2], bbox[3]), (0, 255, 0), 2)
            cv2.putText(frame, f'{label} {confidence:.2f}', (bbox[0], bbox[1] - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 255, 0), 2)
            
        height, width, channel = frame.shape
        bytesPerLine = 3 * width
        qImg = QImage(frame.data, width, height, bytesPerLine, QImage.Format_RGB888).rgbSwapped()
        self.label.setPixmap(QPixmap.fromImage(qImg))
    
    def detect_breeds_video(self, file_path):
        cap = cv2.VideoCapture(file_path)
        
        while cap.isOpened():
            ret, frame = cap.read()
            if not ret:
                break
            
            results = self.model(frame)
            for result in results:
                bbox = result['bbox']
                label = result['label']
                confidence = result['confidence']
                
                cv2.rectangle(frame, (bbox[0], bbox[1]), (bbox[2], bbox[3]), (0, 255, 0), 2)
                cv2.putText(frame, f'{label} {confidence:.2f}', (bbox[0], bbox[1] - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 255, 0), 2)
            
            height, width, channel = frame.shape
            bytesPerLine = 3 * width
            qImg = QImage(frame.data, width, height, bytesPerLine, QImage.Format_RGB888).rgbSwapped()
            
            self.label.setPixmap(QPixmap.fromImage(qImg))
            cv2.waitKey(1)
        
        cap.release()

if __name__ == '__main__':
    app = QApplication(sys.argv)
    ex = DogBreedDetectionUI()
    ex.show()
    sys.exit(app.exec_())

结论与声明

本文介绍了如何构建一个基于深度学习的犬种识别系统，详细描述了从环境搭建、数据收集与处理、模型训练、系统实现到用户界面设计的全过程。通过结合YOLO模型和PyQt5，我们可以实现一个实时、精确的犬种识别系统，为宠物爱好者和相关从业人员提供有力支持。

声明：本次博客是简单的项目思路，如果有想要UI界面+YOLOv8/v7/v6/v5代码+训练数据集）可以联系作者

原文地址：https://blog.csdn.net/a871923942/article/details/140647940

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：nodejs启动项目报错 Error: listen EACCES: permission denied 0.0.0.0:5000
下一篇：【前端】20种 Button 样式

激发AI创造力：掌握Prompt提示词的高效提问方法
提示词工程一句话的解释组织有规律的关键词，抽取有用的信息。提示词是如何影响AI的输出结果?从以上可以看出，对AI输入不同的提示词，会显著影响AI回答问题的角度和专业度。精心设计的提示词能够引导AI更准
阅读更多2024-09-20
【LabVIEW】事件结构的用法
【LabVIEW】事件结构的用法
阅读更多2024-09-20
开源ERP系统odoo的安装与配置
Odoo是全球流行的开源企业管理套件,其功能涵盖了CRM、营销、销售、采购、库存管理(WMS)、生产制造、财务核算、项目管理、质量管理、PLM、人力资源等一系列完善的企业信息化工具。
阅读更多2024-09-20
大数据Flink（一百二十一）：Flink CDC基本介绍
Flink CDC 基于数据库日志的 Change Data Caputre 技术，实现了全量和增量的一体化读取能力，并借助 Flink 优秀的管道能力和丰富的上下游生态，支持捕获多种数据库的变更，并
阅读更多2024-09-20
【PGCCC】使用 Postgres 进行数据分析的窗口函数
Window 函数的部分OVER是创建窗口。令人讨厌的是，window 这个词在任何函数中都没有出现。通常，OVER 部分由另一个函数（聚合函数或数学函数）开头。通常还有一个框架，用于指定您正在查看的
阅读更多2024-09-20
SpinalHDL之结构（三）
⼀、简介(Introduction)⽤Scala函数产⽣硬件的⽅式与VHDL/Verilog中非常不同, 原因如下：
阅读更多2024-09-20
【SpinalHDL】Scala/SpinalHDL联合编程之实例化
在构造阶段，使用 Scala 数据类型来参数化硬件设计。硬件信号（如 Bool）只能在硬件描述内部使用，表示硬件运行时的信号，不应用于控制硬件的生成。避免在 Scala 控制流中使用硬件信号，以防止产
阅读更多2024-09-20
flink kafka sink （scala）
将对象数据通过Gson 转为jsonString，在将数据写到kafka中，这个可以根据需要修改，比如按照\t分开也行，可以节省字段名称的空间。那么如果需要减少Gson的创建，可以自定义map函数，继
阅读更多2024-09-20
linux之scp命令文件传输
在开发时经常会遇到两台机器之间传文件或者安装包，这就用到了scp命令。
阅读更多2024-09-20
【SpinalHDL】Scala编程之伴生对象
Scala中的伴生对象是指和在同一个文件中声明的，并且和类同名的对象。)，这意味着这个类中的方法可以工作，因为它可以访问它的伴生对象中的字段: printFilename HiddenFilename
阅读更多2024-09-20