使⽤MATLAB进⾏⽬标检测

🕗 发布于 2024-11-18 23:01 matlab 开发语言 目标检测 深度学习

⼈⽣苦短，我⽤MATLAB。
Pytorch在深度学习领域占据了半壁江⼭，最主要的原因是⽣态完善，⽽且api直观易⽤。但谁能想到现在MATLAB⽤起来⽐Pytorch还好⽤。从数据集划分到训练，再到性能验证和画图，仅仅使⽤了⼏⼗⾏代码。炼丹师们终于可以解放编码时间，把⾃⼰的精⼒放在摸⻥（划掉）算法本身上了。
下⾯⽤⾃⼰的数据集训练⼀个YOLOv4，看看MATLAB到底怎么个事。

数据准备

我的数据内容是⾦属锻件磁粉探伤所显示的零件缺陷。如下例所示，轴孔上有⼀处明显缺陷：
在这里插入图片描述
数据集格式为Pascal VOC格式（详⻅http://host.robots.ox.ac.uk/pascal/VOC/）。⾸先要将格式的标签转换为MATLAB能够使⽤的格式。使⽤以下函数：

function convertXMLtoMAT(xmlFolder, outputMATFile)
% xmlFolder: 存放所有XML⽂件的⽂件夹
% outputMATFile: 输出的MAT⽂件名
xmlFiles = dir(fullfile(xmlFolder, '*.xml')); imageFilenames = {};
boundingBoxes = {};

for i = 1:length(xmlFiles) 
try
xmlFilePathfullfile(xmlFiles(i).folder, xmlFiles(i).name); xmlDoc = xmlread(xmlFilePath);
filenameNode = xmlDoc.getElementsByTagName('filename').item(0);
filename = char(filenameNode.getFirstChild.getData); 
pathNode = xmlDoc.getElementsByTagName('path').item(0); 
newPath = fullfile(pwd, 'img', filename);
xminNode = xmlDoc.getElementsByTagName('xmin').item(0); 
yminNode = xmlDoc.getElementsByTagName('ymin').item(0); 
xmaxNode = xmlDoc.getElementsByTagName('xmax').item(0); 
ymaxNode = xmlDoc.getElementsByTagName('ymax').item(0); 
xmin = str2double(xminNode.getFirstChild.getData);
ymin = str2double(yminNode.getFirstChild.getData); 
xmax = str2double(xmaxNode.getFirstChild.getData); 
ymax = str2double(ymaxNode.getFirstChild.getData);

width = xmax - xmin; height = ymax - ymin;
bbox = [xmin, ymin, width, height];

imageFilenames{end+1, 1} = newPath; boundingBoxes{end+1, 1} = bbox;
catch
% pass
end
end

% 创建table并保存为MAT⽂件
myDataset = table(imageFilenames, boundingBoxes, ... 
'VariableNames', {'imageFilename', 'defect'});
save(outputMATFile, 'myDataset');
% 输出MAT⽂件的前⼏⾏
disp('数据集的前⼏⾏：');
disp(myDataset(1:4, :));

end

转换后的标签⽂件就变成⼀个mat⽂件，加载后就是以下的样⼦：

data = load("my_dataset.mat"); 
defectDataset = data.myDataset;
% 显示数据
disp(defectDataset(1:5, :));

table sample_num * 2 :
imageFilenamedefect
------------------------------------------
{'img/00001.jpg'}{[2635 435 133 682]}
{'img/00001_z0.jpg'}{[2574 1086 125 561]}
{'img/00001_z1.jpg'}{[2569 720 386 596]}
{'img/00001_z2.jpg'}{[2608 951 303 647]}
{'img/00001_z3.jpg'}{[1748 947 303 606]}

第⼆步，划分数据集。⼀般来讲，按照7:2:1的⽐例拆分训练集、测试集和验证集。

trainingRatio = 0.7;
validationRatio = 0.1;

rng("default");
shuffledIndices = randperm(height(defectDataset));
idx = floor(trainingRatio * length(shuffledIndices) );

trainingIdx = 1:idx;
trainingDataTbl = defectDataset(shuffledIndices(trainingIdx),:);

validationIdx = idx+1 : idx + 1 + floor(validationRatio * length(shuffledIndices) );
validationDataTbl = defectDataset(shuffledIndices(validationIdx),:);

testIdx = validationIdx(end)+1 : length(shuffledIndices); 
testDataTbl = defectDataset(shuffledIndices(testIdx),:);

第三步，创建 Datastore 。Datastore 是MATLAB特有的⼀个概念，作⽤类似于Pytorch中的DataLoader 。它集成了⼀些常⽤的操作，如计数，按序读取，打乱顺序，合并数据集等⽅法。MATLAB的Datastore ⽐torch的DataLoader 更⽅便，⼀般⽆需⾃⼰定义，拿来就⽤。

imdsTrain = imageDatastore(trainingDataTbl{:,"imageFilename"}); 
bldsTrain = boxLabelDatastore(trainingDataTbl(:,"defect"));

imdsValidation = imageDatastore(validationDataTbl{:,"imageFilename"}); 
bldsValidation = boxLabelDatastore(validationDataTbl(:,"defect"));

imdsTest = imageDatastore(testDataTbl{:,"imageFilename"}); 
bldsTest = boxLabelDatastore(testDataTbl(:,"defect"));
% 合并
trainingData = combine(imdsTrain,bldsTrain); 
validationData = combine(imdsValidation,bldsValidation); 
testData = combine(imdsTest,bldsTest);

最后，为了验证数据是否正确，可以画⼀个样本检查⼀下：

data = read(trainingData); 
I = data{1};
bbox = data{2};
annotatedImage = insertShape(I,"Rectangle",bbox,LineWidth=10); 
annotatedImage = imresize(annotatedImage,2);

figure 
imshow(annotatedImage); 
reset(trainingData);

在这里插入图片描述

定义模型并训练

这部分是本⽂的重点，但是却很短，因为MATLAB的流程太简洁了，狠狠爱了。

⾸先定义模型的主要参数：

optimizer = "adam"; % 优化器
gradientDecayFactor = 0.9; % 梯度衰减因⼦ 
squaredGradientDecayFactor = 0.999; % 平⽅梯度衰减因⼦ 
initialLearnRate = 0.001; % 初始学习率 
learnRateSchedule = 'none'; % 学习率衰减策略 
miniBatchSize = 4; % 批⼤⼩
L2Regularization = 0.0005; % L2正则化 
MaxEpochs = 100; % 迭代轮数
inputSize = [416 416 3]; 
className = "defect";

第⼆步，设置yolov4的Anchors：

rng("default") 
trainingDataForEstimation =transform(trainingData,@(data)preprocessData(data,inputSize)); 
numAnchors = 6;
[anchors,meanIoU] = estimateAnchorBoxes(trainingDataForEstimation,numAnchors);

area = anchors(:, 1).*anchors(:,2);
[~,idx] = sort(area,"descend");

anchors = anchors(idx,:); 
anchorBoxes = {anchors(1:3,:)
anchors(4:6,:)};

最后开始训练模型就ok了：

detector = yolov4ObjectDetector("tiny-yolov4-coco", ... 
className,anchorBoxes,InputSize=inputSize);
%  如果你选择了从头开始训练，那么就得定义⼀⼤堆参数
options = trainingOptions(optimizer, ...
GradientDecayFactor=gradientDecayFactor, ... 
SquaredGradientDecayFactor=squaredGradientDecayFactor, ... 
InitialLearnRate=initialLearnRate, ...
LearnRateSchedule=learnRateSchedule, ... 
MiniBatchSize=miniBatchSize, ...
L2Regularization=L2Regularization, ... 
MaxEpochs=MaxEpochs, ...
DispatchInBackground=true, ... 
ResetInputNormalization=true, ... 
Shuffle="every-epoch", ...
VerboseFrequency=20, ... 
ValidationFrequency=1000, ... 
CheckpointPath=tempdir, ...
ValidationData=validationData, ... 
OutputNetwork="best-validation-loss");

% 开始训练
[detector,info] = trainYOLOv4ObjectDetector(augmentedTrainingData,detector,options);
% 保存
save('yolov4_detector.mat',"detector"); % 模型
save('yolov4_detector_info.mat',"info"); % 训练过程

训练时会有如下输出：

Computing Input Normalization Statistics.
*************************************************************************  
Training a YOLO v4 Object Detector for the following object classes:

* defect

正在使⽤  'Processes' 配置⽂件启动并⾏池(parpool)...
已连接到具有 8 个⼯作进程的并⾏池。

EpochIterationTimeElapsedLearnRate TrainingLossValidationLoss

1100:00:100.0011174.11124.1
12000:00:360.00180.843
14000:00:520.00130.598
16000:01:080.00120.106
18000:01:210.00186.183
110000:01:340.00114.755
212000:01:530.00113.844
214000:02:060.00113.443
216000:02:190.00112.067
218000:02:320.00110.023
220000:02:450.00111.157
222000:02:590.00111.613

*************************************************************************  
Detector training complete.
*************************************************************************

训练完成后，模型和相关的记录会分别保存在yolov4_detector.mat和yolov4_detector_info.mat中。

用测试集评估性能

⽤来评估性能的

detectionResults = detect(detector,testData,Threshold=0.01); 
metrics = evaluateObjectDetection(detectionResults,testData); 
AP = averagePrecision(metrics);
[precision,recall] = precisionRecall(metrics,ClassName=className);

% 画pr图
figure 1 
plot(recall{:},precision{:}) 
xlabel("Recall") 
ylabel("Precision")
grid on
title(sprintf("Average Precision = %.2f",AP)) 
imshow(I);

% 再画个loss曲线
figure 2 
plot(info.TrainingLoss)
xlabel("迭代次数")
ylabel("loss") title('Loss曲线')

在这里插入图片描述

你可以说我练的不怎么样，但不能说MATLAB不⾏，因为在torch上也是⼀样的效果（哭…

推理过程

I = imread("img/00029.jpg"); 
[bboxes,scores,labels] = detect(detector,I);
I = insertObjectAnnotation(I,"rectangle",bboxes,scores, ...
LineWidth=10,FontSize=72); figure
imshow(I)

在这里插入图片描述

⼀⾏代码查看⽹络结构

MATLAB⾥⾯⼀⾏代码可以做到图形化的查看⽹络结构，更专注于分析算法。

net = detector.Network 
analyzeNetwork(net)

在这里插入图片描述

⼀⾏代码转onnx

exportONNXNetwork(net,'yolov4.onnx')

导出⽹络后，可以将该⽹络导⼊到其他深度学习框架中进⾏推理。妈妈再也不⽤担⼼我的部署了。

结语

MATLAB完全解放了炼丹师的编码时间，让炼丹师能够专注于算法本身，我愿称之为最好的深度学习框架（如果你有licence的话）

原文地址：https://blog.csdn.net/tangbiubiu/article/details/143777668

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：第2章-PostgreSQL 15安装及登录
下一篇：第八章利用CSS制作导航菜单

推荐系统与大模型
目前大模型在推荐系统取得巨大进展的同时也上主要一些的问题。主要有以下三点。1. Position Bias.在推荐系统的生成语言建模范式中，用户行为序列和推荐候选序列等各种信息以文本序列描述的形式输入
阅读更多2024-11-19
element-ui】使用el_upload上传文件无法动态修改action
问题：最近在使用el_upload上传文件时，发现无法动态修改action的值，进行提交时，caseId2还是默认值null。原因：el-upload的先执行上传，后执行action里的响应，也就是赋
阅读更多2024-11-19
JavaScript 如何获取本机IP地址
获取本机IP地址是前端工程师经常需要处理的问题。JavaScript 有几种方法可以获取客户端的IP地址。下面是三种获取本机IP的方法。
阅读更多2024-11-19
如何用 JavaScript 复制到剪贴板
以上就是几种在 JavaScript 中实现文本复制到剪贴板的方法。随着技术的发展，建议尽量使用最新的异步剪贴板 API，但为了兼容性，可以结合使用方法。希望本文能够帮助你更好地理解和应用这些 API
阅读更多2024-11-19
【第29章】MyBatis-Plus之分页插件
的分页插件提供了强大的分页功能，支持多种数据库，使得分页查询变得简单高效。属性名类型默认值描述overflowbooleanfalse溢出总页数后是否进行处理maxLimitLong单页分页条数限制d
阅读更多2024-11-19
weixin-java-miniapp 微信小程序登陆
1. 用户在小程序中选择使用微信授权登录功能。2. 小程序调用 `` 接口，向发起登录请求。3. 微信服务器验证小程序的合法性，如果合法，会返回一个。4. 小程序。5. 后台服务器接收到 **code
阅读更多2024-11-19
都2023年了，Servlet还有必要学习吗？一文带你快速了解Servlet
不得不说，Servlet 确实是一门古老的技术了，现在很少有公司直接使用 Servlet 来写项目了，大家都在用 SpringMVC-Spring-MyBatis / SpringBoot 做开发了，
阅读更多2024-11-19
掌握Java中集合的交集与并集操作
本文还有配套的精品资源，点击获取简介：集合操作是编程中的基础任务，涉及找出多个集合的共有元素（交集）和所有不同元素的总和（并集）。本文介绍如何在Java中利用 HashSet 和 St
阅读更多2024-11-19
Java 环境配置——Java 语言的安装、配置、编译与运行
正确配置 Java 开发环境是进行 Java 开发的第一步。通过本文的详细介绍，读者应能够在不同操作系统上安装和配置 JDK，并熟练编写、编译和运行 Java 程序。随着技术的发展，Java 生态系统
阅读更多2024-11-19
java 配置多数据源
mysql和clickhouse多数据源配置。
阅读更多2024-11-19

使⽤MATLAB进⾏⽬标检测

目录

数据准备

定义模型并训练

用测试集评估性能

推理过程

⼀⾏代码查看⽹络结构

⼀⾏代码转onnx

结语

相关文章