9.10Mean-Shift分割算法

🕗 发布于 2024-10-08 18:07 opencv

基本概念

Mean-Shift 分割算法是一种非参数的特征空间点集的迭代查找算法，主要用于估计概率密度函数的模式。在计算机视觉中，它常用于颜色图像分割和目标跟踪。它通过迭代地移动每个数据点到其邻域内密度最大的地方，从而找到数据点的模式（即聚类中心）。OpenCV 提供了 pyrMeanShiftFiltering 函数来实现 Mean-Shift 分割算法。

在OpenCV中，Mean Shift算法通常用于目标跟踪，但它也可以用来进行图像分割。下面将详细解释如何使用C++在OpenCV中实现Mean Shift分割算法。
要使用OpenCV实现Mean Shift分割，可以按照以下步骤操作：

1.读取图像：
使用cv::imread()函数来读取图像。
2.创建ROI（Region of Interest）：
用户需要手动选择一个感兴趣区域（ROI），这个区域通常是想要分割的目标所在的矩形框。
3.计算直方图：
对选定的ROI创建一个颜色直方图，这通常是通过将图像转换到HSV颜色空间并计算H（色调）通道上的直方图完成的。这是因为HSV颜色空间更接近人类对颜色的感知方式。
4.创建掩模：
创建一个掩模以标记感兴趣的区域，该掩模将在后续步骤中用于掩蔽图像。
5.创建追踪框：
基于用户选择的ROI，创建一个追踪框。
6.Mean Shift迭代：
使用cv::camshift()函数执行Mean Shift迭代。这个函数会返回一个新的追踪框位置以及旋转角度。
7.绘制结果：
在原图像上绘制追踪框，并显示结果。

1. Mean-Shift 分割算法原理

Mean-Shift 算法的核心思想是通过不断更新每个像素的颜色值，使其逐渐向邻域内的颜色均值靠拢，直到收敛。具体步骤如下：

1. 初始化：选择一个初始窗口（通常是整个图像）。

2. 计算均值：在当前窗口内计算所有像素的颜色均值。

3. 移动窗口：将窗口中心移动到计算出的颜色均值位置。

4. 重复：重复步骤 2 和 3，直到窗口中心不再移动或变化小于某个阈值。

5. 分割：将收敛后的颜色值作为该区域的代表颜色，从而实现图像分割。

2. OpenCV 中的 Mean-Shift 分割算法

OpenCV 提供了 pyrMeanShiftFiltering 函数来实现 Mean-Shift 分割算法。以下是详细的示例代码和解释。

函数原型

void pyrMeanShiftFiltering(InputArray src, OutputArray dst, 
                        double sp, double sr, int maxLevel=1, 
                        TermCriteria termcrit=TermCriteria(TermCriteria::MAX_ITER+TermCriteria::EPS, 5, 1));

•src：输入的 8 位三通道图像。
•dst：输出的图像，与输入图像具有相同的尺寸和类型。
•sp：空间窗口半径（以像素为单位），控制空间平滑程度。
•sr：色彩窗口半径（以像素为单位），控制色彩平滑程度。
•maxLevel：最大金字塔层数，通常设置为 1。
•termcrit：终止条件，包括最大迭代次数和最小变化量。

示例代码1

以下是一个完整的示例代码，展示了如何使用 OpenCV 在 C++ 中实现 Mean-Shift 分割算法：

#include <opencv2/opencv.hpp>
#include <iostream>

using namespace cv;
using namespace std;

int main() 
{
// 读取图像
Mat src = imread("B.png");
if (src.empty()) 
{
cout << "Error: Image not found or unable to read the image." << endl;
return -1;
}

// 设置 Mean-Shift 参数
double spatialRadius = 20;  // 空间窗口半径
double colorRadius = 20;    // 色彩窗口半径
int maxLevel = 1;           // 最大金字塔层数
TermCriteria termcrit(TermCriteria::MAX_ITER + TermCriteria::EPS, 5, 1);  // 终止条件

// 创建输出图像
Mat dst;

// 进行 Mean-Shift 分割
pyrMeanShiftFiltering(src, dst, spatialRadius, colorRadius, maxLevel, termcrit);

// 显示结果
namedWindow("Original Image", WINDOW_NORMAL);
imshow("Original Image", src);

namedWindow("Mean-Shift Segmentation", WINDOW_NORMAL);
imshow("Mean-Shift Segmentation", dst);

waitKey(0);

return 0;
}

详细解释
1. 读取图像：
•使用 imread 函数读取彩色图像。
2. 设置 Mean-Shift 参数：
•spatialRadius：空间窗口半径，控制空间平滑程度。较大的值会导致更多的平滑。
•colorRadius：色彩窗口半径，控制色彩平滑程度。较大的值会导致更多的颜色平滑。
•maxLevel：最大金字塔层数，通常设置为 1。
•termcrit：终止条件，包括最大迭代次数和最小变化量。这里设置为最多 5 次迭代，且变化量小于 1 时停止。
3. 创建输出图像：
•创建一个与输入图像相同尺寸和类型的输出图像 dst。
4. 进行 Mean-Shift 分割：
•使用 pyrMeanShiftFiltering 函数进行 Mean-Shift 分割，结果存储在 dst 中。
5. 显示结果：
•使用 imshow 函数分别显示原始图像和分割后的图像。
•使用 waitKey(0) 等待用户按键关闭窗口。

注意事项
•参数调整：spatialRadius 和 colorRadius 是关键参数，根据实际需求进行调整。较大的值会导致更多的平滑，较小的值则保留更多细节。
•性能优化：如果需要处理大量图像，可以考虑优化代码，例如使用多线程处理。
•预处理：在某些情况下，对图像进行预处理（如高斯模糊）可以提高分割效果。

运行结果1

示例代码2（有待完善）

下面是一个简单的示例代码：
#include <opencv2/opencv.hpp>
#include <iostream>

int main(int argc, char** argv)
{
    // Load an image
    cv::Mat image = cv::imread("path_to_image.jpg", cv::IMREAD_COLOR);
    if (!image.data) {
        std::cout << "Could not open or find the image" << std::endl;
        return -1;
    }

    // Select ROI
    cv::Rect trackWindow;
    int x, y, w, h;
    std::cout << "Select the tracking window and press space to continue." << std::endl;
    cv::selectROI("Image", image, trackWindow);
    x = trackWindow.x; y = trackWindow.y; w = trackWindow.width; h = trackWindow.height;

    // Create HSV histogram for the selected ROI
    cv::Mat hsv_image;
    cv::cvtColor(image, hsv_image, cv::COLOR_BGR2HSV);
    cv::Mat roi_hist;
    cv::calcHist(std::vector<cv::Mat>{hsv_image}, // Input images
                 {0},                              // Channels (Hue in this case)
                 cv::Mat(),                        // No mask
                 roi_hist,                         // Output histogram
                 {256},                            // Bins
                 {0, 256});                        // Range

    // Normalize the histogram
    cv::normalize(roi_hist, roi_hist, 0, 255, cv::NORM_MINMAX);

    // Create termination criteria
    cv::TermCriteria term_crit(cv::TermCriteria::COUNT | cv::TermCriteria::EPS, 10, 1);

    // Perform camshift
    cv::Rect new_window;
    cv::Point2f pt;
    while(true) {
        cv::Mat hsv_back_projected;
        cv::calcBackProject(std::vector<cv::Mat>{hsv_image}, // Input images
                            {0},                              // Channels
                            roi_hist,                         // Histogram
                            hsv_back_projected,               // Output back projection
                            {256},                            // Range
                            255);                             // Scale

        // Perform camshift on the back projected image
        new_window = cv::camShift(hsv_back_projected, trackWindow, term_crit).box;

        // Draw it on image
        cv::rectangle(image, new_window.tl(), new_window.br(), cv::Scalar(0,0,255), 2, 8, 0);
        cv::imshow("Image", image);

        // Exit if ESC pressed
        int c = cv::waitKey(10);
        if (c == 27) break;
    }

    return 0;
}

运行结果2

原文地址：https://blog.csdn.net/weixin_45794330/article/details/142555837

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：EMC-共模耦合
下一篇：鸿蒙 Next 实战：环境搭建

得物App荣获“科技创新服务示范案例”，推动品质消费新升级
为此，得物建立了全球最大的商品研究和一线鉴别团队，以及国家级认证的鉴别实验室，并积累了数十亿级的商品鉴别研究和一线实操经验，形成了庞大的查验鉴别数据库。作为新经济领域的先行者，得物App紧抓数字技术变
阅读更多2024-10-09
【C语言刷力扣】LCR 182.动态口令
【C语言刷力扣】LCR 182.动态口令
阅读更多2024-10-09
lvs+keepalived高可用集群
通过 LVS 和 Keepalived 配置高可用集群，可以实现负载均衡和主备切换的高可用性架构。这种架构适用于需要高性能和高可用性的网站或应用场景。
阅读更多2024-10-09
SQL Server 常用关键词语法汇总
【代码】SQL Server 常用关键词语法汇总。
阅读更多2024-10-09
物理学基础精解【58】
γ射线和X射线与物质的相互作用主要包括光电效应、康普顿效应和电子对效应。这些相互作用形式在放射防护、核医学诊断以及放射治疗等领域具有重要的应用价值。在实际应用中，需要根据射线的能量和物质的性质来评估不
阅读更多2024-10-09
亳州自闭症寄宿制学校，关注孩子的学习和生活
近年来，随着对自闭症认识的加深，越来越多的寄宿制学校应运而生，致力于为这些特殊的孩子提供全面、个性化的教育服务。而在遥远的广州，星贝育园自闭症儿童寄宿制学校，更是以其卓越的教育理念和显著的成效，成为了
阅读更多2024-10-09
C# WinForms 控制权限到按钮级别
在 C# WinForms 应用程序中，实现细粒度的权限控制，特别是到按钮级别，是确保应用程序安全性的重要手段。以下是如何在 WinForms 应用程序中实现按钮级别的权限控制的详细步骤和示例代码。1
阅读更多2024-10-09
GPT-SOVIT模型部署指南
强大的小样本语音转换和文本转语音 WebUI，GPT-Sovits是一个热门的文本生成语音的大模型,只需要少量样本的声音数据源,就可以实现高度相似的仿真效果。本文将详细介绍如何实现该模型本地部署。
阅读更多2024-10-09
NL2SQL之DB-GPT-Hub＜详解篇＞:text2sql任务的微调框架和基准对比
NL2SQL之DB-GPT-Hub:text2sql任务的微调框架和基准对比
阅读更多2024-10-09
Docker容器的短暂运行（一次性实例、一次性任务）和长期运行场景（Web服务器、数据库、后台应用等）（.dockerignore文件）
Docker作为一个开源的应用容器引擎，允许开发者打包他们的应用及依赖包到一个可移植的容器中，然后发布到任何流行的Linux机器上，也可实现虚拟化。文件可以用来指定在构建过程中需要忽略的文件或目录，这
阅读更多2024-10-09