计算机视觉基础：OpenCV库详解

🕗 发布于 2024-11-08 08:25

💓 博客主页：瑕疵的CSDN主页

📝 Gitee主页：瑕疵的gitee主页

⏩ 文章专栏：《热点资讯》

计算机视觉基础：OpenCV库详解

引言

计算机视觉是人工智能的一个重要分支，旨在使计算机能够理解和解释图像和视频内容。OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉库，提供了丰富的图像处理和计算机视觉功能。本文将详细介绍 OpenCV 的基本概念、安装配置、核心功能以及实际应用，帮助读者快速上手计算机视觉开发。

OpenCV 概述

什么是 OpenCV

OpenCV 是一个开源的计算机视觉库，支持多种编程语言（如 C++、Python、Java 等），并在多个平台上可用（如 Windows、Linux、macOS）。OpenCV 提供了大量的图像处理和计算机视觉算法，广泛应用于图像识别、物体检测、人脸识别等领域。

OpenCV 的应用场景

图像处理：如图像增强、滤波、边缘检测等。
物体检测：如行人检测、车辆检测等。
人脸识别：如人脸检测、人脸识别等。
视频分析：如运动检测、背景减除等。

安装和配置 OpenCV

安装 OpenCV

OpenCV 可以通过 pip 工具轻松安装。

pip install opencv-python

验证安装

安装完成后，可以通过以下代码验证 OpenCV 是否安装成功：

import cv2
print(cv2.__version__)

OpenCV 基础

读取和显示图像

OpenCV 提供了读取和显示图像的基本功能。

import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 显示图像
cv2.imshow('Image', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

图像的基本操作

获取图像属性

形状：获取图像的高度、宽度和通道数。
像素值：获取和设置特定像素的值。

# 获取图像的形状
height, width, channels = image.shape
print(f'Height: {height}, Width: {width}, Channels: {channels}')

# 获取特定像素的值
pixel_value = image[100, 100]
print(f'Pixel Value at (100, 100): {pixel_value}')

# 设置特定像素的值
image[100, 100] = [0, 255, 0]  # 设置为绿色

图像裁剪和复制

裁剪：提取图像的一部分。
复制：创建图像的副本。

# 裁剪图像
cropped_image = image[50:150, 50:150]

# 复制图像
copied_image = image.copy()

图像处理

灰度化

将彩色图像转换为灰度图像。

# 转换为灰度图像
grey_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# 显示灰度图像
cv2.imshow('Grey Image', grey_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

高斯模糊

对图像进行高斯模糊处理。

# 高斯模糊
blurred_image = cv2.GaussianBlur(image, (5, 5), 0)

# 显示模糊图像
cv2.imshow('Blurred Image', blurred_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

边缘检测

使用 Canny 算法检测图像的边缘。

# 边缘检测
edges = cv2.Canny(image, 100, 200)

# 显示边缘图像
cv2.imshow('Edges', edges)
cv2.waitKey(0)
cv2.destroyAllWindows()

视频处理

读取和显示视频

OpenCV 可以读取和显示视频文件。

import cv2

# 读取视频
cap = cv2.VideoCapture('video.mp4')

while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        break

    # 显示帧
    cv2.imshow('Frame', frame)

    # 按 q 键退出
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 释放资源
cap.release()
cv2.destroyAllWindows()

视频录制

OpenCV 可以录制视频。

import cv2

# 初始化视频捕获
cap = cv2.VideoCapture(0)

# 定义编码器和输出文件
fourcc = cv2.VideoWriter_fourcc(*'XVID')
out = cv2.VideoWriter('output.avi', fourcc, 20.0, (640, 480))

while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        break

    # 写入帧
    out.write(frame)

    # 显示帧
    cv2.imshow('Frame', frame)

    # 按 q 键退出
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 释放资源
cap.release()
out.release()
cv2.destroyAllWindows()

OpenCV 高级功能

物体检测

Haar 级联分类器

Haar 级联分类器是一种常用的物体检测方法，可以用于检测人脸、眼睛等。

import cv2

# 加载 Haar 级联分类器
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')

# 读取图像
image = cv2.imread('image.jpg')

# 转换为灰度图像
grey_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# 检测人脸
faces = face_cascade.detectMultiScale(grey_image, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))

# 绘制矩形框
for (x, y, w, h) in faces:
    cv2.rectangle(image, (x, y), (x+w, y+h), (255, 0, 0), 2)

# 显示图像
cv2.imshow('Face Detection', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

特征点检测

SIFT 和 SURF

SIFT（Scale-Invariant Feature Transform）和 SURF（Speeded-Up Robust Features）是常用的特征点检测算法。

import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 初始化 SIFT 检测器
sift = cv2.xfeatures2d.SIFT_create()

# 检测特征点
keypoints, descriptors = sift.detectAndCompute(image, None)

# 绘制特征点
image_with_keypoints = cv2.drawKeypoints(image, keypoints, None)

# 显示图像
cv2.imshow('SIFT Keypoints', image_with_keypoints)
cv2.waitKey(0)
cv2.destroyAllWindows()

图像分割

GrabCut

GrabCut 是一种基于图割的图像分割算法，用于从背景中分离前景。

import cv2

# 读取图像
image = cv2.imread('image.jpg')

# 初始化掩码
mask = np.zeros(image.shape[:2], np.uint8)

# 定义前景和背景的初始矩形
rect = (50, 50, 300, 300)

# 初始化前景和背景模型
bgd_model = np.zeros((1, 65), np.float64)
fgd_model = np.zeros((1, 65), np.float64)

# 运行 GrabCut 算法
cv2.grabCut(image, mask, rect, bgd_model, fgd_model, 5, cv2.GC_INIT_WITH_RECT)

# 将掩码转换为二值图像
mask2 = np.where((mask==2)|(mask==0), 0, 1).astype('uint8')

# 应用掩码
segmented_image = image * mask2[:, :, np.newaxis]

# 显示分割后的图像
cv2.imshow('Segmented Image', segmented_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

实战案例分析

人脸识别

假设我们有一个包含人脸的照片，需要进行人脸识别。

import cv2

# 加载 Haar 级联分类器
face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')

# 读取图像
image = cv2.imread('people.jpg')

# 转换为灰度图像
grey_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# 检测人脸
faces = face_cascade.detectMultiScale(grey_image, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))

# 绘制矩形框
for (x, y, w, h) in faces:
    cv2.rectangle(image, (x, y), (x+w, y+h), (255, 0, 0), 2)

# 保存结果
cv2.imwrite('detected_faces.jpg', image)

物体跟踪

假设我们有一个视频，需要跟踪视频中的移动物体。

import cv2

# 初始化视频捕获
cap = cv2.VideoCapture('video.mp4')

# 初始化背景减除器
fgbg = cv2.createBackgroundSubtractorMOG2()

while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        break

    # 应用背景减除器
    fgmask = fgbg.apply(frame)

    # 显示帧
    cv2.imshow('Frame', frame)
    cv2.imshow('FG Mask', fgmask)

    # 按 q 键退出
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# 释放资源
cap.release()
cv2.destroyAllWindows()

总结

通过本文，我们深入了解了 OpenCV 的基本概念、安装配置、核心功能以及实际应用。OpenCV 是一个强大的计算机视觉库，提供了丰富的图像处理和计算机视觉功能。希望本文能帮助读者更好地理解和应用 OpenCV，提升计算机视觉开发能力。

参考资料

原文地址：https://blog.csdn.net/qq_36287830/article/details/143590917

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【论文阅读笔记】CamoFormer: Masked Separable Attention for Camouflaged Object Detection
下一篇：eval: jdk1.8.0_431/jre/bin/java: Permission denied

基于SSM（Spring + Spring MVC + MyBatis）框架的咖啡馆管理系统
用户管理：管理员可以添加、删除、修改和查询用户信息。员工管理：记录员工信息，如姓名、职位、工资等。菜单管理：支持对菜单项的增删改查操作，包括菜品名称、价格、类别等。订单管理：处理订单信息，记录订单详情
阅读更多2024-11-08
域名邮箱推荐：安全与稳定的邮件域名邮箱！
域名邮箱登录是现代企业不可或缺的工具，掌握从注册到登录的全过程，对于提升工作效率和品牌形象至关重要。烽火邮箱，专业域名邮箱推荐，免费企业邮箱，稳定安全，短期邮箱灵活选择！
阅读更多2024-11-08
敬业签适配鸿蒙：开启多端协同新篇章
纯血鸿蒙，即华为推出的原生鸿蒙操作系统（HarmonyOS Next），是一款面向全场景的分布式操作系统，它以其独特的微内核设计和多设备协同能力，引领着智能终端的新潮流。鸿蒙系统的推出，不仅标志着中国
阅读更多2024-11-08
【Flutter 内嵌 android 原生 View以及相互跳转】
在android 工程的包名下，也可在MainActivity创建 android 原生view ，继承PlatformView。新建MyViewFactory.java注册PlatformView。
阅读更多2024-11-08
HCIP--3实验- 链路聚合,VLAN间通讯,Super VLAN,MSTP,VRRPip配置,静态路由,环回，缺省，空接口,NAT
你可以为VLAN 10配置一个VLAN IF，其IP地址为192.168.10.1/24，为VLAN 20配置另一个VLAN IF，其IP地址为192.168.20.1/24。才能够正常访问网络。：首
阅读更多2024-11-08
Linux下的WatchDog
watch🐕
阅读更多2024-11-08
ZABBIX API获取监控服务器OS层信息
Zabbix 提供了强大的 RESTful API，支持通过编程的方式管理 Zabbix 配置、获取监控数据和实现自动化任务。通过 API，你可以查询 Zabbix 中的主机、群组、监控项等信息，为实
阅读更多2024-11-08
LRU缓存算法
LRU缓存算法
阅读更多2024-11-08
Hive 的数据类型
一组键值对，键必须是唯一的。函数来创建映射和结构体。多个字段组成的数据类型。假设我们有一个用户表。
阅读更多2024-11-08
独立站 API 接口的性能优化策略
例如，对于一个全球范围内使用的独立站 API，将其文档放在 CDN 上后，亚洲用户可以从亚洲的 CDN 节点获取文档，欧洲用户可以从欧洲的 CDN 节点获取，减少了网络延迟。API 服务器监听这个消息
阅读更多2024-11-08

计算机视觉基础：OpenCV库详解

💓 博客主页：瑕疵的CSDN主页

📝 Gitee主页：瑕疵的gitee主页

⏩ 文章专栏：《热点资讯》