数字图像处理 --- 图像的离散余弦变换(python实战)

🕗 发布于 2024-08-01 23:00 图像的离散余弦变换离散余弦变换 DCT变换 DCT 图像压缩

图像的离散余弦变换(python实战)

这篇文章是我上两篇文章的延续，主要是觉得前面的文章太长了，所以把关于图像的DCT变换部分单独拎出来放到这里，这两篇文章分别是：

1，一维DCT

数字信号处理 --- 一维离散余弦变换(python实战)_python 离散余弦变换-CSDN博客文章浏览阅读318次，点赞6次，收藏10次。本文详细介绍了基于python实现的一维离散余弦变换，是我个人的学习笔记。_python 离散余弦变换https://blog.csdn.net/daduzimama/article/details/140449135

2，二维DCT

数字信号处理 --- 二维离散余弦变换(python实战)-CSDN博客文章浏览阅读954次，点赞22次，收藏11次。在我的前一篇文章的基础上，本文详细的介绍了二维DCT，并以图像的DCT举例。https://blog.csdn.net/daduzimama/article/details/140780627

正文：

图像的离散余弦变换

正变换

定义图像DCT正变换与反变换的函数

def ImagePadding(x):
    [M,N]=x.shape
    
    # 定义零填充的大小
    pad_height = (8 - M % 8) % 8
    pad_width = (8 - N % 8) % 8

    # 对图像进行零填充
    padded_x = np.pad(x, ((0, pad_height), (0, pad_width)), mode='constant', constant_values=0)
    return padded_x


def DCT2D_block(x):
    #image padding
    x_pad=ImagePadding(x)
    print("padded image size=",x_pad.shape)
    N=x_pad.shape[0]//8
    
    #display padded image
    plt.figure(figsize=(6, 6))
    plt.imshow(x_pad,cmap='gray')
    plt.title('Padded Image')
    
    #build dct transform matrix
    A=DCT1d_matrix(8)
    AT=A.T
    print("DCT Transform Matrix for N = 8:",A)
    
    #分块
    block8x8=np.zeros((8,8))
    X=np.zeros((x_pad.shape))
    for i in range(N):
        for j in range(N):
            for x in range(8):
                for y in range(8):
                    block8x8[x,y]=x_pad[i*8+x,j*8+y]
            X8x8=A@block8x8@AT
            for p in range(8):
                for q in range(8):
                    X[i*8+p,j*8+q]=X8x8[p,q]                   
    return X

def DCT2D(x):
    #image padding
    x_pad=ImagePadding(x)
    print("padded image size=",x_pad.shape)
    
    #display padded image
    plt.figure(figsize=(6, 6))
    plt.imshow(x_pad,cmap='gray')
    plt.title('Padded Image')
    
    #build dct transform matrix
    A=DCT1d_matrix(x_pad.shape[0])
    AT=A.T
    
    #DCT
    X=A@x_pad@AT
    
    return X

def IDCT2D(X):
    #check
    if not(X.shape[0]==X.shape[1]):
        print("Err:this image is not squre")
        return
    
    #build dct transform matrix
    A=DCT1d_matrix(X.shape[0])
    AT=A.T
    
    #IDCT
    x=AT@X@A
    
    return x

图像DCT正变换的例子，导入测试图像

from skimage import data
#load image
Img = data.astronaut()
print(Img.shape)

plt.figure(figsize=(3, 3))
plt.imshow(Img,cmap='gray')
plt.title('Astronaut')

分别用自己定义的函数和scipy库自带的函数对图像进行二维DCT运算，其中库函数用于验证我自己写的DCT函数的运行结果是否正确。

#调用自己定义的函数
Img_DCT=DCT2D(Img)
fig=plt.figure(figsize=(3,3))
plt.imshow(Img_DCT,cmap='gray')
#调用scipy库函数
dctlib=dct(dct(Img.T, norm='ortho').T, norm='ortho')
fig=plt.figure(figsize=(3,3))
plt.imshow(dctlib,cmap='gray',vmin=np.min(dctlib), vmax=np.max(dctlib))
print("my result:",Img_DCT)
print("result of lib:",dctlib)

运行结果如下：

整幅图像的DCT变换结果像是一张全黑的图，这是由于DCT系数只在左上角的很小一块区域的数值较大，而其他大部分区域都是很小的值，让人看起来就像是一幅全黑的图像。在后面的文章中，我打算只对整幅图像中的一小块内容做DCT变换，便于更好的演示。在演示之前，我们先看看图像DCT的反变换。

反变换

Img_idct=IDCT2D(Img_DCT)
fig=plt.figure()
plt.subplot(1,2,1)
plt.imshow(Img,cmap='gray')
plt.title('Org image')

plt.subplot(1,2,2)
plt.imshow(Img_idct,cmap='gray')
plt.title('Inv dct image')

运行结果如下：

一小块图像的DCT正变换与反变换

从图像中截取一小段图片，并对他进行二维DCT：

tiny = Img[20:28, 30:38]    # a tiny 8 x 8 block, in the color=0 (Red) channel

fig=plt.figure()
plt.imshow(tiny)
plt.colorbar()

# And here are the numbers.
print("tiny:\n",tiny)

运行结果，这是原图中截取的一小段：

#2d dct of tiny
tiny_dct=DCT2D(tiny)

fig=plt.figure()
plt.imshow(tiny_dct)
plt.colorbar()

np.set_printoptions(linewidth=100) # output line width (default is 75)
round6 = np.vectorize(lambda m: '{:6.1f}'.format(m))
round6(tiny_dct)

这是与之对应的DCT结果，在二维DCT除了左上角(对应最低频率cos函数的系数，即，直流分量)以外，大量的DCT系数都很小，且越是接近左下角(对应频率最高的cos函数的系数)越是接近于0：

如果要压缩图像的话，可以把部分高频dct系数置0，以达到压缩的目的：

# First make a copy to work on.
tinyDCT_chopped = tiny_dct.copy()
N=tinyDCT_chopped.shape[0]
# Then zero the pieces below the x + y = 8 line.
for x in range(N):
    for u in range(N):
        if x + u > 8:
            tinyDCT_chopped[x,u] = 0.0

fig=plt.figure()
plt.imshow(tinyDCT_chopped)
plt.colorbar()

round6(tinyDCT_chopped)

将压缩前后的小图进行对比，可以看到虽然我在上面对大量的高频DCT系数采取了置0操作，但反变换回去后的图像和原图相差无几:

#将压缩前后的小图像进行对比
tiny_zip=IDCT2D(tinyDCT_chopped)

fig=plt.figure()
plt.subplot(1,2,1)
plt.imshow(tiny,cmap='gray')
plt.title('Org image')

plt.subplot(1,2,2)
plt.imshow(tiny_zip,cmap='gray')
plt.title('compressed image')

运行结果：

（全文完）

作者 --- 松下J27

参考文献：

1，《数字图像处理技术详解与Visual C++实践》---左飞

2，dct — SciPy v1.14.0 Manual

3，dct

4，https://en.wikipedia.org/wiki/Discrete_cosine_transform

5，https://en.wikipedia.org/wiki/Cross-correlation

6，Amplitude, Period, Phase Shift and Frequency

原文地址：https://blog.csdn.net/daduzimama/article/details/140857411

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：网络体系结构及通信协议(UDP)
下一篇：大学新生编程入门指南-选择语言、制定计划、避免陷阱

leetcode289:生命游戏
根据，简称为，是英国数学家约翰·何顿·康威在 1970 年发明的细胞自动机。给定一个包含m × n个格子的面板，每一个格子都可以看成是一个细胞。每个细胞都具有一个初始状态：1即为（live），或0即为
阅读更多2024-10-20
MongoDB数据恢复
注意：两个MongoDB的版本要一致，本文使用的是mongo:4.2.24。先把K8S上面的MongoDB 容器停止（可以把副本改成0）。1、将容器挂载MongoDB的数据目录备份到本地。经常是数据文
阅读更多2024-10-20
C#中实现事务
C#中实现事务
阅读更多2024-10-20
【LeetCode每日一题】——560.和为 K 的子数组
给你一个整数数组 nums 和一个整数 k ，请你统计并返回该数组中和为 k 的子数组的个数。子数组是数组中元素的连续非空序列。
阅读更多2024-10-20
「漏洞复现」满客宝智慧食堂系统 selectUserByOrgId 未授权访问漏洞
请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，作者不为此承担任何责任。工具来自网络，安全性自测，如有侵权请联系删除。本次
阅读更多2024-10-20
React面试题目（从基本到高级）
React前端面试常见题目涵盖了React的基础概念、组件、状态管理、生命周期、性能优化等多个方面。
阅读更多2024-10-20
12.个人博客系统（Java项目基于spring和vue）
1 在校学习的学生，可用于日常学习使用或是毕业设计使用 2 毕业一到两年的开发人员，用于锻炼自己的独立功能模块设计能力，增强代码编写能力。 3 亦可以部署为商化项目使用。 4 需要完整资料及源码
阅读更多2024-10-20
YoloV8改进策略：注意力改进|DeBiFormer，可变形双级路由注意力|引入DeBiLevelRoutingAttention注意力模块（全网首发）
本次改进的核心在于将DeBiLevelRoutingAttention模块嵌入到YoloV8的主干网络中，具体位置是在SPPF（Spatial Pyramid Pooling Fast）模块之后。这一
阅读更多2024-10-20
word取消自动单词首字母大写
情况说明：在word输入单词后首字母会自动变成大写取消单词首字母大写步骤：（1）点击菜单栏文件（2）点击“更多”——>“选项”（3）点击“校对”——>“自动更正选项”（4）取消“句首字母大
阅读更多2024-10-20
web前端网页用户注册页面
【代码】web前端网页用户注册页面。
阅读更多2024-10-20

数字图像处理 --- 图像的离散余弦变换(python实战)

图像的离散余弦变换(python实战)

图像的离散余弦变换

正变换

反变换

一小块图像的DCT正变换与反变换

相关文章