神经网络模型量化代码解析

🕗 发布于 2024-10-17 22:31 神经网络 numpy 人工智能

PTQ Post Training Quantization 是训练后量化，也叫做离线量化，根据量化零点是否为 0，训练后量化分为对称量化和非对称量化；根据数据通道顺序 NHWC(TensorFlow) 这一维度区分，训练后量化又分为逐层量化和逐通道量化。目前 nvidia 的 TensorRT 框架中使用了逐层量化的方法，每一层采用同一个阈值来进行量化。逐通道量化就是对每一层每个通道都有各自的阈值，对精度可以有一个很好的提升。

量化的本质就是映射，神经网络权值一般在[-1,1],量化后映射到 int8 也就是 [0,255]

可以看出映射的本质也是函数，而且也就是直线函数

import os
os.environ["KMP_DUPLICATE_LIB_OK"] = "TRUE"



import torch
import torchvision
import matplotlib.pyplot as plt

# 加载预训练的模型
model = torchvision.models.resnet18(pretrained=True)

# 获取卷积层的权值,量化前的权重
conv1_weights = model.conv1.weight.data

# 可视化权值

q_after=[]


plt.axis('off')
for i in range(64):

    c=conv1_weights[i].numpy().flatten()
    
    scale=255/(c.max()-c.min())
    
   
    zero=255-c.max()*scale
    
    qc=scale*c+zero
    
    q_after.append(qc)
    
    print(qc.round())
    
    print(c.max(),c.min())

    x = list(range(len(c)))
    


    plt.plot(x,c)
    
    #设置说明框
    legend = plt.legend(loc='best', shadow=True)
    frame = legend.get_frame()
    frame.set_facecolor('0.90') #frame的颜色
plt.show()



print('量化后的权重')
print(np.array(q_after).reshape([64,3,7,7]))

原文地址：https://blog.csdn.net/luoganttcc/article/details/142989209

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：软件开发----设计模式每日刷题（转载于牛客）
下一篇：C与C++ —— 深度剖析区别

leetcode289:生命游戏
根据，简称为，是英国数学家约翰·何顿·康威在 1970 年发明的细胞自动机。给定一个包含m × n个格子的面板，每一个格子都可以看成是一个细胞。每个细胞都具有一个初始状态：1即为（live），或0即为
阅读更多2024-10-20
MongoDB数据恢复
注意：两个MongoDB的版本要一致，本文使用的是mongo:4.2.24。先把K8S上面的MongoDB 容器停止（可以把副本改成0）。1、将容器挂载MongoDB的数据目录备份到本地。经常是数据文
阅读更多2024-10-20
C#中实现事务
C#中实现事务
阅读更多2024-10-20
【LeetCode每日一题】——560.和为 K 的子数组
给你一个整数数组 nums 和一个整数 k ，请你统计并返回该数组中和为 k 的子数组的个数。子数组是数组中元素的连续非空序列。
阅读更多2024-10-20
「漏洞复现」满客宝智慧食堂系统 selectUserByOrgId 未授权访问漏洞
请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，作者不为此承担任何责任。工具来自网络，安全性自测，如有侵权请联系删除。本次
阅读更多2024-10-20
React面试题目（从基本到高级）
React前端面试常见题目涵盖了React的基础概念、组件、状态管理、生命周期、性能优化等多个方面。
阅读更多2024-10-20
12.个人博客系统（Java项目基于spring和vue）
1 在校学习的学生，可用于日常学习使用或是毕业设计使用 2 毕业一到两年的开发人员，用于锻炼自己的独立功能模块设计能力，增强代码编写能力。 3 亦可以部署为商化项目使用。 4 需要完整资料及源码
阅读更多2024-10-20
YoloV8改进策略：注意力改进|DeBiFormer，可变形双级路由注意力|引入DeBiLevelRoutingAttention注意力模块（全网首发）
本次改进的核心在于将DeBiLevelRoutingAttention模块嵌入到YoloV8的主干网络中，具体位置是在SPPF（Spatial Pyramid Pooling Fast）模块之后。这一
阅读更多2024-10-20
word取消自动单词首字母大写
情况说明：在word输入单词后首字母会自动变成大写取消单词首字母大写步骤：（1）点击菜单栏文件（2）点击“更多”——>“选项”（3）点击“校对”——>“自动更正选项”（4）取消“句首字母大
阅读更多2024-10-20
web前端网页用户注册页面
【代码】web前端网页用户注册页面。
阅读更多2024-10-20

神经网络模型量化代码解析

量化的本质就是映射，神经网络权值一般在[-1,1],量化后 映射到 int8 也就是 [0,255]

可以看出 映射的本质也是函数，而且也就是 直线函数

相关文章

量化的本质就是映射，神经网络权值一般在[-1,1],量化后映射到 int8 也就是 [0,255]

可以看出映射的本质也是函数，而且也就是直线函数