大语言模型---Llama不同系列的权重参数文件提取；Llama-7B权重文件提取；Llama-8B权重文件提取；主要代码功能解析

🕗 发布于 2024-11-27 09:41 llama 人工智能 chatgpt AIGC python3.11

文章目录

1. 概要
2. Llama-7B权重文件提取
3. Llama-8B权重文件提取
4. 主要代码功能解析

1. 概要

Llama 系列模型（Meta 发布的大语言模型）在开源社区广受欢迎，不同版本（前文已经介绍过7B和8B的区别，详情请点击链接）在应用场景和硬件需求上各有不同，其权重文件的提取方式也略有差异。本文将通过代码讲解如何获取和提取 Llama 7B 和 8B 的权重参数文件。

2. Llama-7B权重文件提取

from transformers import AutoTokenizer, AutoModelForCausalLM

def save_weight_int(int_weight: torch.Tensor, path):
    if path[-4:] != '.bin':
        raise ValueError('Path must end with .bin')
    int_weight.cpu().detach().numpy().astype(np.int32).tofile(path)

if __name__ == '__main__':

tokenizer = AutoTokenizer.from_pretrained(model_card, local_files_only = True, cache_dir = "./model-storage")
    model = AutoModelForSequenceClassification.from_pretrained(model_card, local_files_only = True, cache_dir = "./model-storage")

for (i, w) in model.model.layers[0].named_parameters():
    if len(w.shape) == 2:
        pp_size = w.shape[0]
        pp_size <<= args.log_off_factor  # 位移操作
    elif len(w.shape) == 1:
        (pp_size,) = w.shape
    else:
        raise ValueError(f"Unexpected shape {w.shape} for parameter {i}")
        print(f"Layer {i}, Parameter {j}, Shape: {w_orig.shape}")
        save_weight_int(w_orig, f"./zkllm-workdir/Llama-2-{args.model_size}b/layer-{i}-{j}-int.bin")

3. Llama-8B权重文件提取

from transformers import AutoTokenizer, AutoModelForCausalLM

def save_weight_int(int_weight: torch.Tensor, path):
    if path[-4:] != '.bin':
        raise ValueError('Path must end with .bin')
    int_weight.cpu().detach().numpy().astype(np.int32).tofile(path)

if __name__ == '__main__':
for i, layer in enumerate(model.model.layers):
    for j, w in layer.named_parameters():
        # 中间层参数的处理
        if len(w.shape) == 2:
            w_orig = w.float().T
        else:
            w_orig = w.float()
        print(f"Layer {i}, Parameter {j}, Shape: {w_orig.shape}")
        save_weight_int(w_orig, f"./zkllm-workdir/Llama-2-{args.model_size}b/layer-{i}-{j}-int.bin")

# 处理顶层参数（如输出层的 score.weight）
for name, param in model.named_parameters():
    if "score.weight" in name:  # 仅处理输出权重
        if len(param.shape) == 2:
            w_orig = param.float().T
        else:
            w_orig = param.float()
        print(f"Processing Output Layer Parameter {name}, Shape: {w_orig.shape}")
        save_weight_int(w_orig, f"./zkllm-workdir/Llama-2-{args.model_size}b/{name.replace('.', '-')}-int.bin")

4. 主要代码功能解析

save_weight_int(int_weight: torch.Tensor, path) 函数
作用：将权重量化为 int32 数据，并以 .bin 格式保存到指定路径。
遍历 model.model.layers 的所有参数

for i, layer in enumerate(model.model.layers):
    for j, w in layer.named_parameters():

遍历模型的每一层（model.model.layers），i是层索引，layer 是每一层的模块。
使用 named_parameters() 遍历每层中的所有参数（权重和偏置）。
- j 是参数名称（例如 self_attn.q_proj.weight）。
- w 是参数张量

中间参数处理（可以去掉）

if len(param.shape) == 2:
w_orig = param.float().T
else:
w_orig = param.float()

原文地址：https://blog.csdn.net/weixin_43883448/article/details/144054045

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：从0开始搭建一个记事本项目
下一篇：【大模型】LLaMA-Factory的环境配置、微调模型与测试

金铲铲S13双城之战自动拿牌助手
金铲铲S13双城之战自动拿牌助手基于python和pyautogui实现
阅读更多2024-11-27
OSPTrack：一个包含多个生态系统中软件包执行时生成的静态和动态特征的标记数据集，用于识别开源软件中的恶意行为。
2024-11-22 ，由格拉斯哥大学创建的OSPTrack数据集，目的是通过捕获在隔离环境中执行包和库时生成的特征，包括静态和动态特征，来识别开源软件（OSS）中的恶意指标，特别是在源代码访问受限时
阅读更多2024-11-27
STM32中I2C总线中，允许从机控制SCL总线吗？
在I2C总线中，不允许从机控制SCL总线。
阅读更多2024-11-27
C/C++ 每日一练：在矩阵中查找特定值
本次练习将解决一个经典问题——在一个二维矩阵中查找特定的值。通过这个练习，可以更好地掌握二维数组的操作，以及优化算法的设计。给定一个二维矩阵 matrix，每行从左到右递增排序，每列从上到下递增排序，
阅读更多2024-11-27
【Zookeeper 和 Kafka】为什么 Zookeeper 不用域名？
如果是容器化部署或者 IP 动态变化，给 Zookeeper 配域名也不是不行，但大部分情况下，直接用 IP 地址就够啦！Zookeeper 通信是高频、低延迟的，域名解析（DNS）会增加额外开销，直
阅读更多2024-11-27
解决SpringBoot连接Websocket报：请求路径 404 No static resource websocket.
解决SpringBoot连接Websocket报：请求路径 404 No static resource websocket.
阅读更多2024-11-27
Android 11 三方应用监听关机广播ACTION_SHUTDOWN
关机广播监听
阅读更多2024-11-27
二分查找-02-搜索插入位置
给定一个排序数组和一个目标值，在数组中找到目标值，并返回其索引。如果目标值不存在于数组中，返回它将会被按顺序插入的位置。输入: nums = [1,3,5,6], target = 5。输入: num
阅读更多2024-11-27
【计网笔记】网络层
无连接服务，即数据报服务有连接服务，即虚电路服务。
阅读更多2024-11-27
C语言中const char *字符进行切割实现
【代码】C语言中const char *字符进行切割实现。
阅读更多2024-11-27