[论文笔记] Pai-megatron-patch cpu-offload 改到 Qwen2

🕗 发布于 2024-07-21 14:25 python

Add MPI Support for tp-comm-overlap and Cpu-Offload for Mcore Distrib… by jerryli1981 · Pull Request #283 · alibaba/Pai-Megatron-Patch · GitHub

以上是在 llama-70B 上实现的 cpu-offload 方法。

下面是在主分支上，仿照 LLaMA-70B，在 Qwen2 上实现 cpu-offload 代码。

1、optimizer选项设置：argument.py加入optimizer参数(cpu-adam)

2、optimizer初始化方法：init.py加入'cpu-adam'参数加载CPUAdam

3、optimizer CPUAdam方法：

加入CPUAdam文件。

kernel_loader.py

nvme_optimizer.py

原文地址：https://blog.csdn.net/Trance95/article/details/140547151

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：开源PDF解析工具marker 和 MinerU的解析效果对比
下一篇：深入理解 JavaScript 中的 with 语句

第七章：TDengine SHOW 命令大全
SHOW命令用于获取TDengine数据库中的系统信息、元数据、状态等。通过SHOW命令，用户可以方便地查看数据库的各种信息，如数据库列表、表结构、索引、连接信息等。
阅读更多2024-11-18
【Linux内核剖析】深入分析inet_init的处理机制
inet_init是 Linux 内核中用于初始化 TCP/IP 协议栈的函数。它在内核启动时被调用，完成各种协议和数据结构的注册和初始化。
阅读更多2024-11-18
【C++进阶篇】——string类的使用
是 C++ 标准库的一部分，但它不是 STL 容器的一部分。STL 容器是指那些基于模板的容器，如std::list等。提供了类似于 STL 容器的功能，比如动态内存管理、迭代器支持等，但它的设计和实
阅读更多2024-11-18
Javaweb开发核心之应用上下文知识（笔记）
⽐比如：PageContext，ServletRequest，HttpSession，ServletContext；简介:讲解Javaweb作⽤用域对象介绍和ServletContext讲解。就是对象
阅读更多2024-11-18
Web Service 学习笔记
Web Service 即 web 服务，它是一种跨编程语言和跨操作系统平台的远程调用技术。Java 中共有三种 Web Service 规范：- JAX-WS(JAX-RPC): 基于 xml 数据
阅读更多2024-11-18
使用函数的选择法排序
其中a是待排序的数组，n是数组a中元素的个数。该函数用选择法将数组a中的元素按升序排列，结果仍然在数组a中。
阅读更多2024-11-18
Leetcode 3356. Zero Array Transformation II
Leetcode 3356. Zero Array Transformation II
阅读更多2024-11-18
图形最高分
游戏一开始，玩家在每一轮可以合并两个图形，当只有一个图形的时候游戏结束，每个图形都有一个大小，合并完成后的图形的大小为x+y,x和y分别为合并之前的两个图形，与此同时，玩家会获得x*y的分数。现在屏幕
阅读更多2024-11-18
nodejs入门（1）：nodejs的前后端分离
浏览器和前端web服务器交互，前端web服务器和后端web服务器进行交互，前端web服务器向后端的web服务器请求数据，对后端服务器得到请求后将数据传递给前端web服务器，格式化后由浏览器展示。好的，
阅读更多2024-11-18
wife_wife
在下面的信息中加上"__proto__":{"isAdmin":true}上网查了一下，用到了Javascript原型链污染攻击。用这个漏洞的前提是后端使用的语
阅读更多2024-11-18

[论文笔记] Pai-megatron-patch cpu-offload 改到 Qwen2

1、optimizer选项设置：argument.py加入optimizer参数(cpu-adam)

2、optimizer初始化方法：__init__.py加入'cpu-adam'参数加载CPUAdam

3、optimizer CPUAdam方法：

相关文章

2、optimizer初始化方法：init.py加入'cpu-adam'参数加载CPUAdam