基于大语言模型智能体的自主机器学习

🕗 发布于 2024-11-06 08:07 学习 人工智能 深度学习 机器学习 语言模型

文章介绍了MLR-Copilot框架，这是一种利用大型语言模型（LLMs）来自动化机器学习研究中创意生成、实验设计和实施过程的方法。该框架分为三个阶段：

首先通过阅读现有研究文献，使用LLM驱动的IdeaAgent来生成研究假设和实验计划；
其次，ExperimentAgent将这些计划转换为可执行的代码，并检索原型代码、候选模型和数据；
最后，在ExperimentAgent的管理下执行实验，通过集成人类反馈和迭代调试机制来提高实验成果的质量。作者们对该框架在五个机器学习研究任务上的表现进行了评估，并证明了其促进研究进展和创新的潜力。

此外，文章还提到了一个具体的研究案例——“学生反馈分析的数据集和基线”，该案例展示了如何构建一个包含大学学生反馈的语料库，并对其进行详细的注释，用于进行不同层面的情感分析任务。

1 MLR-Copilot框架

MLR-Copilot 是一个旨在自动化机器学习研究过程的新框架，它利用大型语言模型（LLMs）来提高研究生产力。以下是 MLR-Copilot 框架的关键组成部分和步骤：

（1）研究理念生成：

IdeaAgent：这是一种由 LLM 驱动的智能体，它能从现有的研究论文中提取信息，生成新的研究假设和实验设计。
输入处理：从论文中提取标题、摘要、引言和相关工作部分，形成输入提示。
文献分析：提取研究任务、研究缺口和关键词，并根据这些信息检索最近的相关工作。

（2）实验实施：

这一阶段的任务是利用ExperimentAgent将前一阶段产生的实验计划转化为可执行的代码。

原型代码检索：根据实验计划检索相关的原型代码。
模型和数据检索（可选）：如果需要，检索候选模型和数据集。

（3）实施执行：

ExperimentAgent 继续发挥作用，运行实验并收集结果。

反馈机制：提供人类反馈的机会以便进行迭代调试，提高实验成功的可能性。

该框架还有其他一些关键特点：

自动反馈循环：如果实验遇到问题，框架可以判断问题是由于研究假设本身还是实施中的错误，并进行相应的调整。
灵活性：虽然一些先前的工作集中在预定义任务和成熟代码模板上，但 MLR-Copilot 能够处理更广泛的探索性和创造性的研究任务。
全面性：与专注于实验实施的其他系统不同，MLR-Copilot 覆盖了从研究假设生成到实验执行的整个过程。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段（10天）：初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。

大模型 AI 能干什么？
大模型是怎样获得「智能」的？
用好 AI 的核心心法
大模型应用业务架构
大模型应用技术架构
代码示例：向 GPT-3.5 灌入新知识
提示工程的意义和核心思想
Prompt 典型构成
指令调优方法论
思维链和思维树
Prompt 攻击和防范
…

第二阶段（30天）：高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习，学会构造私有知识库，扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架，抓住最新的技术进展，适合 Python 和 JavaScript 程序员。

为什么要做 RAG
搭建一个简单的 ChatPDF
检索的基础概念
什么是向量表示（Embeddings）
向量数据库与向量检索
基于向量检索的 RAG
搭建 RAG 系统的扩展知识
混合检索与 RAG-Fusion 简介
向量模型本地部署
…

第三阶段（30天）：模型训练

恭喜你，如果学到这里，你基本可以找到一份大模型 AI相关的工作，自己也能训练 GPT 了！通过微调，训练自己的垂直大模型，能独立训练开源多模态大模型，掌握更多技术方案。

到此为止，大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗？

为什么要做 RAG
什么是模型
什么是模型训练
求解器 & 损失函数简介
小实验2：手写一个简单的神经网络并训练它
什么是训练/预训练/微调/轻量化微调
Transformer结构简介
轻量化微调
实验数据集的构建
…

第四阶段（20天）：商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知，可以在云端和本地等多种环境下部署大模型，找到适合自己的项目/创业方向，做一名被 AI 武装的产品经理。

硬件选型
带你了解全球大模型
使用国产大模型服务
搭建 OpenAI 代理
热身：基于阿里云 PAI 部署 Stable Diffusion
在本地计算机运行大模型
大模型的私有化部署
基于 vLLM 部署大模型
案例：如何优雅地在阿里云私有部署开源大模型
部署一套开源 LLM 项目
内容安全
互联网信息服务算法备案
…

学习是一个过程，只要学习就会有挑战。天道酬勤，你越努力，就会成为越优秀的自己。

如果你能在15天内完成所有的任务，那你堪称天才。然而，如果你能完成 60-70% 的内容，你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】或点击下方蓝色字即可免费领取↓↓↓

**读者福利 |** 👉2024最新版CSDN大礼包：《AGI大模型学习资源包》免费分享 **（安全链接，放心点击）**

在这里插入图片描述

原文地址：https://blog.csdn.net/HUANGXIN9898/article/details/143504464

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【Git】Git常用命令
下一篇：【LeetCode】【算法】236. 二叉树最近公共祖先

使用 ABAP GIT 发生 IF_APACK_MANIFEST dump
它发生在 CREATE OBJECT lo_manifest_provider TYPE (ls_manifest_implementation-clsname)一起使用，但如果拉取的项目打算安装在
阅读更多2024-11-06
ReactPress—基于React的免费开源博客&CMS内容管理系统
ReactPress 是使用React开发的开源发布平台，用户可以在支持React和MySQL数据库的服务器上架设属于自己的博客、网站。也可以把 ReactPress 当作一个内容管理系统（CMS）来
阅读更多2024-11-06
hhdb数据库介绍(4)
介绍关于hhdb的名词
阅读更多2024-11-06
EasyExcel 学习之导出 “提示问题”
导出提示问题
阅读更多2024-11-06
nginx-proxy-manager实现反向代理+自动化证书(实战)
nginx-proxy-manager
阅读更多2024-11-06
python学习记录14
1.字符串的编码和解码2.字符串的验证3.字符串的拼接4.字符串的去重5.正则表达式
阅读更多2024-11-06
在Java中，实现数据库连接通常使用JDBC
学习总结学习总结1、掌握入门到进阶知识(持续写作中……2、学会数据库入门到入土用法(创作中……3、手把手教你开发炫酷的制作(完善中……4、牛逼哄哄的编程利器技巧(编写中……5、面经吐血整理的技巧(更新
阅读更多2024-11-06
Tomcat中如何指定JDK版本
在Tomcat中指定JDK版本可以通过设置环境变量或修改启动脚本来实现。
阅读更多2024-11-06
2024年三个月自学网络安全（黑客技术）进阶手册。
网络安全可以基于攻击和防御视角来分类，我们经常听到的 “红队”、“渗透测试” 等就是研究攻击技术，而“蓝队”、“安全运营”、“安全运维”则研究防御技术。走安全行业的工程方向的，技术上面其实有很大的重叠
阅读更多2024-11-06
自动化生成和发送报告的Python脚本
通过上述步骤，我们成功编写了一个Python脚本，自动化生成和发送销售报告。这个脚本可以根据需要进行扩展和修改，以适应不同的报告需求。数据源：可以将数据源更改为数据库（如MySQL、PostgreSQ
阅读更多2024-11-06