Datawhale AI冬令营(第一期)--零基础定制你的专属大模型
本文主要简述如何快速完成和一些小细节
第一步下载嬛嬛数据集
数据来源:self-llm/dataset/huanhuan.json at master · datawhalechina/self-llm · GitHub
注意:1.一定是数据集下载完成一定是.json结尾的
2.这个是github的网址,可能会遇到打不开的情况
如果打不开这个网址直接点击下载这个压缩包,记得下载完要解压缩并且解压缩的位置要记住
(如果这一步不会可以联系助教,或者学习群里的同学)
第二步打开星火大模型平台
废话不多说直接上链接:星火大模型精调平台
这里有很多种方式登入,手机快捷是最简单的方式之一。
登入成功你将看到下面这个界面
如果到这一步,那么你已经迈出成功的第二步了。可能会问怎么是第二步,因为下载数据集被我放到上面跟学习手册顺序不一样。
第三步定制专属嬛嬛大模型
下面只需要按图片的步骤来,如果遇到不懂的截图问助教(ps:截多一点)
这里是推荐这个模型也可以换别的,别的可能再后面会遇到一些小问题小白请按照图上的来
这时候就会有同学问”怎么找不到这个界面“是下面这个界面。我当时也卡了一下,发现往下拉一下就好了。(因为我真的很粗心的)
这里可以直接拖进去,如果拖不进去看看是不是哪里没做好。为了节省时间选择文件也是OK的。
下面两个图其实是可以调整的,新手宝宝真的不建议动,直接默认就好。
这里可以看见是免费的,不需要担心收费的问题。点击提交即可开始我们的炼丹之旅。
Q:这样就结束了吗?
A:肯定不是的,学习手册还有那么长。趁现在还在训练,我们需要创建一个应用。具体有什么用后面你就知道了。
第四步创建应用
点击这个链接:控制台-讯飞开放平台
可以到讯飞的另外一个平台,之前那个不要关掉一会儿还要用到!!!
如果之前有用过的,就不要关这个了。完成就回到刚刚那个界面,一般是10分钟左右,明显还要一会儿。
等这个跑满了就可以开始发布的工作
有时候看不到这个体验,就点击服务管理,下面我举个例子:
可以看见还在发布中,稍微等一下就是下面这个界面就可以开始体验了
(这里不是说internlm2.5 7b chat不好,是举个发布中的例子)
第五步体验AI嬛嬛
下面我们开启体验之旅:
这里我们要感谢一下晏助教大大提供的思路,给大家展示一下:
如果有细心的小伙伴就会发现这个八个瑞士卷的问题(还没看直播的快去看看回放)
如果出现bug请及时联系助教,下面展示几种BUG:
可以试一下重新训练,或者退出重新登入
打卡
然后就到了我们最重要的打卡环节了(这里想必看过群公告和学习手册的小伙伴都懂)
对学习手册的问题这里简单的回答一下(仅代表个人观点)
对于这个练习题,关于'嬛嬛数据集'采用的Alpaca格式,我们可以逐一分析选项:
-
数据集中instruction字段可以为空,因为有些任务不需要指令
这个说法是正确的。在Alpaca格式的数据集中,instruction
字段通常包含一个简短的任务说明或指令。然而,并不是所有的任务都需要明确的指令,因此在某些任务中,instruction
字段是可以为空的。 -
input字段必须包含具体的输入内容,否则数据集无效
这个说法是错误的。Alpaca格式并没有强制要求input
字段必须包含具体内容。有些任务可能没有输入,或者input
字段可以为空,特别是在开放式任务中。 -
output字段是可选的,不是所有样本都需要标准答案
这个说法是正确的。Alpaca格式允许output
字段是可选的。对于一些任务,输出可能是开放的,或者在某些情况下没有标准答案。 -
input字段在开放式任务中可以为空字符串,这是格式允许的
这个说法是正确的。对于开放式任务(如生成文本的任务),input
字段可以为空字符串,因为开放式任务通常不依赖于特定的输入内容。
综上所述,正确的选项是:
- instruction字段可以为空,因为有些任务不需要指令
- output字段是可选的,不是所有样本都需要标准答案
- input字段在开放式任务中可以为空字符串,这是格式允许的
思考题:
Q:AI是什么?
A:AI(人工智能)是指通过模拟人类的思维、学习、决策等过程,使计算机或机器能够执行通常需要人类智能的任务。AI的目标是让机器具备感知、理解、学习、推理、问题解决等能力,从而在不同的领域(如语音识别、图像处理、自然语言处理等)中自动化执行任务。
最后感谢12的小伙伴一起的努力,感谢Datawhale AI冬令营和讯飞提供宝贵的学习机会,以及Datawhale团队。
感觉无代码训练大模型还是很轻松的,希望大家都能得到想要的收获!
最后晒一下12班的优秀成绩,如果有什么不对的希望指正,谢谢!
原文地址:https://blog.csdn.net/m0_63714693/article/details/143810316
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!