自学内容网 自学内容网

大模型备案安全评估报告编写说明

 

一、语料安全评估

(一)评估内容

1.文本训练语料规模

训练语料存储规模,按文本格式存储时的语料大小。

训练语料数量,按词元(Token)计数。

2.各类型语料规模

训练语料中的中文文本、英文文本、代码、图片、音频、视频及其他语料的规模。

3.训练语料来源

训练语料来源的组成情况,按照开源语料、自采语料、商业语料进行分类。

境外开源网站语料内中文文本、英文文本、代码、图片、音频、视频及其他语料的规模。

自采语料内中文文本、英文文本、代码、图片、音频、视频及其他语料的规模。

商业语料内中文文本、英文文本、代码、图片、音频、

视频及其他语料的规模。

4.语料标注数量

语料标注的数量,仅限文本和图片,按标注单元计数,通常按条数、张数。

5.标注人员情况

标注人员的数量,标注人员的类型,通常包括内部、外包。

标注人员培训时间、培训数量等情况。

6.标注规则

按照《生成式人工智能服务管理暂行办法》第四条要求制定的标注规则。

7.标注内容准确性核验

标注内容准确性人工核验比例。

8.语料合法性

语料来源合法性情况。

语料是否包含侵害他人知识产权内容。

语料是否包含违法违规的个人信息内容。

(二)评估结论

评估结论应包括以下内容:

1.语料是否符合《生成式人工智能服务管理暂行办法》相关规定,是否含有违反我国法律法规明确禁止的内容。

2.语料中包含个人信息语料的数量、种类,是否符合《生成式人工智能服务管理暂行办法》规定。

3.因语料产生知识产权纠纷的风险分析。

4.防范语料安全风险的措施和建议。

二、模型安全评估

1.语料内容评估

采用人工抽检,说明抽检数量与合格率。

采用关键词抽检,说明抽检数量与合格率。

采用分类模型抽检,说明抽检数量与合格率。

2.生成内容评估

采用人工抽检,说明抽检数量与合格率。

采用关键词抽检,说明抽检数量与合格率。

采用分类模型抽检,说明抽检数量与合格率。

3.涉知识产权、商业秘密的评估

评估方法、评判标准以及评估结果等。

4.涉民族、信仰、性别等的评估

评估方法、评判标准以及评估结果等。

5.涉透明性、准确性、可靠性等的评估

评估方法、评判标准以及评估结果等。

三、安全措施评估

1.模型适用人群、场合、用途

服务的适用人群,是否适用未成年人、学生等。

适用场合,是否适用关键信息基础设施、自动控制、医疗信息服务、心理咨询等。

服务范围,是否限定或未限定特定领域。

2.服务过程中收集保存个人信息情况

服务过程中收集保存个人信息情况,包括个人信息的类型、数量、用途以及保存期限。

3.收集个人信息征得个人同意情况

收集个人信息征得个人同意的方式。

4.受理处理使用者查阅、复制、更正、补充、删除个人信息请求的情况

受理处理的条件以及途径方法。

5.图片、视频标识情况

标识的样式,按1:1比例贴入。

标识在图片、视频中的具体位置。

标识频度,如每帧、跳帧等。

6.接受公众或使用者投诉举报情况

接受公众或使用者投诉举报的途径及反馈方式。

7.服务协议情况

上述1至6内容是否已经写入模型服务协议。

8.非法内容拦截措施

监看人员的数量。

预置关键词拦截情况,并提供预置关键词拦截列表。

分类模型的检测情况,说明分类模型研制情况和准确性。

9.拒答率

拒绝回答或者以简单模板回答数量占总测试数量的比率。

10.模型更新、升级

在何种情况下重新进行预训练,如较频繁发现生成非法内容。

重新预训练所需的时间。

计划优化训练(fine-tuning)的频度及所需时间。

四、总体结论

生成式人工智能(大语言模型)安全评估的评估结论重点应包括以下内容:

1.是否符合《生成式人工智能服务管理暂行办法》的相关规定。

2.语料、模型、安全措施等方面存在的主要风险。

3.模型上线提供服务后主要安全风险预判及防范措施建议。

4.如果模型上线提供服务后对用户和社会造成损害,服务提供者是否具备相应处置能力。

5.是否建议上线提供服务。

五、备案建议

如果企业能自己做,可以考虑安排产品、算法、法务等团队成员一起完成大模型备案、算法备案,毕竟找代办公司也是一笔几万块的不少的支出费用,如果自己办理有困难,也欢迎站内信、留言交流。

关于我们

算法备案超过100个项目经验,国内算法备案第一梯队,大模型备案也有多个成功案例,欢迎沟通交流。


原文地址:https://blog.csdn.net/2403_87457919/article/details/143499657

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!