大模型面试（三）

🕗 发布于 2024-07-11 01:15 面试 深度学习

这次是某家公司的一个电话面试，问的过程还比较简单直接。

问：我们在大模型开源项目的应用上遇到了什么困难？

这个。。有两个困难，一个是RAG的优化，一开始RAG是比较慢的，而且召回率不高；

后来使用了HyQE的方法，针对一段文本，提出一个问题和它对应，以补充的问题来建立文档索引。当用户提问的时候，直接在数据库里寻找相似问题，这样检索效率高而且召回率高。

第二个是语音识别识别错误的问题；把识别语音和转写文字的特征一起输入到神经网络里，这样可以提高识别准确度。（或者多几个候选词）

然后问到了我以前在一家人工智能公司的工作经验，问到了其中的内容审核项目。

这个项目的创新点在哪里？过拟合的情况？

主要是从网上爬取文本数据，然后给公开的审核接口先过一遍，然后训练过程中遇到的难样本，重新标注再训练。

正负样本不均匀的问题：实际场景，正样本远少于负样本，用了针对样本不平衡的loss比如dice loss，weighted ce等，然后多种loss采用加权和的方式进行融合（问题：有没有其他融合的方式呢？辅助loss？）。

过拟合？主要是看在测试集上的loss表现吧。

还提到了分词的问题；但是这个是不可避免的，这种词要衡量一个边界条件，要不要使用关键词检索规则还是经过bert模型判断。

对将来发展的规划？大模型应该怎么应用？

反问环节：

大模型的应用主要是面向to C还是to b的？都有，客服这种是to C的

训练的数据和算力准备的怎么样？数据以文本数据为主，算力似乎不太够，只有t级别的显卡？比较寒酸了，有a10显卡吗

什么指标比较看重？避免大模型幻觉。

原文地址：https://blog.csdn.net/m0_49134108/article/details/140292602

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【网络】SCTP协议概念
下一篇：Java 中的泛型（超全详解）

【已为网站上传证书,却显示不安全】
【已为网站上传证书,却显示不安全】
阅读更多2024-11-16
Jtti：服务器总是自动重启怎么办?
1.查看系统日志：通过查看系统日志文件(如/var/log/syslog、/var/log/messages或Windows Event Viewer)获取错误信息，找出重启原因。解决方案：查看系统日
阅读更多2024-11-16
Scala的Array(1)
Scala的Array表示长度不可变的数组，若需要定义可变数组需要倒包。
阅读更多2024-11-16
Scala中的Array
Array是一种在Scala中用于存储固定大小，相同类型元素的数据结构，Array是可变。类型有两种：Array表示长度不可变的数组，和ArrayBuffer表示长度可变的数组。(一)Array的定义
阅读更多2024-11-16
llama factory lora 微调 qwen2.5 7B Instruct模型
项目背景甲方提供一台三卡4080显卡需要进行qwen2.5 7b Instruct模型进行微调。以下为整体设计。要使用对进行，流程与之前提到的模型类似。LoRA 微调是一种高效的微调方法，通过低秩
阅读更多2024-11-16
大数据中的时序数据，以及时序数据架构设计解决方案
时序数据架构设计需根据具体的应用场景、数据量和实时性要求来选择合适的方案。如果数据量较小且不需要实时处理，关系型数据库可能足够；如果数据量大且需要高效实时查询，可以选择时序数据库；而对于大规模分布式处
阅读更多2024-11-16
Linux网络——网络初识
在谈及网络之前，我们要先对学的知识有一个了解网络的本质就是获取数据，而系统的本质就是加工数据。
阅读更多2024-11-16
革新预测领域：频域融合时间序列预测，深度学习新篇章，科研涨点利器
2024发论文&模型涨点之——频域+时间序列频域+时间序列不仅能提供更丰富的信息，还能提高模型性能和预测准确性。对于论文er来说，是个可发挥空间大、可挖掘创新点多的研究方向。当前，学术界的目光
阅读更多2024-11-16
本地启动浏览器，并禁用web安全性，解决本地启动时，服务端强制要求https协议导致请求不通的问题
本地启动浏览器，并禁用web安全性，解决本地启动时，服务端强制要求https协议导致请求不通的问题
阅读更多2024-11-16
推荐一款来自韩国的影音全能播放器：KMPlayer播放器
来自韩国的影音全能播放器，与Mplayer一样从linux平台移植而来的Kmplayer(简称KMP)几乎可以播放您系统上所有的影音文件。通过各种插件扩展KMP可以支持层出不穷的新格式。强大的插件功能
阅读更多2024-11-16

大模型面试（三）

相关文章