算法面试题2024-05-11

🕗 发布于 2024-05-15 22:19 算法

用语言介绍一下 Transformer 的总体流程

深度学习的三种并行方式：数据并行，模型并行，流水线并行

Deepspeed分布式训练的理解，zero 0-3的理解

对于CLIP的理解

说几种对比学习的损失函数，以及它们的特点和优缺点

说说大模型生成采样的几种方式，它们的特点和优缺点比较

损失函数中温度的作用

BLIP 的细节。面试中提的问题是 BLIP 为什么将训练分成两个阶段

Visual Encoder 有哪些常见的类型？

深度学习中常用的优化器有哪些？

SimCSE 的理解

prenorm 和 postnorm

LLaMA 2 的创新、ChatGLM的创新点、Qwen的创新点、Baichuan的创新点

LLM 的评估方式有哪些？特点是什么？

文本生成模型中生成参数的作用（temperature，top p，top k，num beams）

LoR A的作用和原理

CoT 的作用

神经网络经典的激活函数以及它们的优缺点

softmax 函数求导的推导

BERT 的参数量如何计算？

AUC 和 ROC

batch norm 和 layer norm

大模型训练的超参数设置

经典的词向量模型有哪些？

InstructGPT 三个阶段的训练过程，用语言描述出来

大模型推理加速的方法

Transformer 中注意力的作用是什么

RNN、CNN 和 Transformer 的比较（复杂度，特点，适用范围等）

产生梯度消失问题的原因有哪些？

大模型的幻觉问题

大模型训练数据处理

RLHF 的计算细节

构建 CoT 样本的时候，怎么保证覆盖不同的场景？

回收的三个指标：Recall、NDCG、RMSE

RoPE 和 ALiBi

交叉熵、NCE 和 InfoNCE 的区别和联系

贝叶斯学派和概率学派的区别

一个文件的大小超过了主存容量，如何对这个文件进行排序？应该使用什么算法？

Python 中的线程、进程和协程

python 中的生成器和迭代器

原文地址：https://blog.csdn.net/mmdsl083/article/details/138707036

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：ClassificationPrimitive 内部原理
下一篇：SOLIDWORKS 2024云服务新功能

RabbitMQ简介
RabbitMQ简介
阅读更多2024-09-28
python-ds：Python 中的数据结构库（适用于面试的数据结构和算法合集）
python-ds 是一个开源的 Python 数据结构库，旨在提供多种高级数据结构的实现，如链表、树、图等。这些数据结构可用于解决各种计算问题，增强 Python 在数据处理和算法开发方面的能力。
阅读更多2024-09-28
Vue-Bag-Admin 采用漂亮的 Naive UI 构建的开源中后台系统，基于 Vue3 / Vite / TypeScript 等最新的前端技术栈
这是一款完成度很高、实用性很强的 admin 前端框架，颜值不错，推荐给大家。
阅读更多2024-09-28
windows+vscode+arm-gcc+openocd+daplink开发arm单片机程序
windows+vscode+arm-gcc+openocd+daplink开发arm单片机程序，脱离keil。目前发现的最佳解决方案是，使用vscode+embedded ide插件。
阅读更多2024-09-28
实时美颜功能技术揭秘：视频美颜SDK与API的技术剖析
美颜API是连接前端用户和后端处理能力的桥梁。通过API，开发者可以轻松调用美颜功能，将其嵌入到直播、录制或视频通话等场景中。API的设计通常遵循RESTful原则，便于在不同平台和设备上进行调用。
阅读更多2024-09-28
php基础语法
PHP（Hypertext Preprocessor）是一种广泛使用的开源服务器端脚本语言，特别适合用于Web开发。
阅读更多2024-09-28
渗透测试在网络安全等保测评中的应用探讨
渗透测试是指测试人员模拟黑客的恶意攻击手段，根据掌握的攻击方法与策略等专业知识，通过人工与工具等方式分析网络系统的脆弱性。测试人员掌握各种黑客常用的攻击手段，发现常规安全保护措施难以检测到的系统脆弱性
阅读更多2024-09-28
如何用3个月零基础入门网络安全？_网络安全零基础怎么学习
我们知道计算机最早是在西方发明出来的，很多名词或者代码都是英文的，甚至现有的一些教程最初也是英文原版翻译过来的，而且一个漏洞被发现到翻译成中文一般需要一个星期的时间，在这个时间差上漏洞可能都修补了。”
阅读更多2024-09-28
OpenCV 中使用 cv::cvtColor 将图像从 BGR 转换为 RGB 与手动使用指针循环转换的问题
在 OpenCV 中使用 cv::cvtColor 将图像从 BGR 转换为 RGB 与手动使用指针循环转换的效果通常应该是相同的，因为这两种方法的本质都是将图像的通道顺序从 BGR 交换为 RGB。
阅读更多2024-09-28
Linux Reverse(1)-LD_PRELOAD
LD_PRELOAD是 Linux 系统中的一个环境变量，它允许用户在程序运行时动态地加载共享库。通过设置该环境变量，用户可以指定一个或多个共享库，这些库中的函数将在其他库或程序调用相同函数时优先使用
阅读更多2024-09-28

算法面试题2024-05-11

相关文章