作者 | 去网吧偷显卡
整理 | NewBeeNLP
面试锦囊之面经分享系列,持续更新中
欢迎后台回复『面试』加入讨论组交流噢
飞猪-base杭州-搜索算法
哈希寻址算法
讲一下最短路算法
如何判断图中是否有环
概率题:99%的概率预测正确,0.3%是真阳,p(真阳|阳)的概率等于多少
场景题1:给定当前query和历史query以及对应实体,如何对当前query的实体进行建模
场景题2:多语言如何判断是哪个语种,比如马来西亚语和英语有点相似,应该如何判断
场景题3:query改写 baseline 评估迭代建模,query改写的作用(比如“北大”“北京大学”哪个与酒店更匹配)
场景题4:纠错,相似词建模
场景题记不太清楚了,但是和面试官们交流很愉快
百度-base上海-算法工程
c++智能指针
python多进程和多线程
垃圾回收机制
sql事务
讲lora的原理
讲gbdt
翻译任务一般用啥架构
encoder-only, decoder-only, encoder-decoder的区别
讲transformer
讲flash attention
fp32和fp16的区别,混合精度的原理
beam search原理,与直接sample的区别
对大模型的改进
平时用什么框架,机器
python协程
进程,线程,一个进程里面多线程共享哪些资源
程序空间和堆栈
为什么docker好用,docker创建容器
linux怎么看进程; 怎么结束进程; 怎么实时看一个文件
c++虚函数
python,flask
gil全局锁
继续flash attention
大模型什么情况需要预训练
主流大模型的区别
一个数学题:甲乙射击,甲射击n次,乙射击n+1次,射中的概率都是0.5,射中一个得一分,最终乙比甲总分多的概率;
好未来-base北京-nlp
lora的矩阵怎么初始化?为什么要初始化为全0?
gpt源码past_key_value是干啥的
gpt onebyone 每一层怎么输入输出
输出的分布如果比较稀疏,有个尖尖应该怎么处理
讲讲决策树,决策树回归问题怎么做
gpt的输出topp是啥
kl散度的公式和kl散度与交叉熵的区别
强化学习的输入
chatgpt的reward model怎么来的,三阶段
cart树的分裂准则是啥
做题:寻找重复数
除了cosin还有哪些算相似度的方法
文本embedding方法
tfidf公式
场景题1:师生多轮对话文本(音频转化),如何把无关信息剔除,比如说老师早上好这种
场景题2:偏推荐一点,给学生推荐试题,不希望出现做过的相似题目
海康-base杭州-多模态llm
大模型对输入数据分词的处理,扩大词表
python的多进程,多线程,没有真正意义上的多线程,为什么这么设计
新版pytorch并行bn
口述算法完全平方数
10个模态如何选择和搭模型
clip的各种变形
常用trick,你的别人都不知道的trick(?)
数据不均衡怎么处理
单独整不同模态的编码和clip的区别
腾讯-base未知-广告算法
做题:
求两个列表的交集,时间复杂度尽可能低,不可以用map和set
求一个数在一个列表中的最大数
ner模型除了gp还有哪些,gp相比普通ner的优点
ner中如何去解决预测错误的问题,比如宝马三系标签是BIBI中的三系
什么是线性可分,逻辑斯蒂是线性还是非线性的
常用的ctr模型
deepfm的fm结构是啥
如果输入特征只有一维,做二分类任务,这个特征范围是从0到正无穷大,怎么处理
nlp任务有哪些
知乎-base北京-可能是搜索算法
项目
职业规划
项目中的难点
做题-旋转数组求最小值
bert的attention
优化器
知道的loss
能不能马上去实习
虾皮-base上海-nlp
求target在source里的起始终止位置,target和source都有空格,target空格忽略,source空格要算位置。应该是想考kmp模板
多模态一些多流的sota有了解吗
bert的结构和loss
gpt的结构
ner模型的了解
针对不同的任务,大模型的指令怎么写
没有标签,怎么对商品里的iphone pro max做聚合
中信银行总行大数据中心-base北京-大数据
总结一下自己的技术栈
sql里的delete和truncate有啥区别
sql事务
推荐系统架构
分类和回归的区别
激活函数,为什么要引入非线性
loss的定义
hadoop是否有了解
rdd是什么
得物-base杭州-可能是推荐算法
nlogn的排序算法
讲讲堆排序
动态规划
xgb和gbdt的区别
lora的优缺点
bn
random forest和gbdt的区别
有100个硬币,AB每次都可以拿1到2个,最后一个拿的人获胜,A用什么策略可以保证最后他获胜
同程旅行-base成都-风控
f-score
为什么指标不用auc
不平衡问题怎么解决
bn的原理
1x1卷积核用来干嘛
relu和sigmoid特点,优缺点等
什么时候能去实习
一起交流
想和你一起学习进步!『NewBeeNLP』目前已经建立了多个不同方向交流群(机器学习 / 深度学习 / 自然语言处理 / 搜索推荐 / 图网络 / 面试交流 / 等),名额有限,赶紧添加下方微信加入一起讨论交流吧!(注意一定o要备注信息才能通过)