今天分享一位星球成员的上岸之旅,最终成功拿下 快手数据挖掘岗 。喜欢本文记得 收藏、点赞、关注。
现在距离秋招结束也好长一段时间了,今天总结一下自己在秋招中的一些经验和教训,希望可以帮助到学弟学妹们。
先介绍一下我自己的情况,我本科211,硕士985。我投的都是数据挖掘岗,最后有幸拿到了快手的Offer。
顺丰
岗位:数据挖掘
深挖简历
ML主要是比较几个模型,Kmeans & DBSCAN分别应用在哪些场景比较好?LR & SVM的区别?分别应用在那些场景?
DL简单介绍一下RNN,它和 LSTM,ARIMA 的区别?
是否了解大数据?说说你了解的hadoop和spark。
sql题,涉及窗口函数
有没有做过参加过比赛?我说美赛,简要说明了一下。
我反问我应该加强什么?
招联金融
岗位:数据挖掘
一面
项目介绍
特征选择方法
数据挖掘中对于缺失值的处理方案
说一下 Python(pandas)中常用的数据处理算子。
Spark 的原理,分布式是怎么搭建的。
Sql中 union 和 union all 的区别
数据行转列怎么操作
xgboost和gbdt的区别
xgboost常调的参数有哪些
svm原理
说一下你在研会组织了什么活动?
讲一下你支教的经历。
反问
二面
自我介绍
项目竞赛深挖
说一下你风控项目中用到的模型?
数据挖掘中缺失值和异常值是怎么处理的?
特征降维怎么做?
Sql用过哪些操作,举个例子
Sql如何提高运行效率?
过拟合的处理方法?
项目中遇到困难如何解决?
领导交给你一项不可能完成而且又很重要的问题,怎么办?
反问
联想
岗位:数据挖掘
时间过去有点久了,纯凭回忆,可能有些遗漏
一面
机器学习基础知识
Bagging & Boosting
常用的聚类算法
Kmeans和DBSCAN的原理和区别
逻辑回归的原理
怎么处理离散数据
支持向量机原理
SVM怎么处理非线性
常用的回归模型
Attention 原理
RNN和LSTM的区别
什么是梯度爆炸/梯度消失,什么情况下会出现
梯度渐进的原理
手撕算法:判断是否是回文、找出最长回文子串
蓝月亮
岗位:数据挖掘
专业面试
开头问问过往的经历,讲一下过往的一个项目,没有深挖
线性回归和逻辑回归有什么区别
逻辑回归的形式是什么,损失函数是什么
线性回归的损失函数是什么
逻辑回归的激活函数是什么,除了sigmoid还知道哪些
为什么有的时候需要将连续变量离散化
怎么将连续的变量离散化
决策树的特征选择原理有哪些
过拟合和欠拟合怎么理解,分别怎么解决
SVM 的原理
SVM如何解决线性不可分的问题
既然你提到了惩罚系数,那么讲讲SVM使用的核函数有哪些
xgboost和GBDT的区别
提到了正则项,那么L1和L2有什么区别
xgboost泰勒展开是一阶还是二阶
多线程和多进程
用过哪些编程语言
反问:介绍了团队的主要岗位,一些日常工作,业务范围
主管面试
这一轮不太问专业问题,主要从职业发展,个人成长,个人意向去问
比如:作为技术岗,怎么提高自己的业务能力,你会通过什么方式进行技术的学习
比较感动的是没有考手撕代码,除了SQL以外的手撕代码我都非常头大,感觉他们IT需求蛮多的,算法、NLP、CV都需要,可以试试~
快手
岗位:数据挖掘
一面
自我介绍
项目介绍
项目细节
随机森林、决策树、XGBoost的区别和联系
离散特征怎么处理?(没听懂面试官想问啥 )
针对项目提问,连续特征怎么处理?
算法:最大子序和 动态规划+贪心算法 做题有点慢
面试官建议:虽然有些东西工作不会用到,但是面试还是会问,题还是应该多刷一刷 不说了,刷题背八股去了。
二面
自我介绍
项目介绍(What、Why、How、难点、思考)
项目怎么分工的
一两句话简述LR、随机森林、XGBoost优缺点
精准率、召回率、F1-score、AUC指标的含义和使用场景
二维矩阵查找【二分法】
不记得还有什么了。。。
三面
自我介绍
项目介绍
线性回归,模型的假设,损失函数,求解
BP神经网络。反向传播传的是什么?
各种分桶方法的优缺点
特征组合,归一化
深度学习与传统机器学习相比最大的不同?
作者:城哥
来源 :Python学习与数据挖掘
Crossin的新书【 码上行动:用ChatGPT学会Python编程 】已经上市了。 本书以ChatGPT为辅助,系统全面地讲解了如何掌握Python编程,适合Python零基础入门的读者学习。
购买后可加入读者交流群,Crossin为你开启陪读模式,解答你在阅读本书时的一切疑问。
Crossin的其他书籍:
添加微信 crossin123 ,加入编程教室共同学习 ~
感谢 转发 和 点赞 的各位~