今天分享一位星球成員的上岸之旅,最終成功拿下 快手資料探勘崗 。喜歡本文記得 收藏、點贊、關註。
現在距離秋招結束也好長一段時間了,今天總結一下自己在秋招中的一些經驗和教訓,希望可以幫助到學弟學妹們。
先介紹一下我自己的情況,我本科211,碩士985。我投的都是資料探勘崗,最後有幸拿到了快手的Offer。
順豐
崗位:資料探勘
深挖簡歷
ML主要是比較幾個模型,Kmeans & DBSCAN分別套用在哪些場景比較好?LR & SVM的區別?分別套用在那些場景?
DL簡單介紹一下RNN,它和 LSTM,ARIMA 的區別?
是否了解大數據?說說你了解的hadoop和spark。
sql題,涉及視窗函式
有沒有做過參加過比賽?我說美賽,簡要說明了一下。
我反問我應該加強什麽?
招聯金融
崗位:資料探勘
一面
計畫介紹
特征選擇方法
資料探勘中對於缺失值的處理方案
說一下 Python(pandas)中常用的數據處理算子。
Spark 的原理,分布式是怎麽搭建的。
Sql中 union 和 union all 的區別
數據行轉列怎麽操作
xgboost和gbdt的區別
xgboost常調的參數有哪些
svm原理
說一下你在研會組織了什麽活動?
講一下你支教的經歷。
反問
二面
自我介紹
計畫競賽深挖
說一下你風控計畫中用到的模型?
資料探勘中缺失值和異常值是怎麽處理的?
特征降維怎麽做?
Sql用過哪些操作,舉個例子
Sql如何提高執行效率?
過擬合的處理方法?
計畫中遇到困難如何解決?
領導交給你一項不可能完成而且又很重要的問題,怎麽辦?
反問
聯想
崗位:資料探勘
時間過去有點久了,純憑回憶,可能有些遺漏
一面
機器學習基礎知識
Bagging & Boosting
常用的聚類演算法
Kmeans和DBSCAN的原理和區別
邏輯回歸的原理
怎麽處理離散數據
支持向量機原理
SVM怎麽處理非線性
常用的回歸模型
Attention 原理
RNN和LSTM的區別
什麽是梯度爆炸/梯度消失,什麽情況下會出現
梯度漸進的原理
手撕演算法:判斷是否是回文、找出最長回文子串
藍月亮
崗位:資料探勘
專業面試
開頭問問過往的經歷,講一下過往的一個計畫,沒有深挖
線性回歸和邏輯回歸有什麽區別
邏輯回歸的形式是什麽,損失函式是什麽
線性回歸的損失函式是什麽
邏輯回歸的啟用函式是什麽,除了sigmoid還知道哪些
為什麽有的時候需要將連續變量離散化
怎麽將連續的變量離散化
決策樹的特征選擇原理有哪些
過擬合和欠擬合怎麽理解,分別怎麽解決
SVM 的原理
SVM如何解決線性不可分的問題
既然你提到了懲罰系數,那麽講講SVM使用的核函式有哪些
xgboost和GBDT的區別
提到了正則項,那麽L1和L2有什麽區別
xgboost泰勒展開是一階還是二階
多執行緒和多行程
用過哪些程式語言
反問:介紹了團隊的主要崗位,一些日常工作,業務範圍
主管面試
這一輪不太問專業問題,主要從職業發展,個人成長,個人意向去問
比如:作為技術崗,怎麽提高自己的業務能力,你會透過什麽方式進行技術的學習
比較感動的是沒有考手撕程式碼,除了SQL以外的手撕程式碼我都非常頭大,感覺他們IT需求蠻多的,演算法、NLP、CV都需要,可以試試~
快手
崗位:資料探勘
一面
自我介紹
計畫介紹
計畫細節
隨機森林、決策樹、XGBoost的區別和聯系
離散特征怎麽處理?(沒聽懂面試官想問啥 )
針對計畫提問,連續特征怎麽處理?
演算法:最大子序和 動態規劃+貪心演算法 做題有點慢
面試官建議:雖然有些東西工作不會用到,但是面試還是會問,題還是應該多刷一刷 不說了,刷題背八股去了。
二面
自我介紹
計畫介紹(What、Why、How、難點、思考)
計畫怎麽分工的
一兩句話簡述LR、隨機森林、XGBoost優缺點
精準率、召回率、F1-score、AUC指標的含義和使用場景
二維矩陣尋找【二分法】
不記得還有什麽了。。。
三面
自我介紹
計畫介紹
線性回歸,模型的假設,損失函式,求解
BP神經網路。反向傳播傳的是什麽?
各種分桶方法的優缺點
特征組合,歸一化
深度學習與傳統機器學習相比最大的不同?
作者:城哥
來源 :Python學習與資料探勘
Crossin的新書【 碼上行動:用ChatGPT學會Python編程 】已經上市了。 本書以ChatGPT為輔助,系統全面地講解了如何掌握Python編程,適合Python零基礎入門的讀者學習。
購買後可加入讀者交流群,Crossin為你開啟陪讀模式,解答你在閱讀本書時的一切疑問。
Crossin的其他書籍:
添加微信 crossin123 ,加入編程教室共同學習 ~
感謝 轉發 和 點贊 的各位~