當前位置: 妍妍網 > 辦公

分享幾家大廠資料探勘崗的面試經歷

2024-03-22辦公

今天分享一位星球成員的上岸之旅,最終成功拿下 快手資料探勘崗 。喜歡本文記得 收藏、點贊、關註。

現在距離秋招結束也好長一段時間了,今天總結一下自己在秋招中的一些經驗和教訓,希望可以幫助到學弟學妹們。

先介紹一下我自己的情況,我本科211,碩士985。我投的都是資料探勘崗,最後有幸拿到了快手的Offer。

順豐

崗位:資料探勘

  1. 深挖簡歷

  2. ML主要是比較幾個模型,Kmeans & DBSCAN分別套用在哪些場景比較好?LR & SVM的區別?分別套用在那些場景?

  3. DL簡單介紹一下RNN,它和 LSTM,ARIMA 的區別?

  4. 是否了解大數據?說說你了解的hadoop和spark。

  5. sql題,涉及視窗函式

  6. 有沒有做過參加過比賽?我說美賽,簡要說明了一下。

  7. 我反問我應該加強什麽?

招聯金融

崗位:資料探勘

一面

  1. 計畫介紹

  2. 特征選擇方法

  3. 資料探勘中對於缺失值的處理方案

  4. 說一下 Python(pandas)中常用的數據處理算子。

  5. Spark 的原理,分布式是怎麽搭建的。

  6. Sql中 union 和 union all 的區別

  7. 數據行轉列怎麽操作

  8. xgboost和gbdt的區別

  9. xgboost常調的參數有哪些

  10. svm原理

  11. 說一下你在研會組織了什麽活動?

  12. 講一下你支教的經歷。

  13. 反問

二面

  1. 自我介紹

  2. 計畫競賽深挖

  3. 說一下你風控計畫中用到的模型?

  4. 資料探勘中缺失值和異常值是怎麽處理的?

  5. 特征降維怎麽做?

  6. Sql用過哪些操作,舉個例子

  7. Sql如何提高執行效率?

  8. 過擬合的處理方法?

  9. 計畫中遇到困難如何解決?

  10. 領導交給你一項不可能完成而且又很重要的問題,怎麽辦?

  11. 反問

聯想

崗位:資料探勘

時間過去有點久了,純憑回憶,可能有些遺漏

一面

  1. 機器學習基礎知識

  2. Bagging & Boosting

  3. 常用的聚類演算法

  4. Kmeans和DBSCAN的原理和區別

  5. 邏輯回歸的原理

  6. 怎麽處理離散數據

  7. 支持向量機原理

  8. SVM怎麽處理非線性

  9. 常用的回歸模型

  10. Attention 原理

  11. RNN和LSTM的區別

  12. 什麽是梯度爆炸/梯度消失,什麽情況下會出現

  13. 梯度漸進的原理

  14. 手撕演算法:判斷是否是回文、找出最長回文子串

藍月亮

崗位:資料探勘

專業面試

  1. 開頭問問過往的經歷,講一下過往的一個計畫,沒有深挖

  2. 線性回歸和邏輯回歸有什麽區別

  3. 邏輯回歸的形式是什麽,損失函式是什麽

  4. 線性回歸的損失函式是什麽

  5. 邏輯回歸的啟用函式是什麽,除了sigmoid還知道哪些

  6. 為什麽有的時候需要將連續變量離散化

  7. 怎麽將連續的變量離散化

  8. 決策樹的特征選擇原理有哪些

  9. 過擬合和欠擬合怎麽理解,分別怎麽解決

  10. SVM 的原理

  11. SVM如何解決線性不可分的問題

  12. 既然你提到了懲罰系數,那麽講講SVM使用的核函式有哪些

  13. xgboost和GBDT的區別

  14. 提到了正則項,那麽L1和L2有什麽區別

  15. xgboost泰勒展開是一階還是二階

  16. 多執行緒和多行程

  17. 用過哪些程式語言

  18. 反問:介紹了團隊的主要崗位,一些日常工作,業務範圍

主管面試

這一輪不太問專業問題,主要從職業發展,個人成長,個人意向去問

比如:作為技術崗,怎麽提高自己的業務能力,你會透過什麽方式進行技術的學習

比較感動的是沒有考手撕程式碼,除了SQL以外的手撕程式碼我都非常頭大,感覺他們IT需求蠻多的,演算法、NLP、CV都需要,可以試試~

快手

崗位:資料探勘

一面

  1. 自我介紹

  2. 計畫介紹

  3. 計畫細節

  4. 隨機森林、決策樹、XGBoost的區別和聯系

  5. 離散特征怎麽處理?(沒聽懂面試官想問啥 )

  6. 針對計畫提問,連續特征怎麽處理?

  7. 演算法:最大子序和 動態規劃+貪心演算法 做題有點慢

面試官建議:雖然有些東西工作不會用到,但是面試還是會問,題還是應該多刷一刷 不說了,刷題背八股去了。

二面

  1. 自我介紹

  2. 計畫介紹(What、Why、How、難點、思考)

  3. 計畫怎麽分工的

  4. 一兩句話簡述LR、隨機森林、XGBoost優缺點

  5. 精準率、召回率、F1-score、AUC指標的含義和使用場景

  6. 二維矩陣尋找【二分法】

不記得還有什麽了。。。

三面

  1. 自我介紹

  2. 計畫介紹

  3. 線性回歸,模型的假設,損失函式,求解

  4. BP神經網路。反向傳播傳的是什麽?

  5. 各種分桶方法的優缺點

  6. 特征組合,歸一化

  7. 深度學習與傳統機器學習相比最大的不同?

作者:城哥

來源 :Python學習與資料探勘

Crossin的新書【 碼上行動:用ChatGPT學會Python編程 】已經上市了。 本書以ChatGPT為輔助,系統全面地講解了如何掌握Python編程,適合Python零基礎入門的讀者學習。

購買後可加入讀者交流群,Crossin為你開啟陪讀模式,解答你在閱讀本書時的一切疑問。

Crossin的其他書籍:

添加微信 crossin123 ,加入編程教室共同學習 ~

感謝 轉發 點贊 的各位~