如何準備機器學習工程師的面試

才智咖 人氣:5.52K

我之前面試一些公司的機器學習或者資料探勘工程師的職位。感覺自己準備的不夠充分。想了解下一般會問哪些問題,考察哪些方面的東西。

如何準備機器學習工程師的面試

機器學習方面的面試主要分成三個部分:

1. 理論方面,我推薦最經典的一本書《統計學習方法》,這書可能不是最全的,但是講得最精髓,薄薄一本,適合面試前突擊準備。 我認為一些要點是: 統計學習的核心步驟:模型、策略、演算法,你應當對logistic、SVM、決策樹、KNN及各種聚類方法有深刻的理解。能夠隨手寫出這些演算法的核心遞迴步的虛擬碼以及他們優化的函式表示式和對偶問題形式。 非統計學習我不太懂,做過複雜網路,但是這個比較深,面試可能很難考到。 數學知識方面,你應當深刻理解矩陣的各種變換,尤其是特徵值相關的知識。 演算法方面:你應當深刻理解常用的優化方法:梯度下降、牛頓法、各種隨機搜尋演算法(基因、蟻群等等),深刻理解的意思是你要知道梯度下降是用平面來逼近區域性,牛頓法是用曲面逼近區域性等等。

2. 工程實現能力與編碼水平 機器學習從工程實現一般來講都是某種資料結構上的搜尋問題。 你應當深刻理解在1中列出的各種演算法對應應該採用的資料結構和對應的搜尋方法。比如KNN對應的KD樹、如何給圖結構設計資料結構?如何將演算法map-red化等等。 一般來說要麼你會寫C,而且會用MPI,要麼你懂Hadoop,工程上基本都是在這兩個平臺實現。實在不濟你也學個python吧。

3. 非常令人失望地告訴你儘管機器學習主要會考察1和2 但是實際工作中,演算法的先進性對真正業務結果的影響,大概不到30%。當然演算法必須要足夠快,離線演算法最好能在4小時內完成,實時演算法我沒搞過,要求大概 更高。 機器學習大多數場景是搜尋、廣告、垃圾過濾、安全、推薦系統等等。對業務有深刻的理解對你做出來的系統的結果影響超過70%。這裡你沒做過實際的專案,是 完全不可能有任何體會的,我做過一個推薦系統,沒有什麼演算法上的`高大上的改進,主要是業務邏輯的創新,直接就提高了很明顯的一個CTR(具體數目不太方便 透露,總之很明顯就是了)。如果你做過實際的專案,一定要主動說出來,主動讓面試官知道,這才是最大最大的加分專案。 最後舉個例子,阿里內部機器學習挑戰賽,無數碾壓答主10000倍的大神參賽。最後冠軍沒有用任何高大上的演算法而是基於對資料和業務的深刻理解和極其細緻 的特徵調優利用非常基本的一個演算法奪冠。所以啥都不如真正的實操擼幾個生產專案啊。