- 相關推薦
大數(shù)據(jù)面試常見問題
掌握一些面試常見問題,能讓自己面試時更有把握,今天小編為大家準備了大數(shù)據(jù)面試常見問題,歡迎閱讀!
大數(shù)據(jù)面試常見問題
1、你處理過的最大的數(shù)據(jù)量?你是如何處理他們的?處理的結果。
2、告訴我二個分析或者計算機科學相關項目?你是如何對其結果進行衡量的?
3、什么是:提升值、關鍵績效指標、強壯性、模型按合度、實驗設計、2/8原則?
4、什么是:協(xié)同過濾、n-grams, map reduce、余弦距離?
5、如何讓一個網(wǎng)絡爬蟲速度更快、抽取更好的信息以及更好總結數(shù)據(jù)從而得到一干凈的數(shù)據(jù)庫?
6、如何設計一個解決抄襲的方案?
7、如何檢驗一個個人支付賬戶都多個人使用?
8、點擊流數(shù)據(jù)應該是實時處理?為什么?哪部分應該實時處理?
9、你認為哪個更好:是好的`數(shù)據(jù)還是好模型?同時你是如何定義“好”?存在所有情況下通用的模型嗎?有你沒有知道一些模型的定義并不是那么好?
10、什么是概率合并(AKA模糊融合)?使用SQL處理還是其它語言方便?對于處理半結構化的數(shù)據(jù)你會選擇使用哪種語言?
11、你是如何處理缺少數(shù)據(jù)的?你推薦使用什么樣的處理技術?
12、你最喜歡的編程語言是什么?為什么?
13、對于你喜歡的統(tǒng)計軟件告訴你喜歡的與不喜歡的3個理由。
14、SAS, R, Python, Perl語言的區(qū)別是?
15、什么是大數(shù)據(jù)的詛咒?
16、你參與過數(shù)據(jù)庫與數(shù)據(jù)模型的設計嗎?
17、你是否參與過儀表盤的設計及指標選擇?你對于商業(yè)智能和報表工具有什么想法?
18、你喜歡TD數(shù)據(jù)庫的什么特征?
19、如何你打算發(fā)100萬的營銷活動郵件。你怎么去優(yōu)化發(fā)送?你怎么優(yōu)化反應率?能把這二個優(yōu)化份開嗎?