網際網路大資料面試題集錦
阿新 • • 發佈:2018-11-17
原文地址:http://hbase.group/article/89
以下面試題都是群裡小夥伴提供的,現場真題(包含校招題)
1.網易大資料面試題
- 說說專案
- Spark哪部分用得好,如何調優
- Java哪部分了解比較好
- 聊聊併發,併發實現方法,volatile關鍵字說說
- HashMap的底層原理
- 為什麼要重寫hashcode和equals
- 說說jvm
- 各個垃圾收集器運用在什麼情形
- jvm調優
- 說說io
- 為什麼考慮轉行呢?是因為原專業不好就業嗎?
2.螞蟻金服面試題
- 小檔案的合併
- MR與Spark的區別
- 關注哪些名人的部落格
- 對大資料領域有什麼自己的見解
- 平常怎麼學習大資料的
- StringBuilder與StringBuffer的區別
- HashMap與Hashtable的區別
- 談談你對樹的理解
- 資料庫索引的實現
- jvm的記憶體模型
- jvm的垃圾收集器
- jvm的垃圾收集演算法
- HDFS架構
- HDFS讀寫流程
- Hadoop3.0做了哪些改進
- 談談YARN
- 為什麼專案選擇使用Spark,你覺得Spark的優點在哪裡
- 瞭解Flink與Storm嘛,他們與Spark Streaming的區別在哪裡
- 1TB檔案,取重複的詞,top5指定的資源的場景下,如何快速統計出來
3.美圖面試題
- 為什麼選擇美圖,你知道美圖地點在哪裡嘛
- 介紹下你做的專案吧
- 資料統一管理平臺,我挺感興趣的,你說說吧
- 我大概知道是怎麼回事了,java web這塊你參與開發了嗎
- 你剛剛專案提到了元資料,你能說說hive的元資料管理嘛,對它瞭解嘛
- 還是hive,你對hive有哪些原理性瞭解呢
- 知道AST、operator tree這些長什麼樣嗎
- 那你的hive轉mr過程是怎麼了解的呢?
- 除了謂詞下推,還能說說其它的優化嘛?別說資料傾斜的調優
- jvm瞭解不,說下垃圾收集演算法
- 平常用java和scala語言哪個多點
- 如果我現在要使用map集合,你覺得哪種適合多執行緒情況下進行訪問
- 如何去監控執行緒
- Spark 出現OOM,你覺得該怎麼進行調優呢?不去動jvm的引數
- 你覺得join該怎麼優化
- 你對未來的規劃是什麼?(五年內)
- 你也就是走技術路線咯
4.美圖二面
- ThriftServer的HA如何去實現,能說下實現的思路嘛
- 說下Zookeeper的watch機制是如何實現的嘛?
- 場景題:
現在有1個client,2個server,當我動態加入一臺機器,或者刪除一臺機器,或者某臺機器宕機了,client該如何去感知到,說下實現思路(不使用Zookeeper),如何通訊,說說具體實現?
5.七牛雲面試題
- 快排
- hive和hdfs之間的聯絡
- inode和檔案描述符
- linux指令如何建立檔案
- http中header中放入key value 有什麼變化
- 系統呼叫和庫函式區別
- http緩衝實現機智
- session cookie 區別
- 程序間通訊方式
- jsp本質
- http請求狀狀態
- get post put remove
- 資料庫join
- 資料庫引擎
- hibernate和mybiters區別
- jvm垃圾回收
- hive和關係型資料庫區別
- hive實現原理
- spark與mr的區別