1. 程式人生 > >網際網路大資料面試題集錦

網際網路大資料面試題集錦

原文地址:http://hbase.group/article/89

以下面試題都是群裡小夥伴提供的,現場真題(包含校招題)
1.網易大資料面試題

  • 說說專案
  • Spark哪部分用得好,如何調優
  • Java哪部分了解比較好
  • 聊聊併發,併發實現方法,volatile關鍵字說說
  • HashMap的底層原理
  • 為什麼要重寫hashcode和equals
  • 說說jvm
  • 各個垃圾收集器運用在什麼情形
  • jvm調優
  • 說說io
  • 為什麼考慮轉行呢?是因為原專業不好就業嗎?


2.螞蟻金服面試題

  • 小檔案的合併
  • MR與Spark的區別
  • 關注哪些名人的部落格
  • 對大資料領域有什麼自己的見解
  • 平常怎麼學習大資料的
  • StringBuilder與StringBuffer的區別
  • HashMap與Hashtable的區別
  • 談談你對樹的理解
  • 資料庫索引的實現
  • jvm的記憶體模型
  • jvm的垃圾收集器
  • jvm的垃圾收集演算法
  • HDFS架構
  • HDFS讀寫流程
  • Hadoop3.0做了哪些改進
  • 談談YARN
  • 為什麼專案選擇使用Spark,你覺得Spark的優點在哪裡
  • 瞭解Flink與Storm嘛,他們與Spark Streaming的區別在哪裡
  • 1TB檔案,取重複的詞,top5指定的資源的場景下,如何快速統計出來

 
3.美圖面試題

  • 為什麼選擇美圖,你知道美圖地點在哪裡嘛
  • 介紹下你做的專案吧
  • 資料統一管理平臺,我挺感興趣的,你說說吧
  • 我大概知道是怎麼回事了,java web這塊你參與開發了嗎
  • 你剛剛專案提到了元資料,你能說說hive的元資料管理嘛,對它瞭解嘛
  • 還是hive,你對hive有哪些原理性瞭解呢
  • 知道AST、operator tree這些長什麼樣嗎
  • 那你的hive轉mr過程是怎麼了解的呢?
  • 除了謂詞下推,還能說說其它的優化嘛?別說資料傾斜的調優
  • jvm瞭解不,說下垃圾收集演算法
  • 平常用java和scala語言哪個多點
  • 如果我現在要使用map集合,你覺得哪種適合多執行緒情況下進行訪問
  • 如何去監控執行緒
  • Spark 出現OOM,你覺得該怎麼進行調優呢?不去動jvm的引數
  • 你覺得join該怎麼優化
  • 你對未來的規劃是什麼?(五年內)
  • 你也就是走技術路線咯


4.​美圖二面

  • ThriftServer的HA如何去實現,能說下實現的思路嘛
  • 說下Zookeeper的watch機制是如何實現的嘛?
  • 場景題:

     現在有1個client,2個server,當我動態加入一臺機器,或者刪除一臺機器,或者某臺機器宕機了,client該如何去感知到,說下實現思路(不使用Zookeeper),如何通訊,說說具體實現?
 
5.七牛雲面試題

  • 快排
  • hive和hdfs之間的聯絡
  • inode和檔案描述符
  • linux指令如何建立檔案
  • http中header中放入key value 有什麼變化
  • 系統呼叫和庫函式區別
  • http緩衝實現機智
  • session cookie  區別
  • 程序間通訊方式
  • jsp本質
  • http請求狀狀態
  • get post put remove
  • 資料庫join 
  • 資料庫引擎
  • hibernate和mybiters區別
  • jvm垃圾回收
  • hive和關係型資料庫區別
  • hive實現原理
  • spark與mr的區別