網際網路大資料面試題集錦

阿新 • • 發佈：2018-11-17

原文地址:http://hbase.group/article/89

以下面試題都是群裡小夥伴提供的，現場真題(包含校招題)
1.網易大資料面試題

說說專案
Spark哪部分用得好，如何調優
Java哪部分了解比較好
聊聊併發，併發實現方法，volatile關鍵字說說
HashMap的底層原理
為什麼要重寫hashcode和equals
說說jvm
各個垃圾收集器運用在什麼情形
jvm調優
說說io
為什麼考慮轉行呢？是因為原專業不好就業嗎？

2.螞蟻金服面試題

小檔案的合併
MR與Spark的區別
關注哪些名人的部落格

對大資料領域有什麼自己的見解
平常怎麼學習大資料的
StringBuilder與StringBuffer的區別
HashMap與Hashtable的區別
談談你對樹的理解
資料庫索引的實現
jvm的記憶體模型
jvm的垃圾收集器
jvm的垃圾收集演算法
HDFS架構
HDFS讀寫流程
Hadoop3.0做了哪些改進
談談YARN
為什麼專案選擇使用Spark，你覺得Spark的優點在哪裡
瞭解Flink與Storm嘛，他們與Spark Streaming的區別在哪裡
1TB檔案，取重複的詞，top5指定的資源的場景下，如何快速統計出來

3.美圖面試題

為什麼選擇美圖，你知道美圖地點在哪裡嘛
介紹下你做的專案吧
資料統一管理平臺，我挺感興趣的，你說說吧
我大概知道是怎麼回事了，java web這塊你參與開發了嗎
你剛剛專案提到了元資料，你能說說hive的元資料管理嘛，對它瞭解嘛
還是hive，你對hive有哪些原理性瞭解呢
知道AST、operator tree這些長什麼樣嗎
那你的hive轉mr過程是怎麼了解的呢？
除了謂詞下推，還能說說其它的優化嘛？別說資料傾斜的調優
jvm瞭解不，說下垃圾收集演算法
平常用java和scala語言哪個多點

如果我現在要使用map集合，你覺得哪種適合多執行緒情況下進行訪問
如何去監控執行緒
Spark 出現OOM，你覺得該怎麼進行調優呢？不去動jvm的引數
你覺得join該怎麼優化
你對未來的規劃是什麼？(五年內)
你也就是走技術路線咯

4.美圖二面

ThriftServer的HA如何去實現，能說下實現的思路嘛
說下Zookeeper的watch機制是如何實現的嘛？
場景題：

現在有1個client，2個server，當我動態加入一臺機器，或者刪除一臺機器，或者某臺機器宕機了，client該如何去感知到，說下實現思路(不使用Zookeeper),如何通訊，說說具體實現?

5.七牛雲面試題

快排
hive和hdfs之間的聯絡
inode和檔案描述符
linux指令如何建立檔案
http中header中放入key value 有什麼變化
系統呼叫和庫函式區別
http緩衝實現機智
session cookie 區別
程序間通訊方式
jsp本質
http請求狀狀態
get post put remove
資料庫join
資料庫引擎
hibernate和mybiters區別
jvm垃圾回收
hive和關係型資料庫區別
hive實現原理
spark與mr的區別

網際網路大資料面試題集錦

原文地址:http://hbase.group/article/89 以下面試題都是群裡小夥伴提供的，現場真題(包含校招題)1.網易大資料面試題說說專案 Spark哪部分用得好，如何調優 Java哪部分了解比較好聊聊併發，併發實現方法，volatile關鍵字說說

網際網路公司大資料面試題參考指南

以下面試題都是群裡小夥伴提供的，現場真題(包含校招題) 1.網易大資料面試題說說專案 Spark哪部分用得好，如何調優 Java哪部分了解比較好聊聊併發，併發實現方法，volatile關鍵字說說 HashMap的底層原理為什麼要重寫hashcode和equ

大資料面試題01

Spark Application 使用者自己寫的程式，批處理作業的集合，Application的main方法時程式的入口，定義了RDD以及對RDD的操作 SparkContext spark的重要api，使用者邏輯與spark的互動介面。會和Cluster manager

網易杭研大資料面試題

一面： hdfs讀寫過程 MR原理講專案 balabala... 差不多40幾分鐘吧二面：講專案，專案一個點一個點的問。主要講的是PV、UV的統計、其中設計到rowkey衝突怎麼處理。接著講專案balabala 差不多40多分鐘吧 HR面（一個男

2019最新大資料面試題及答案整理

大資料面試題總結一波，助力準備在金三銀四尋找好工作的小夥伴們，只有度過筆試這一關才能在下面的關卡中大展巨集圖！一、如何檢查namenode是否正常執行？重啟namenode的命令是什麼？通過節點資訊和瀏覽器檢視，通過指令碼監控 hadoop-daemon.sh start namenod

大資料面試題分享之spark面試題

一什麼是spark Spark是大資料的排程，監控和分配引擎。它是一個快速通用的叢集計算平臺.Spark擴充套件了流行的MapReduce模型.Spark提供的主要功能之一就是能夠在記憶體中執行計算，但對於在磁碟上執行的複雜應用程式，系統也比MapReduce更有效。

大資料面試題以及答案整理（一）

kafka的message包括哪些資訊一個Kafka的Message由一個固定長度的header和一個變長的訊息體body組成 header部分由一個位元組的magic(檔案格式)和四個位元組的CRC32(用於判斷body訊息體是否正常)構成。當magic的值為

大資料面試題彙總版

作者大資料面試題及答案彙總版當前版本： Ver 1.0 製作單位：編寫人員：審核人：籤收人：簽署日期： 201

2018年大資料面試題總結

目前面試了多家大資料開發工程師，成長了很多，也知道了很多知識，下面和大家分享一下我遇到的面試題和答案。 1.kafka叢集的規模，消費速度是多少。答：一般中小型公司是10個節點，每秒20M左右。 2.hdfs上傳檔案的流程。答：這裡描述的是一個256M的檔

大資料面試題必會2018.01.07

資料分析師常見的10道面試題解答 1.海量日誌資料，提取出某日訪問百度次數最多的那個IP。首先是這一天，並且是訪問百度的日誌中的IP取出來，逐個寫入到一個大檔案中，注意到IP是32位的，最多有個2*32個IP。同樣可以採用對映的方法，比如模1000，把整個大檔案對映為100

大資料面試題—7

9. 面試問題: 1.從前到後從你教育背景(學過哪些課)到各個專案你負責的模組,問的很細(本以為他是物理學博士,但是所有的技術都懂) 2.hadoop 的 namenode 宕機,怎麼解決先分析宕機後的損失，宕機後直接導致client無法訪問，記憶體中的元資料丟失，但是硬碟中的元資料應該還存在

大資料面試題—6

3.14 1、一個Hadoop環境，整合了HBase和Hive，是否有必要給HDFS和Hbase都分別配置壓縮策略？請給出對壓縮策略的建議。 hdfs在儲存的時候不會將資料進行壓縮，如果想進行壓縮，我們可以在向hdfs上傳資料的時候進行壓縮。 1）、採用壓縮流 2）、 &nb

2019最新大資料面試題助力大家度過筆試關

　　大資料面試題總結一波，助力準備在金三銀四尋找好工作的小夥伴們，只有度過筆試這一關才能在下面的關卡中大展巨集圖! 　　一、如何檢查namenode是否正常執行?重啟namenode的命令是什麼? 　　通過節點資訊和瀏覽器檢視，通過指令碼監控　　hadoop-d

經典大資料面試題

什麼是大資料？大資料(big data,mega data)，或稱巨量資料，指的是需要新處理模式才能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的資訊資產。在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大資料時代》中大資料指不用隨機分析法(抽樣調查)

你不知道的BAT大資料面試題

你不知道的BAT大資料面試題 1、kafka的message包括哪些資訊一個Kafka的

30個常見的大資料面試題 --讓你的薪資更上一層

30個常見的大資料面試題：包含spark、scala、storm、hadoop等常見的大資料處理工具；常用的分散式資料庫如hbase、MongoDB、Redis等；其他常用的java基礎、linux相關技術等 1.scala 語言有什麼特點，什

大資料面試題之Hadoop叢集搭建步驟

一、開啟需要搭建Hadoop叢集的主從節點伺服器，配置好靜態IP、主機名hostname、主機IP對映檔案hosts、關掉防火牆二、通過遠端登入工具（我用的是SecureSRT）登入到Linux系統，登入前需要在Windows系統中C:\Windows\System32\

京東商城大資料面試題

Java篇 1、JVM，GC（演算法，新生代，老年代），JVM結構2、hashcode，hashMap，list，hashSet，equals（結構原理），A extends B（類的載入順序）1.父類靜態程式碼塊；2.子類靜態程式碼塊；3.父類非靜態程式碼塊；4.父類

大資料面試題之2018.01.05

5.簡述Hadoop1和Hadoop2架構異同 Hadoop2相比較於Hadoop1來說，HDFS的架構與Mapreduce的都有較大的變化，且速度上和可用性上都有了很大的提高，Hadoop2中有兩個重要的變更。 1 Hdfs的NameNodes可以以叢集方

網易大資料面試題試解

上週無意中看到了一份網易的面試題，說明為大資料部的面試題，粗略的看了一下，覺得挺有趣的，所以嘗試著進行一下解答，首先要吐槽下，不知道這是什麼級別崗位的題目，感覺有些不夠專業，對大資料能力考察的題目幾乎沒有，大多是比較寬泛的問題，感覺各個崗位面試都可以問的那些問

網際網路大資料面試題集錦

相關推薦