1. 程式人生 > >秋招面經筆經-資料分析/資料研發篇(阿里/騰訊/網易/招行信用卡等 更新中)

秋招面經筆經-資料分析/資料研發篇(阿里/騰訊/網易/招行信用卡等 更新中)

個人簡介:本碩雙985,本科專業應用數學,碩士專業cs。有一段滴滴資料運營實習,碩士期間做過兩個工業類的專案(異常檢測/關聯分析),發了兩篇水論文(二作)。
為什麼投資料分析:本來第一意向是演算法。無奈今年演算法崗實在太熱門,美團筆試受挫後覺得選資料分析或許會有更多的機會。

阿里

阿里巴巴資料研發工程師(內推,被轉崗資料分析)

一面:收到的第一個面試是阿里的內推,8.12網申,做完線上測評差不多一天就接到電話問什麼時間方便麵試。因為投的是研發,我本人的方向又是機器學習相關的,於是用一天時間複習了ML演算法、mapreduce、還看了一些面經。然而沒想到面試官問的問題的是這種畫風:
(1)自我介紹
(2)未來的職業規劃(在這裡我說首選的方向是演算法,其次是資料類的,大概率踩雷了orz)
(3)介紹一下以前的工作經歷
(4)介紹一下學校的專案,你覺得你的這些方法在商業領域可以有什麼具體的應用?
(5)你認為一個公司的經濟指標有哪些?(???)
(6)你認為一個判斷一個公司有潛力的核心指標有哪些?(聽到這題簡直感覺自己在面商業分析= =)
(7)想在哪個城市工作,為什麼?
(8)想在什麼行業工作,為什麼?
(9)期望什麼樣的工作環境?
(10)你有什麼問題問我嗎?
由於全過程都覺得很迷在這裡沒忍住問了面試官這個崗是資料開發嗎…為什麼都沒有問開發相關的東西…然後他才告知我我被內部轉崗到了資料分析(……),他是天貓BI做資料分析的。後來我又問了資料分析是不是要求熟悉SQL(當時還不會),以及他們的工作裡會不會用到ML相關技術,他的回答都比較官方,說不會的可以學,ML也還是會用到。╮( ̄▽ ̄”)╭
面完就感覺涼涼,果然第二天收到了rejected。

總結:第一次面試太沒有經驗了…建議大家一開始就要問清自己面的是什麼崗什麼部門(存在轉崗、轉部門可能),回答的時候也一定要圍繞這個職位去說(比如我當時說prefer演算法什麼的就很emmm…)

騰訊

軟體開發-資料分析

內推的時候選了因為事業群選了微信所以一直被泡在池子裡…直到轉正式秋招才收到模擬筆試通知(p.s.騰訊的模擬筆試和筆試是投了簡歷都會收到的,而且秋招的時候之前投的事業群會沒有參考價值)
模擬筆試:題目基本上是春招的原題。具體可參考:
https://blog.csdn.net/Ego_Bai/article/details/79866112
考點包括概率統計、資料結構、排序、ML等等。
筆試:

待9.16補

網易

資料分析師(考拉)

筆試:23道單選+2道簡答,單選各3分,簡答各10分。
部分單選
(1)從(0,1)不經對角線走到(m,n)(m小於n)的方法數?
(2)關係資料模型的三要素?
(3)E-R模型的說法正確的是?
(4)兩個袋子,4種顏色的球,一邊40個一邊36個(各色個數相等),拿出後不放回,什麼時候拿出的球裡至少有12個同色?
(5)神經網路中什麼方式無法避免過擬合?
(6)SVM、logistic迴歸、決策樹、隨機森林裡對中小型資料集分類精度最高的是?
(7)sql查詢語句的正確性?
(8)sql查詢什麼情況下可以正確使用組合索引?
(9)本福特定律的別名?
(10)10人投票,其中7人贊成,3人反對,全程贊成數一直比反對數多的概率是?
(11)ABCD4個人,甲乙丙丁4件工作,A不做甲乙,B不做乙丙,C不做丙丁,問安排的方法數?
(12)X和Y均服從[0,1]上的均勻分佈,X2

+Y2<=1的概率?
(13)一個去開會。遇到另外6人每人各12次,其中每2各6次,每3人各4次,每4人各3次,每5人各2次,每6人各1次,1人也沒遇見的有5次,問他共參加幾次會議?
(14)RGB三種顏色鋪地磚(每個可鋪1x1)。R只能在R的總數目是偶數的情況使用,問1x6地磚的鋪法?
(15)真人臉圖片檢測到人臉的概率是0.9,非人臉圖片檢測到的概率是0.01,已知真人臉與非真人臉圖片比例為2:8,則一張真人臉圖片檢測到人臉的概率是?
(16)pearson相關係數的判斷?
(17)e100在使用泰勒展開計算的時候可以採用哪種拆分?99+1?K*ln2+100?10*10?0.1+99.9?
(18)一個班48人,上學坐公交的40人,放學坐公交的34人,上學放學都坐的人有30人,則上學放學都不坐的人數是?
簡答
(1)什麼是關聯分析?代表演算法有哪些?請寫出其中一種的中心思想與具體步驟
(2)你會從哪些方面對已結束的黑五活動進行復盤?
總結:個人覺得網易的筆試題出得挺好的,涵蓋了概率、統計、sql、ML、業務等等,比起騰訊演算法技術層面的難度低一些。

招行信用卡中心

資料分析類(APP運營方向,內推)

招行的筆試基本全是行測題…還有7 800字選一個結論的推斷,真的無聊死了(捂臉)

迅雷

大資料分析工程師

筆試:26道單選+16道多選,單選各2分,多選各3分。
部分單選
(1)hive裡sql執行計劃怎麼看?show?explain?list?describe?
(2)sql裡limit語句有map嗎?有reduce嗎?
(3)三張表,問其中一個的關鍵碼?
(4)linux怎麼切換到使用者主目錄?
(5)linux刪除命令?
(6)man 5 passwd 的含義?
(7)gzip bizp2 compress的壓縮效率排序?
(8)secondnamenode的作用?
(9)n=5的漢諾塔的移動次數?
(10)升級和不升級的概率的概率都是1/2,5級以上時若不升級則會降級,則一個人從1級升到8級的次數的期望是?
(11)sql中alter通常不能修改?
(12)sql給定表中各列的型別,選擇可以插入的內容為?
(13)HDFS中block size預設的大小是?
(14)上述的預設大小可以修改嗎?
(15)-rwxrw-r-,則其他使用者對檔案的許可權是?
(16)INSTR(‘TUTORIALS POINT’,’P’)的結果是?
(17)一個樣本需要在多個變數上進行描述,用什麼圖表示最好?
(18)描述資料波動的統計量是?
(19)分割槽、並行查詢、檢視、索引哪個不能提高查詢效率?
(20)兩條命令同時執行,1條需要1min執行,另一條需要3min,則從開始到第二條執行完過去了多久?
(21)一個二叉樹,給定前序中序,後序為?
部分多選
(1)缺失值的處理辦法?
(2)RDBMS的判定?
(3)A1A2A3A4A5不可能的出棧順序?
(4)sql運算傾斜的解決方法?
(5)對資料庫的描述不正確的是?
(6)對hive分割槽描述不正確的是?
(7)演算法的結構包括哪些:遞迴、條件、順序?迴圈?
(8)刪除表中所有資料的錯誤語句(truncate、drop、delete)?
(9)hadoop的模式?
(10)對某一商品取名的業務參考指標?
(11)檢視的說法正確的是?
(12)shell中$2的含義?
(13)shell中a+b的方法?
(14)假設檢驗的步驟?
(15)parse_url可以獲取的引數?
(16)hadoop中client上傳過程的描述?
總結:迅雷主要涉及三部分:linux、資料庫、mapreduce,還有少量的統計、演算法。(linux和mapreduce我全靠蒙呵呵噠)

相關推薦

-資料分析/資料研發阿里///信用卡 更新

個人簡介:本碩雙985,本科專業應用數學,碩士專業cs。有一段滴滴資料運營實習,碩士期間做過兩個工業類的專案(異常檢測/關聯分析),發了兩篇水論文(二作)。 為什麼投資料分析:本來第一意向是演算法。無奈今年演算法崗實在太熱門,美團筆試受挫後覺得選資料分析或許

2018 春總結 & 分享 (阿里///今日頭條/微軟)

2018 春招總結 & 面經分享 (阿里/騰訊/網易/今日頭條/微軟) 本文篇幅較長,排版較爛,非戰鬥人員請儘快撤離。 總算是可以對2018-春招-暑期實習專場來一個完美收官了。 最終有幸收到了今日頭條(後端研發),網易杭州研究院(C++開發

資料科學學習手札84基於geopandas的空間資料分析——空間計算

> 本文示例程式碼已上傳至我的`Github`倉庫[https://github.com/CNFeffery/DataScienceStudyNotes](https://github.com/CNFeffery/DataScienceStudyNotes) # 1 簡介   在本系列之前的文章中我們主要

資料科學學習手札88基於geopandas的空間資料分析——空間計算

> 本文示例程式碼及資料已上傳至我的`Github`倉庫[https://github.com/CNFeffery/DataScienceStudyNotes](https://github.com/CNFeffery/DataScienceStudyNotes) # 1 簡介   在***基於geopa

阿里2016校線上筆試有感

  今年有一個數字聽起來很可怕。阿里的網申數量去到170W(還未截至網申的數字),技術類毫無疑問是最多的,我估計會超過100W的技術網申。更加悲劇的是,原計劃3000個校招名額突然縮減85%,最後只留下15%的人,只有400多人。這個數字比高考還要殘酷得多…

Jungle的2019屆校總結含部分

Jungle的秋招結束了,藉助CSDN平臺,總結一下從7月底到10月底正式簽約期間的找工作之旅。首先宣告:Jungle只是個普普通通的小碩,並不是各種大佬,更比不上平均年薪百萬的知乎er,所以在這裡分享的是一個平凡小白的普普通通的求職之旅。 0.背景 大四保研,但是成績並不算拔尖,勉強搭

Java程式設計師大合集BAT美團小米華為中興

Cvte提前批 阿里內推 便利蜂內推 小米內推 金山wps內推 多益網路 拼多多學霸批 搜狗校招 塗鴉移動 中國電信it研發中心 中興 華為 蘇寧內推

產品春實習

Part1:個人情況因面試地點填錯,後選擇在成都霸面,幾經波折最終拿到offerPart2:筆試篇筆試大概可以分成兩個部分,線上筆試和素質測評。線上測試在4月5號,時長為90分鐘,主要是行測題以及兩道產品設計題,總體來說時間還是比較緊的;大概說一說這兩道大題吧:第一題是運營相

資料研發小結涉及阿里 雲音樂以及商湯科技

Mysql的索引型別及其實現原理;同時哪些儲存引擎支援B樹索引,哪些支援Hash索引;為什麼mysql索引要用B+樹而MongoDB用B樹? Mysql查詢如何優化;主鍵和唯一索引的區別;事務的隔離機制,mysql預設是哪一級; MyISAM和InnoDB儲存引擎的區別; Mysql查詢優化,慢查詢怎麼去定位

2018最新安卓面試大全含BAT,,滴滴----你不上BAT的原因:寶典,都在這裡啦

廢話不多說,直接進入正題。 童鞋們可以掃碼右側二維碼,加入微信群,分享你的面試經歷哦~ Java篇 1.Java中sleep、wait、yield、join的區別? 比較項 歸屬 是否釋放鎖 使用範圍 是否需要捕獲異

python 資料分析 資料探勘 人工智慧 教程

python 資料分析 資料探勘 人工智慧 教程 python 資料分析 資料探勘 人工智慧 教程 資料分析 pyhon程式碼 資料分析英文教程 上百g資料,用於資料分析,大資料 新聞資料 產業資料 谷歌資料 維基百科等等 資料 統一解壓密碼 qq92313271

資料分析/資料探勘 入門級選手建議

1.資料分析和資料探勘聯絡和區別 聯絡:都是搞資料的 區別:資料分析偏統計,視覺化,出報表和報告,需要較強的表達能力。資料探勘偏演算法,重模型,需要很深的程式碼功底,要碼程式碼,很多= =。   2.怎麼入門 請百度“如何成為一名資料分析師”或者“如何成為一名資料探勘工

小象學院大資料分析資料探勘精華實戰+資料分析資料探勘實戰

課程簡介:     小象學院大資料分析與資料探勘精華實戰課程 資料分析資料探勘實戰視訊教程 ----------------------課程目錄------------------------------ 第1 章 : 第一週回放課 課時1:第一課:

原創 | 入門資料分析--資料儲存之常用資料庫及區別

獲取資料,除了通過外部獲得,內部獲取,也是一個主要獲取資料的方式。內部資料主要是通過資料庫儲存的方式,將資料存下來,便於各個需求方再去提取應用。那麼,企業常用的儲存資料的資料庫都有哪些呢?不同的資料庫的儲存區別又有哪些? 目前市場上的資料庫主要可以分為關係型資料庫和非關係型資料庫,關係型資料庫通過外來鍵關聯

python大資料分析——資料規範化

(1)最小-最大規範化 x*=(x-min)/(max-min)   (2)零-均值規範化 x*=(x-x的平均值)/標準差 這是當前用得最多的資料標準化方法 (3)小數定標規範化 x*=x/10的K次方   程式碼實現 # -*- cod

Python 資料分析:第一 準備工作

一、安裝或升級Python包 1、安裝Anaconda中的Python包conda install package_name 或者pip install package_name ⽤conda update命令升級包conda update package_name 或者pip install --upg

有n根長度不同的木棒,隨意選取三根湊一個合法的三角形,求總拼湊方案的數量2018軟體開發-後臺開發方向補考試題第三題

題目: 有n根長度不同的木棒,隨意選取三根湊一個合法的三角形,求總拼湊方案的數量。對於兩個方案,只要有一根木棒的長度不同,則視為不同拼湊方案。 輸入描述 第一行為正數t(0 <= t <= 10),表示測試用例數 接下來每兩行一個測試資料,第一行一個整數n

資料分析----pandas 基本用法

一、生成資料表 1、首先匯入pandas庫,一般都會用到numpy庫,首先為我們先匯入備用 import numpy as np import pandas as pd 2、匯入CSV或者xlsx檔案 df=pd.DataFrame(pd.read_csv('name

資料分析那點事兒

在之前我們給大家講了講什麼是資料分析以及資料分析的目的,資料分析就是通過使用合適的方法進行統計,統計也不是隨隨便便的統計的,需要找對方法。統計分析方法對收集來的大量資料進行分析,提取有用資訊和形成結論而對資料加以詳細研究和概括總結的過程。而資料分析的目的就是通過分析資料找到企業未來的發展情況。今天就給大家

資料分析 第七:相關分析

相關分析是資料分析的一個基本方法,可以用於發現不同變數之間的關聯性,關聯是指資料之間變化的相似性,這可以通過相關係數來描述。發現相關性可以幫助你預測未來,而發現因果關係意味著你可以改變世界。  一,協方差和相關係數 如果隨機變數X和Y是相互獨立的,那麼協方差 Cov(X,Y) = E{ [X-E(X)]