① 怎麼面試大數據分析師
1、考察對數據的敏感度。
面試的時候,數據部門經理問一些生活中的數據的問題,一個優秀的數據分析師對數據有很強的敏感度,生活中常見的數據,你直觀的感受往往能反應出你的資質。
2、數學基本概念和統計學方法。
遇到的有排列組合的問題的,還有指數衰減的定義等等。或者直接給一個問題或者數據,問問你打算用什麼樣的方法怎樣去分析。在給你數據的時候,一定要記得說數據預處理!這一點非常重要,這樣會讓人覺得你的回答邏輯清楚,有條有理。如果想從事與數據科學相關的崗位,需要學習的數據知識可以參考成都加米穀大數據培訓機構的:想從事數據科學相關崗位,這些數學基礎「必備」。
3、編程能力。
你一定要有自己熟練的軟體,常問的問題是,你一般用excel干什麼,常用的函數有哪些?你是否用過數據透視表?是夠用過宏?你平時多久用一次R?你是否用過或了解過並行?等等關於軟體的問題。在面試小公司時,HR會可能直接給你一個數據進行數據分析,題目一般給的都不太難。
② 怎麼成為大數據分析師
要從事某一項職業,需要具備充分的興趣,需要耐心和信心,同時還要有專業的知識和技能,通過一定的實踐,積累一定的經驗。下面分享一下怎麼成為大數據分析師。
方法/步驟
成為大數據分析師需要:首先,要對數據分析感興趣,要成為大數據分析師,要對該領域感興趣,興趣是最好的老師,既可以幫助自己全身心投入到大數據分析的工作之中,還可以幫助自己更好的堅持研究下去。
成為大數據分析師需要:學習專業的數據分析知識和技巧。大數據分析師是需要具備專業知識和技能的,在其位謀其政,大數據分析師核心工作內容自然是圍繞數據開始的,需要專業知識和技能的使用來解決問題和發現問題。
成為大數據分析師需要:具備耐心和信心。一個有信心的人更容易成為職場中的精英,而大數據分析需要耐心,需要細心,要認真用心的對待工作中的每一件事情,尤其是數據方面的。
成為大數據分析師需要:進入一個平台進行實際數據分析的工作。一方面是為了自己積累更多的數據分析經驗,另一方面,好的知識和能力都是通過實際工作來得到的。
成為大數據分析師需要:尋找資深的專家來當自己的老師,或者能夠建立一種良好的關系,可以及時請教自己不懂的問題。要想成為大數據分析師,還需要有名師指導,需要有資深的專家來幫助自己。
成為大數據分析師需要:學會利用工具。工欲善其事,必先利其器。作為當代大數據分析師,要學會利用工具,合理使用工具,既可以提高自己的工作效率,還可以幫助自己提高自己的業務能力。
成為大數據分析師需要:參加培訓,獲得更多的知識,同時取得一定的從業資質。要成為大數據分析師,除妖又要名師指導,要具備專業的知識,定期的培訓學習也必不可少。而且取得從業資質會讓自己的能力和背書變得更強。
③ 怎樣成為大數據分析師
數據分析師,需要掌握一些SQL統計語句,如常用的sum累和,max最大值,average平均值,min最小值,group by 分類匯總,order by 排序等工具函數;需要掌握excel的一些基礎公式運用,條件運用等;對各種報表圖形的運用了如指掌。
需要掌握一些SQL統計語句,如常用的sum累和,max最大值,average平均值,min最小值,group by 分類匯總,order by 排序等工具函數;懂得聯表查詢,過濾得基本操作。
Excel基礎操作,能夠熟悉運用各種公式與函數、數據過濾、數據高級分析、模擬分析、數據透視表、圖表
能夠對ETL數據挖掘及轉換成不同維度的報表等,像互聯網常用的DAU,CCU,LTV,CAC,PBP等運用駕輕就熟,就對各種報表圖形的運用了如指掌。
④ 大數據分析師發展前景怎麼樣我想去學下。
大數據分析師前景如何?發展趨勢又是怎樣的呢?談及這個問題,我想先從大數據行業背景以及發展趨勢著手,從根本上解除質疑者的憂慮。
大數據與大數據分析
數據分析是用包括檢查、清洗、轉換和建模等方法對數據進行處理。其目的是探索有用的信息、給出有建設性的意見,從而輔助壓制決策。數據分析包含很多方面和方法,涉及的領域也遍布經濟、科學、社會福利等行業。 數據挖掘是一個特別的數據分析技術,與傳統的以純描述為目的的技術相比,它專注於預測模型和對潛在知識的挖掘。所有的這些都是數據分析。數據分析雖然沒有數據科學那樣先進,可以創造新的數據結構,但是他們的目的都是一樣的---探索數據可以用來怎樣回答問題和解決問題。
大數據1.0到大數據2.0的發展
由維克托.邁爾舍恩伯格編寫的《大數據時代》里指出大數據是指採用所有的數據進行分析,而不是抽樣調查。大數據有4V特點:volume(大量)、velocity(高速)、variety(多樣)、value(價值)。大數據1.0時代的特徵是解決數據效率問題,大數據時代4個V中的前3個V都被有效的詮釋了。但是最後一個V沒有表現其作用。
大數據1.0時代逐一的解決了速度、容量等問題。在1.0時代積累的大數據將會在2.0時代得到其在價值上面的發揮。
從2015年起,大數據進入2.0時代。大數據2.0時代要求以數據本身的價值為目標,從企業本身業務需求產生的大量數據中通過深入挖掘,分析得出數據本身的價值。1.0時代留在數據認知上面,2.0則要求如何通過這些數據去解決問題。 大數據分析國際背景 在全球500強企業中,90%以上的重要投資與經營決策都取決於充分的數據分析支持。在歐盟、美國、日本等發達地區,數據分析普遍被作為運營決策的前提要素,為社會經濟的高速發展做出重大貢獻。可以說,數據分析技術是一把讓企業通向成功之門的金鑰匙。
大數據分析師前景如何?
從2003年年底信息產業部電子行業職業技能鑒定指導中心(現為「工信部教育與考試中心」)正式設立「數據分析師」培訓項目,並制定出數據分析師培訓、考試及管理辦法。到2017年,中國的數據分析行業已經走過了11個年頭。這期間中國的數據分析師、數據分析師事務所、行業協會(中國商業聯合會數據分析專業委員會)從無到有,發展越來越快,業務領域也是從最初的投資數據分析轉向經營數據分析。目前國家將大數據視為國家戰略,並且在實施上,也已經進入企業戰略層面。
大數據未來發展趨勢又是怎樣的?
1.大數據在經濟預警方面發揮重要作用 2.大數據分析成為市場營銷的重要手段 3.大數據在臨床診斷、遠程監控、葯品研發等領域發揮重要作用 4.大數據為金融領域的客戶管理、營銷管理及風險管理提供重要支撐。
⑤ 如何考大數據分析師
大數據分析師報考要求如下:
1、初級數據分析師:
(1)具有大專以上學歷,或從事統計工作的人員;
(2)通過初級筆試、上機考試、報告考核,成績全部合格。
2、中級數據分析師:
(1)具有本科及以上學歷,或初級數據分析師證書,或從事相關工作一年以上;
(2)通過中級筆試、上機考試,成績全部合格;
(3)通過中級實踐應用能力考核。
3、高級數據分析師:
(1)研究生以上學歷,或從事相關工作五年以上;
(2)獲得中級數據分析師證書。
(3)通過高級筆試、報告考核後,獲取准高級數據分析師證書;
(4)考生在獲得准高級證書後,在專業領域工作五年,並撰寫一篇專業數據分析論文,經答辯合格,獲取高級數據分析師合格證書。
(5)怎樣進入發數據分析師這個行業擴展閱讀
技能要求
1、懂業務
從事數據分析工作的前提就會需要懂業務,即熟悉行業知識、公司業務及流程,最好有自己獨到的見解,若脫離行業認知和公司業務背景,分析的結果只會是脫了線的風箏,沒有太大的使用價值。
2、懂管理
一方面是搭建數據分析框架的要求,比如確定分析思路就需要用到營銷、管理等理論知識來指導,如果不熟悉管理理論,就很難搭建數據分析的框架,後續的數據分析也很難進行。另一方面的作用是針對數據分析結論提出有指導意義的分析建議。
⑥ 做大數據分析師的前景怎麼樣
前景會很好,但是道路會很坎坷
數據分析師因其專業技能及量化的數據分析為客戶以及所在單位控制決策風險、保證利益最大化而備受各界青睞被視為我國21世紀的黃金職業。《HR管理世界》將項目數據分析師評為七大賺錢行業。《華商報》將項目數據分析師納入了新七十二行。
所以說前景很好,但是道路還是很坎坷的,正如心理咨詢師 也曾經被評為前景很好的職業,但是考慮到中國國情和中國企業家的特色,所以數據分析要在企業中收到足夠的重視,還有很長一段路
⑦ 大數據分析師這個職業怎麼樣
近期成為月入兩萬的數據分析師的廣告遍地都是,可能會對一些未入行的同學造成錯覺。我個人感覺數據分析師這個崗位,可能近幾年會消亡。
這不意味著這份工作本身不重要,而是說這份工作本身可能會轉化為產品運營的一些必備技能,而不再需要單獨特設人力去做這件事。或者說,不是再需要你學習SQL或者學習python,只是為了成為一名數據分析師。作為一名數據分析師,職業自身的壁壘正在不斷消減,更加主動的擁抱業務,解決真正的產品和用戶需求,或將成為未來的發展趨勢。
數據分析師的日常工作
我們來看下預設中的分析師的一些工作場景,看看數據分析師核心的工作價值。
取數
數據清洗
數據可視化
統計分析
數據方向建設和規劃
數據報告
取數 — SQL
很多人對數據分析師的預設是SQL達人,包括現在很多數據分析師的核心工作其實就是進行SQL取數。
這項工作的痛點和難點在於,我們為了得到一個結果,通常需要join很多的數據集,然後整個SQL語句就會寫的特別長,而且可能會出現一些問題:比如join的表可能會出現key是重復的情況,造成最終的SQL結果因為重復而變得不可用。所以我們需要專人去專門維護各種各樣的數據集,他們知道每張表應該怎麼用。
但這個其實是關系型資料庫遺留下來的產物——我們完全可以不需要join那麼多的表。現在的分布式計算的框架,已經完全可以支持我們只保留一張大寬表,有需要的所有欄位,然後所有的操作都在這張大寬表上進行,而且可以保證查詢速度。這樣數據分析最大的痛點已經沒有了。至於你說大寬表裡面存了很多重復的數據,是不是很浪費資源(關系型資料庫之所以不用大寬表就是從存儲空間和性能的trade-off角度考慮的):放心,分布式存儲本身是不貴的,而計算效率則是由分布式計算框架進行專門優化的。現在的計算框架計算的響應速度,已經可以在大寬表上可以很快的得到結果了。相比之下,多次join操作反而可能會更慢一些。
同時,現在很多公司的NB框架,其實都已經支持拖拽取數了,也根本不需要寫SQL了。
此外,不得不說的一點是,SQL語句本身真的不難。可能如果你自己靜下心來想學,一個周末的時間肯定能搞定。而資歷老的數據分析師,並不會比資歷輕的數據分析師,在SQL語句的寫作上有什麼本質的區別。以前可能還有一些小表join大表的trick,但現在計算框架大多都已經優化過這些了。所以即使是需要寫SQL的場景,本身也是沒有什麼難度的。
所以,通過大寬表來解放數據分析工作的生產力。即使在一定要寫SQL做join操作的時候,本身也不是一件壁壘特別高的事情。取數這件事兒,對於其他崗位的同學,就已經沒那麼復雜了。
數據清洗 — Python
數據清洗其實是很多強調python進行數據分析課程中,python部分的主要賣點。包括但不限於,怎麼處理異常值,怎麼從一些原始的數據中,得到我們想要的數據。
在日常產品需求過程中,這種需求的場景其實很小。因為數據大部分都是自己產生的,很少會出現沒有預設到的極端值或者異常情況。如果有的話,一般就是生產數據的同學代碼寫的有bug,這種發現了之後修復代碼bug就行。
數據清洗在工作場景的應用在於落表——就是把原始數據變成上面提到的,可以通過SQL提取的hive表。這個工作是需要懂代碼的同學去支持的,他們負責數據的產出,包括數據的准確性,數據的延時性(不能太晚產出)等等。前文提到的生成大寬表,其實也可以是他們的工作。這其中就涉及到一些代碼的效率優化問題,這個就不是簡單懂一點python可以搞定的了,可能涉及到一些數據壓縮格式的轉化,比如Json/Proto buffer到hive表的轉化,還有一些計算框架層面的調優,比如spark設置什麼樣的參數,以及怎麼樣存儲可以更好的提升查詢速度。
所以這部分工作一般是由懂代碼的同學完成的。可能數據團隊會有比較少數的同學,管理支持全公司的基礎表的生成。
數據可視化 — Tableau
很多之前在數據分析做實習的同學,主要的工作內容就是在一個商業化的軟體(比如Tableau)上,做一些統計報表。這樣可以通過這些數據報表,可以很方便的查看到所屬業務的一些關鍵指標。這些商業軟體通常都比較難用,比如可能需要先預計算一下才能輸出結果;而且不太好做自定義功能的開發。稍微復雜一點的需求場景,可能就需要一個專門的同學搗鼓一陣,才能輸出最終的統計報表。
現在有更先進的套路了。
首先可視化。很多公司打通了前端和後端的數據,這樣就可以通過網頁查詢原始的資料庫得到數據結果。而現在很多優秀的前端可視化插件,已經可以提供非常豐富的統計圖形的支持。而且因為代碼是開源的,可以根據公司的需求場景進行針對性的開發,公司可以再輔以配置一些更加用戶友好的操作界面,這樣一些復雜需求也有了簡單拖拽實現的可能。而且這些前端js代碼都是免費的!對於公司來說也能省去一筆商業公司的采買成本。
其次很多商業軟體,都是針對小數據集場景設計的。在一些大數據集的場景,一般需要先預計算一些中間表。而如果自己公司定製化開發的前端展示結果,就可以根據需要自主設置計算邏輯和配置計算資源,先在後端進行預計算,前端最終只是作為一個結果展示模塊,把結果展示和需要的預計算進行解耦。這樣就省去了很多中間表的產出,也會更加快速的得到想要的業務指標,快速迭代。
所以可視化數據的工作量也會大大減少。而且會變成一個人人都可以操作,快速得到結果的場景。
統計分析
對於一名數據分析師而言,統計學分析可能是一塊知識性的壁壘。尤其是在現在ab實驗成為互聯網公司迭代標配的今天。需要把實驗設計的那套理論應用起來:比如ab實驗進行後的顯著性檢驗,多少樣本量的數據才能讓這個結論有效可信呢。
但是,你我都知道,經典的統計分析其實是一個非常套路性的工作。其實就是套公式,對應到代碼層面,可能也就一兩行就搞定了。這個代碼的統計分析結果可以作為ab平台的指標展示在最終的ab結果上,大家看一眼就能明白。即使是對那些可能不知道顯著性是什麼意思的人,你可以跟他簡單說,顯著了才有效,不顯著就別管。
這么一想是不是其實不怎麼需要投入額外的人力進行分析?
其他數據相關的工作
數據層面的規劃和設計。移動互聯網剛剛興起的時候,可能那時候數據分析師需要對每一個數據怎麼來設計一套方案,包括原始的埋點怎麼樣,又要怎麼統計出想要的結果。但現在大部分已經過了快速迭代的時代了,新產品的埋點添加可以參考老產品,這就意味著形成套路了。而一旦形成套路,其實就意味著可以通過程序直接完成或者輔助完成。
數據報告。那就真的是一件人人都能做的事情了,試想誰沒在大學期間做過數據報告呢?以前只是因為數據都是從分析師產出的,而如果人人都能取到數據的話,數據報告是不是也不是一個真需求呢?
在我看來,數據分析師這個崗位的天花板和其他崗位相比起來是比較低的。可能工作一兩年之後,從崗位本身就已經學不到什麼額外的工作知識了。主要的工作內容技術含量不是特別高,技能性的更多的是一些可以簡單上手的東西,而且做的時間長了,在這些技能性的事情上得到的積累並不是很多。
數據分析師更像是一個在時代變遷過程中的一個中間崗位:我們從一個基本沒有數據的時代,突然進入了一個數據極大豐富的時代,在這個過程中,我們都知道重視數據。那怎麼能夠利用這個數據呢?可能之前的那一幫人並沒有太多的經驗,於是老闆就招一些人專門來研究一下它,同時做一些底層數據的優化。
經過多年的迭代,現在互聯網行業的每個人都知道數據的價值,也大概知道了什麼樣的數據是重要的,怎樣可以更好的挖掘數據背後的價值。同時底層的基礎設施也已經支持可以讓一個之前沒有經驗的同學可以快速的上手得到自己想要的關鍵數據。這時候對於一個職業數據分析師來說,他的任務就已經完成了。就如同當人人都會講英語的時候,翻譯其實也就沒有存在的價值了。
此後的數據分析工作,可能不再是一些單獨的人做的工作。它會變成一個產品和運營的基礎工具,而且足夠簡單,沒有取數的門檻。只是產品運營怎麼樣可以更好的認識數據,通過數據本身更好的配合產品運營的工作,這已經超脫我們一般理解的數據分析師的工作了,而是一個產品運營分內的工作。
對於那些已經在從事數據分析師崗位的同學來說,建議不要把心思全部投入到數據分析的本職工作上,以完成任務為核心KPI。而是不要給自己設置邊界,多從用戶的角度思考問題,不要因為是產品運營的工作就不去做了。數據分析師這個職業發展到這個階段,要麼做更加底層的數據建設,要麼擁抱業務,最大化的發掘數據背後背後的價值。不要再死守著數據分析的「固有技能」沾沾自喜了。
數據本身的價值是無窮的,作為數據分析師,你們已經先人一步的掌握它了,要有先發優勢。你們最接近數據的人,是最可能發現用戶的寶藏的人。
⑧ 現在大數據分析師工資好高,想從事這一行業應該怎麼做
可以轉行過去呀
做大數據分析師的基本能力:
概率論與統計專學
掌握數據分析工具:掌屬握基礎的數據分析工具Excel與統計分析工具SPSS的用法
編程語言:Python/R
數據可視化工具
對行業的了解程度
數據分析師:從事數據採集、整理、分析,發現問題,分析問題,得出結論,為公司的決策層提供數據支持。偏向於業務。
⑨ 怎麼成為數據分析師
首先我覺得你應該去考慮自己是不是喜歡這個職業,是不是真的想從事大數據這個行業,如果你真的喜歡數據分析這個職業,那就踏實的學習吧。
數據分析分兩個方向,一個是數據開發方向,偏技術,包括開發工程師、挖掘工程師、演算法工程師、數倉工程師,這些相對門檻有點高,對學歷、專業、畢業學校要求都是比較高的。
還有一個是分析方向,偏業務,是通過數據發現業務問題,洞察行業機會點,通過數據產生的價值驅動企業的發展,這也是現在企業數字化轉型最需要的人才。它對編程能力要求較低,學習壓力也會相應減小,我推薦可以考慮這個方向。
但一定要注意的就是千萬不要進入數據分析學習的誤區,就是把工具的學習當成重點,數據分析師這個行業還是比較特殊的,因為這個崗位不以代碼這種實際能看到的東西為主,而是一種「軟實力」,如果打個比方,數據分析師就有點像帝王身邊的預言師,要通過一些天象(產品的情報分析,包括競品和自己的新產品)和市民(用戶數據分析)還有朝內的一些動向(產品經理,運營等的需求)把這些結合起來發現問題並且提出解決方案,是一個國家大腦一樣的存在。所以線上的教程可以教工具的基礎操作,但是不能教業務,公司的真實數據是不可能放在網上公開的,不然這不就被其他競爭國家的「預言師」猜到具體情況了嗎,那你都接觸不到真實的企業數據,又怎麼能做出真實的分析呢,這就是自學的弊端,永遠只能停留在工具的學習上,接觸不到核心。
比如數據分析師需要去連接各個部門,然後去通過數據去發現問題,並且你能把這個問題找到解決的思路,然後再去跟boss、跟產品、跟研發、跟運營能夠溝通溝通順暢,能給他們一個解決的方案,這就需要很強大的溝通能力和邏輯思維。