① 怎么面试大数据分析师
1、考察对数据的敏感度。
面试的时候,数据部门经理问一些生活中的数据的问题,一个优秀的数据分析师对数据有很强的敏感度,生活中常见的数据,你直观的感受往往能反应出你的资质。
2、数学基本概念和统计学方法。
遇到的有排列组合的问题的,还有指数衰减的定义等等。或者直接给一个问题或者数据,问问你打算用什么样的方法怎样去分析。在给你数据的时候,一定要记得说数据预处理!这一点非常重要,这样会让人觉得你的回答逻辑清楚,有条有理。如果想从事与数据科学相关的岗位,需要学习的数据知识可以参考成都加米谷大数据培训机构的:想从事数据科学相关岗位,这些数学基础“必备”。
3、编程能力。
你一定要有自己熟练的软件,常问的问题是,你一般用excel干什么,常用的函数有哪些?你是否用过数据透视表?是够用过宏?你平时多久用一次R?你是否用过或了解过并行?等等关于软件的问题。在面试小公司时,HR会可能直接给你一个数据进行数据分析,题目一般给的都不太难。
② 怎么成为大数据分析师
要从事某一项职业,需要具备充分的兴趣,需要耐心和信心,同时还要有专业的知识和技能,通过一定的实践,积累一定的经验。下面分享一下怎么成为大数据分析师。
方法/步骤
成为大数据分析师需要:首先,要对数据分析感兴趣,要成为大数据分析师,要对该领域感兴趣,兴趣是最好的老师,既可以帮助自己全身心投入到大数据分析的工作之中,还可以帮助自己更好的坚持研究下去。
成为大数据分析师需要:学习专业的数据分析知识和技巧。大数据分析师是需要具备专业知识和技能的,在其位谋其政,大数据分析师核心工作内容自然是围绕数据开始的,需要专业知识和技能的使用来解决问题和发现问题。
成为大数据分析师需要:具备耐心和信心。一个有信心的人更容易成为职场中的精英,而大数据分析需要耐心,需要细心,要认真用心的对待工作中的每一件事情,尤其是数据方面的。
成为大数据分析师需要:进入一个平台进行实际数据分析的工作。一方面是为了自己积累更多的数据分析经验,另一方面,好的知识和能力都是通过实际工作来得到的。
成为大数据分析师需要:寻找资深的专家来当自己的老师,或者能够建立一种良好的关系,可以及时请教自己不懂的问题。要想成为大数据分析师,还需要有名师指导,需要有资深的专家来帮助自己。
成为大数据分析师需要:学会利用工具。工欲善其事,必先利其器。作为当代大数据分析师,要学会利用工具,合理使用工具,既可以提高自己的工作效率,还可以帮助自己提高自己的业务能力。
成为大数据分析师需要:参加培训,获得更多的知识,同时取得一定的从业资质。要成为大数据分析师,除妖又要名师指导,要具备专业的知识,定期的培训学习也必不可少。而且取得从业资质会让自己的能力和背书变得更强。
③ 怎样成为大数据分析师
数据分析师,需要掌握一些SQL统计语句,如常用的sum累和,max最大值,average平均值,min最小值,group by 分类汇总,order by 排序等工具函数;需要掌握excel的一些基础公式运用,条件运用等;对各种报表图形的运用了如指掌。
需要掌握一些SQL统计语句,如常用的sum累和,max最大值,average平均值,min最小值,group by 分类汇总,order by 排序等工具函数;懂得联表查询,过滤得基本操作。
Excel基础操作,能够熟悉运用各种公式与函数、数据过滤、数据高级分析、模拟分析、数据透视表、图表
能够对ETL数据挖掘及转换成不同维度的报表等,像互联网常用的DAU,CCU,LTV,CAC,PBP等运用驾轻就熟,就对各种报表图形的运用了如指掌。
④ 大数据分析师发展前景怎么样我想去学下。
大数据分析师前景如何?发展趋势又是怎样的呢?谈及这个问题,我想先从大数据行业背景以及发展趋势着手,从根本上解除质疑者的忧虑。
大数据与大数据分析
数据分析是用包括检查、清洗、转换和建模等方法对数据进行处理。其目的是探索有用的信息、给出有建设性的意见,从而辅助压制决策。数据分析包含很多方面和方法,涉及的领域也遍布经济、科学、社会福利等行业。 数据挖掘是一个特别的数据分析技术,与传统的以纯描述为目的的技术相比,它专注于预测模型和对潜在知识的挖掘。所有的这些都是数据分析。数据分析虽然没有数据科学那样先进,可以创造新的数据结构,但是他们的目的都是一样的---探索数据可以用来怎样回答问题和解决问题。
大数据1.0到大数据2.0的发展
由维克托.迈尔舍恩伯格编写的《大数据时代》里指出大数据是指采用所有的数据进行分析,而不是抽样调查。大数据有4V特点:volume(大量)、velocity(高速)、variety(多样)、value(价值)。大数据1.0时代的特征是解决数据效率问题,大数据时代4个V中的前3个V都被有效的诠释了。但是最后一个V没有表现其作用。
大数据1.0时代逐一的解决了速度、容量等问题。在1.0时代积累的大数据将会在2.0时代得到其在价值上面的发挥。
从2015年起,大数据进入2.0时代。大数据2.0时代要求以数据本身的价值为目标,从企业本身业务需求产生的大量数据中通过深入挖掘,分析得出数据本身的价值。1.0时代留在数据认知上面,2.0则要求如何通过这些数据去解决问题。 大数据分析国际背景 在全球500强企业中,90%以上的重要投资与经营决策都取决于充分的数据分析支持。在欧盟、美国、日本等发达地区,数据分析普遍被作为运营决策的前提要素,为社会经济的高速发展做出重大贡献。可以说,数据分析技术是一把让企业通向成功之门的金钥匙。
大数据分析师前景如何?
从2003年年底信息产业部电子行业职业技能鉴定指导中心(现为“工信部教育与考试中心”)正式设立“数据分析师”培训项目,并制定出数据分析师培训、考试及管理办法。到2017年,中国的数据分析行业已经走过了11个年头。这期间中国的数据分析师、数据分析师事务所、行业协会(中国商业联合会数据分析专业委员会)从无到有,发展越来越快,业务领域也是从最初的投资数据分析转向经营数据分析。目前国家将大数据视为国家战略,并且在实施上,也已经进入企业战略层面。
大数据未来发展趋势又是怎样的?
1.大数据在经济预警方面发挥重要作用 2.大数据分析成为市场营销的重要手段 3.大数据在临床诊断、远程监控、药品研发等领域发挥重要作用 4.大数据为金融领域的客户管理、营销管理及风险管理提供重要支撑。
⑤ 如何考大数据分析师
大数据分析师报考要求如下:
1、初级数据分析师:
(1)具有大专以上学历,或从事统计工作的人员;
(2)通过初级笔试、上机考试、报告考核,成绩全部合格。
2、中级数据分析师:
(1)具有本科及以上学历,或初级数据分析师证书,或从事相关工作一年以上;
(2)通过中级笔试、上机考试,成绩全部合格;
(3)通过中级实践应用能力考核。
3、高级数据分析师:
(1)研究生以上学历,或从事相关工作五年以上;
(2)获得中级数据分析师证书。
(3)通过高级笔试、报告考核后,获取准高级数据分析师证书;
(4)考生在获得准高级证书后,在专业领域工作五年,并撰写一篇专业数据分析论文,经答辩合格,获取高级数据分析师合格证书。
(5)怎样进入发数据分析师这个行业扩展阅读
技能要求
1、懂业务
从事数据分析工作的前提就会需要懂业务,即熟悉行业知识、公司业务及流程,最好有自己独到的见解,若脱离行业认知和公司业务背景,分析的结果只会是脱了线的风筝,没有太大的使用价值。
2、懂管理
一方面是搭建数据分析框架的要求,比如确定分析思路就需要用到营销、管理等理论知识来指导,如果不熟悉管理理论,就很难搭建数据分析的框架,后续的数据分析也很难进行。另一方面的作用是针对数据分析结论提出有指导意义的分析建议。
⑥ 做大数据分析师的前景怎么样
前景会很好,但是道路会很坎坷
数据分析师因其专业技能及量化的数据分析为客户以及所在单位控制决策风险、保证利益最大化而备受各界青睐被视为我国21世纪的黄金职业。《HR管理世界》将项目数据分析师评为七大赚钱行业。《华商报》将项目数据分析师纳入了新七十二行。
所以说前景很好,但是道路还是很坎坷的,正如心理咨询师 也曾经被评为前景很好的职业,但是考虑到中国国情和中国企业家的特色,所以数据分析要在企业中收到足够的重视,还有很长一段路
⑦ 大数据分析师这个职业怎么样
近期成为月入两万的数据分析师的广告遍地都是,可能会对一些未入行的同学造成错觉。我个人感觉数据分析师这个岗位,可能近几年会消亡。
这不意味着这份工作本身不重要,而是说这份工作本身可能会转化为产品运营的一些必备技能,而不再需要单独特设人力去做这件事。或者说,不是再需要你学习SQL或者学习python,只是为了成为一名数据分析师。作为一名数据分析师,职业自身的壁垒正在不断消减,更加主动的拥抱业务,解决真正的产品和用户需求,或将成为未来的发展趋势。
数据分析师的日常工作
我们来看下预设中的分析师的一些工作场景,看看数据分析师核心的工作价值。
取数
数据清洗
数据可视化
统计分析
数据方向建设和规划
数据报告
取数 — SQL
很多人对数据分析师的预设是SQL达人,包括现在很多数据分析师的核心工作其实就是进行SQL取数。
这项工作的痛点和难点在于,我们为了得到一个结果,通常需要join很多的数据集,然后整个SQL语句就会写的特别长,而且可能会出现一些问题:比如join的表可能会出现key是重复的情况,造成最终的SQL结果因为重复而变得不可用。所以我们需要专人去专门维护各种各样的数据集,他们知道每张表应该怎么用。
但这个其实是关系型数据库遗留下来的产物——我们完全可以不需要join那么多的表。现在的分布式计算的框架,已经完全可以支持我们只保留一张大宽表,有需要的所有字段,然后所有的操作都在这张大宽表上进行,而且可以保证查询速度。这样数据分析最大的痛点已经没有了。至于你说大宽表里面存了很多重复的数据,是不是很浪费资源(关系型数据库之所以不用大宽表就是从存储空间和性能的trade-off角度考虑的):放心,分布式存储本身是不贵的,而计算效率则是由分布式计算框架进行专门优化的。现在的计算框架计算的响应速度,已经可以在大宽表上可以很快的得到结果了。相比之下,多次join操作反而可能会更慢一些。
同时,现在很多公司的NB框架,其实都已经支持拖拽取数了,也根本不需要写SQL了。
此外,不得不说的一点是,SQL语句本身真的不难。可能如果你自己静下心来想学,一个周末的时间肯定能搞定。而资历老的数据分析师,并不会比资历轻的数据分析师,在SQL语句的写作上有什么本质的区别。以前可能还有一些小表join大表的trick,但现在计算框架大多都已经优化过这些了。所以即使是需要写SQL的场景,本身也是没有什么难度的。
所以,通过大宽表来解放数据分析工作的生产力。即使在一定要写SQL做join操作的时候,本身也不是一件壁垒特别高的事情。取数这件事儿,对于其他岗位的同学,就已经没那么复杂了。
数据清洗 — Python
数据清洗其实是很多强调python进行数据分析课程中,python部分的主要卖点。包括但不限于,怎么处理异常值,怎么从一些原始的数据中,得到我们想要的数据。
在日常产品需求过程中,这种需求的场景其实很小。因为数据大部分都是自己产生的,很少会出现没有预设到的极端值或者异常情况。如果有的话,一般就是生产数据的同学代码写的有bug,这种发现了之后修复代码bug就行。
数据清洗在工作场景的应用在于落表——就是把原始数据变成上面提到的,可以通过SQL提取的hive表。这个工作是需要懂代码的同学去支持的,他们负责数据的产出,包括数据的准确性,数据的延时性(不能太晚产出)等等。前文提到的生成大宽表,其实也可以是他们的工作。这其中就涉及到一些代码的效率优化问题,这个就不是简单懂一点python可以搞定的了,可能涉及到一些数据压缩格式的转化,比如Json/Proto buffer到hive表的转化,还有一些计算框架层面的调优,比如spark设置什么样的参数,以及怎么样存储可以更好的提升查询速度。
所以这部分工作一般是由懂代码的同学完成的。可能数据团队会有比较少数的同学,管理支持全公司的基础表的生成。
数据可视化 — Tableau
很多之前在数据分析做实习的同学,主要的工作内容就是在一个商业化的软件(比如Tableau)上,做一些统计报表。这样可以通过这些数据报表,可以很方便的查看到所属业务的一些关键指标。这些商业软件通常都比较难用,比如可能需要先预计算一下才能输出结果;而且不太好做自定义功能的开发。稍微复杂一点的需求场景,可能就需要一个专门的同学捣鼓一阵,才能输出最终的统计报表。
现在有更先进的套路了。
首先可视化。很多公司打通了前端和后端的数据,这样就可以通过网页查询原始的数据库得到数据结果。而现在很多优秀的前端可视化插件,已经可以提供非常丰富的统计图形的支持。而且因为代码是开源的,可以根据公司的需求场景进行针对性的开发,公司可以再辅以配置一些更加用户友好的操作界面,这样一些复杂需求也有了简单拖拽实现的可能。而且这些前端js代码都是免费的!对于公司来说也能省去一笔商业公司的采买成本。
其次很多商业软件,都是针对小数据集场景设计的。在一些大数据集的场景,一般需要先预计算一些中间表。而如果自己公司定制化开发的前端展示结果,就可以根据需要自主设置计算逻辑和配置计算资源,先在后端进行预计算,前端最终只是作为一个结果展示模块,把结果展示和需要的预计算进行解耦。这样就省去了很多中间表的产出,也会更加快速的得到想要的业务指标,快速迭代。
所以可视化数据的工作量也会大大减少。而且会变成一个人人都可以操作,快速得到结果的场景。
统计分析
对于一名数据分析师而言,统计学分析可能是一块知识性的壁垒。尤其是在现在ab实验成为互联网公司迭代标配的今天。需要把实验设计的那套理论应用起来:比如ab实验进行后的显著性检验,多少样本量的数据才能让这个结论有效可信呢。
但是,你我都知道,经典的统计分析其实是一个非常套路性的工作。其实就是套公式,对应到代码层面,可能也就一两行就搞定了。这个代码的统计分析结果可以作为ab平台的指标展示在最终的ab结果上,大家看一眼就能明白。即使是对那些可能不知道显著性是什么意思的人,你可以跟他简单说,显著了才有效,不显著就别管。
这么一想是不是其实不怎么需要投入额外的人力进行分析?
其他数据相关的工作
数据层面的规划和设计。移动互联网刚刚兴起的时候,可能那时候数据分析师需要对每一个数据怎么来设计一套方案,包括原始的埋点怎么样,又要怎么统计出想要的结果。但现在大部分已经过了快速迭代的时代了,新产品的埋点添加可以参考老产品,这就意味着形成套路了。而一旦形成套路,其实就意味着可以通过程序直接完成或者辅助完成。
数据报告。那就真的是一件人人都能做的事情了,试想谁没在大学期间做过数据报告呢?以前只是因为数据都是从分析师产出的,而如果人人都能取到数据的话,数据报告是不是也不是一个真需求呢?
在我看来,数据分析师这个岗位的天花板和其他岗位相比起来是比较低的。可能工作一两年之后,从岗位本身就已经学不到什么额外的工作知识了。主要的工作内容技术含量不是特别高,技能性的更多的是一些可以简单上手的东西,而且做的时间长了,在这些技能性的事情上得到的积累并不是很多。
数据分析师更像是一个在时代变迁过程中的一个中间岗位:我们从一个基本没有数据的时代,突然进入了一个数据极大丰富的时代,在这个过程中,我们都知道重视数据。那怎么能够利用这个数据呢?可能之前的那一帮人并没有太多的经验,于是老板就招一些人专门来研究一下它,同时做一些底层数据的优化。
经过多年的迭代,现在互联网行业的每个人都知道数据的价值,也大概知道了什么样的数据是重要的,怎样可以更好的挖掘数据背后的价值。同时底层的基础设施也已经支持可以让一个之前没有经验的同学可以快速的上手得到自己想要的关键数据。这时候对于一个职业数据分析师来说,他的任务就已经完成了。就如同当人人都会讲英语的时候,翻译其实也就没有存在的价值了。
此后的数据分析工作,可能不再是一些单独的人做的工作。它会变成一个产品和运营的基础工具,而且足够简单,没有取数的门槛。只是产品运营怎么样可以更好的认识数据,通过数据本身更好的配合产品运营的工作,这已经超脱我们一般理解的数据分析师的工作了,而是一个产品运营分内的工作。
对于那些已经在从事数据分析师岗位的同学来说,建议不要把心思全部投入到数据分析的本职工作上,以完成任务为核心KPI。而是不要给自己设置边界,多从用户的角度思考问题,不要因为是产品运营的工作就不去做了。数据分析师这个职业发展到这个阶段,要么做更加底层的数据建设,要么拥抱业务,最大化的发掘数据背后背后的价值。不要再死守着数据分析的“固有技能”沾沾自喜了。
数据本身的价值是无穷的,作为数据分析师,你们已经先人一步的掌握它了,要有先发优势。你们最接近数据的人,是最可能发现用户的宝藏的人。
⑧ 现在大数据分析师工资好高,想从事这一行业应该怎么做
可以转行过去呀
做大数据分析师的基本能力:
概率论与统计专学
掌握数据分析工具:掌属握基础的数据分析工具Excel与统计分析工具SPSS的用法
编程语言:Python/R
数据可视化工具
对行业的了解程度
数据分析师:从事数据采集、整理、分析,发现问题,分析问题,得出结论,为公司的决策层提供数据支持。偏向于业务。
⑨ 怎么成为数据分析师
首先我觉得你应该去考虑自己是不是喜欢这个职业,是不是真的想从事大数据这个行业,如果你真的喜欢数据分析这个职业,那就踏实的学习吧。
数据分析分两个方向,一个是数据开发方向,偏技术,包括开发工程师、挖掘工程师、算法工程师、数仓工程师,这些相对门槛有点高,对学历、专业、毕业学校要求都是比较高的。
还有一个是分析方向,偏业务,是通过数据发现业务问题,洞察行业机会点,通过数据产生的价值驱动企业的发展,这也是现在企业数字化转型最需要的人才。它对编程能力要求较低,学习压力也会相应减小,我推荐可以考虑这个方向。
但一定要注意的就是千万不要进入数据分析学习的误区,就是把工具的学习当成重点,数据分析师这个行业还是比较特殊的,因为这个岗位不以代码这种实际能看到的东西为主,而是一种“软实力”,如果打个比方,数据分析师就有点像帝王身边的预言师,要通过一些天象(产品的情报分析,包括竞品和自己的新产品)和市民(用户数据分析)还有朝内的一些动向(产品经理,运营等的需求)把这些结合起来发现问题并且提出解决方案,是一个国家大脑一样的存在。所以线上的教程可以教工具的基础操作,但是不能教业务,公司的真实数据是不可能放在网上公开的,不然这不就被其他竞争国家的“预言师”猜到具体情况了吗,那你都接触不到真实的企业数据,又怎么能做出真实的分析呢,这就是自学的弊端,永远只能停留在工具的学习上,接触不到核心。
比如数据分析师需要去连接各个部门,然后去通过数据去发现问题,并且你能把这个问题找到解决的思路,然后再去跟boss、跟产品、跟研发、跟运营能够沟通沟通顺畅,能给他们一个解决的方案,这就需要很强大的沟通能力和逻辑思维。