当前位置 > 首页 > 数据分析全知道 > 四步说明数据分析师的工作内容

四步说明数据分析师的工作内容

来源:CPDA中国数据分析学习网 | 时间:2016-06-01 | 作者:数据分析学习网

数据分析师的基本工作内容是什么?!简单的流程就是获取数据,分析数据,然后从数据中发现有价值的东西,并且提出自己的意见,这就是数据分析师的工作内容,当然肯定远不像说的这么简单。

一名好的数据分析师,接到一个需求时,会更多考虑这个需求本身,包括要做的东西是什么,为什么这么做,还可以怎么做,怎么去做,关键点是什么。都想清楚了,才去动手做。建议任何一名数据分析人员,都要在做以前把问题想清楚,确认清楚,不要等到做完才发现自己做错了,那样会很浪费时间。

 

做一名数据分析员要经历的几个步骤:

 

1.获取数据

获取相关的数据,是数据分析的前提。每个企业,都有自己的一套存储机制。比如淘宝,所有的数据都在HADOOP上,很多数据都要经过HADOOP,hive来获取。因此,基础的SQL语言是必须的。具备基本SQL基础,再学习下HIVE的细节语法,基本就可以通过HIVE拿到很多数据了。每个需求明确以后,都要根据需要把相关的数据拿到,做基础数据。

 

数据挖掘

 

2.处理数据

把数据处理成自己想要的东西,是一个关键点。很多时候,有了数据不是完成,而是分析的开始。数据分析师最重要的工作就是把数据根据需求处理好,只有数据根需求结合起来,才能发挥数据处理的价值,看到需求的问题和本质。如果连数据都没处理好,如何从中发现问题呢?!

 

对于数据处理的形式有两种:

第一种,如果初步提取的数据是在LINUX上,建议学一门脚本语言,比如AWK或者PYTHON。如果掌握一门脚本语言,不仅可以在LINUX系统上写很多自动脚本来运行,会大大节省自己的时间,还可以通过脚本语言把基础数据处理成自己想要的任何形式,直接可以使用。

第二种,如果没有在LINUX上,那可以直接下载,然后通过其他统计软件来处理。个人推荐SAS或者R语言。SAS的强大,不必多说。没有SAS解决不了的问题基本,而且SAS也有SQL,处理起来也方便。R语言最近也很火,而且免费,packages越来越多,画图也简单,类似Matlab。如果前期数据处理的好,后续只需要通过R或者SAS画一些图就可以了。在数据分析师的世界,按照价值排序,图>表>文字。

 

数据处理

 

3.分析数据

这里的数据,包括图,表,数字几种。分析数据是整个分析的关键,也考验分析师的水平。好的分析师,可以根据趋势图,对比数据,敏锐的观察到很多问题。可是这需要对业务,对数据有很深的了解,才会把数据和业务结合起来,发挥两者的价值,完成需求。所以,一名数据分析人员,要把更多的时间放在了解业务上。只有了解业务,清楚细节需求,才会明白业务变动可能引起的数据指标变动,也会在后续的需求分析中,更快更全面的解决其他人提出的问题。可能很多人都很困惑,怎么才能“敏锐”的观察到数据的变动呢,我为什么发现不了呢?下面推荐几个方法来锻炼一下:

 

I.多问几个为什么。比如看到一些指标,就想想这些指标代表什么,用自己的话可以怎么理解;看到一条趋势线有波动,就想想为什么某个点异常波动。多问问题,自己就会加深对业务的指标关联敏感性。

II.借鉴统计方法。统计学中,都会有一些纵横对比以及趋势分析。对比,在分析数据的时候,是一个很重要的点。任何东西,也因为有了对比才会有高低和长短之别。另外,分布也是一个很好的东西。分布的变化,就以为这变动,变动的发展结果就能知道业务发展的好坏。其他比如占比之类等等,都是很简单但是很实用的方法。

III.向前辈请教,一个问题有时候经常自己研究半天,但是想不出所以然,旁观者一句话,就能点出问题所在。当自己分析数据找不到要领的时候,一定要听听他人的意见和建议。

数据分析能力

 

 

4.展示数据

分析数据以后,解决需求的问题,就需要汇总分析的成果给其他人。可能分析的过程中拿到的数据有很多,哪些应该给其他人?怎么罗列这些数据?很多分析师都会犯难。举例,一次某个分析员来请教,他手里有很多数据,但是不知道如何组织才能证明自己的结论是正确的。其实,作为一名数据分析师,就是根据数据把问题解决,提出一两条参考意见给到需求方就可以了。因此,回复做到简单明了就好。

数据展示

 

 

最后要说一下,做一名数据分析师真的不容易,不仅需要对业务了解,还要有自己的技术,更要敏锐发现问题进行总结,还要提出建议。自己做了很多工作,未必会有一个好的结果。一名优秀的分析师一定要是一个好的产品规划者和行业领跑者。