CDA:数据分析师职业发展白皮书(2015版)

数据分析师职业发展白皮书(2015版)

目 录

一、是技术也是艺术——CDA研究院和业界前沿公司和对数据分析的认识

二、数据分析师职业发展历程

1.国外数据分析行业发展历程

2.国内数据分析师职业发展

三、数据分析师人才行业现状

1.人才模型/岗位划分

2.国内数据分析师人才薪资水平

3.国内数据分析师人才分布

4.国内数据分析师人才需求

四、数据分析师人才职业规划

1.目前人才职业现状

2.数据分析人才学习路径

3.总结

五、CDA数据分析师培训及认证

1.考试简介

2.为什么选择CDA等级认证考试?

3.如何成为一名CDA数据分析师?

4.人大经济论坛CDA优势

六、数据分析师行业发展前景

1.优势、劣势

2.展望

七、数据分析师行业对《促进大数据发展行动纲要》的响应

1.知识分享氛围的培养

2.人才培养体系的建立

3.从业人员自律文化的形成

八、附录

附录1. 经管之家(原人大经济论坛)发展历程

附录2. 国内重要大数据相关政策行动梳理

一、是技术也是艺术——CDA 研究院和业界前沿公司对数据分析的认识

数据是指以时间为轴,记录人物、地点、事件和方法等生活各个维度的数字字符。数据会随着时间不断累积,也会随着科技、生活观念等变化而呈现出不同的特性。消费者去商场用现金支付的方式购买了一件心仪的衣服,商店的日销售报告中记录了此次交易的金额、数量、款式和型号。当消费者采用的是刷卡的支付方式时,银行的日流水单以及商店的 Pose 机刷卡记录就产生了一笔时时交易数据。如果该消费者还是这家商店的会员,那么该商店就拥有了该消费者部分基本信息以及多次购买产品的交易记录。 随着互联网、自动化科技的发展, 消费者更多的参与了 线上交易,那么线上交易平台会产生消费者常用地址、联系方式、 偏好产品、产品型号、消费额度和消费频率等全面而及时地消费数据。

在传统的商业和社会环境下,人们对于数据的利用是非常有限的。企业和商家们利用自身的营销数据汇编成财务报告、信息披露报告,用来为管理层或者潜在投资者?供企业经营状况的参考资料。政府各个机构拥有的人口、宏观指标、地区发展、部门业务发展等各方面的数据为定期政府报告等特定事项提供数据服务。数据成为我们衡量过去发展状况和业绩水平的一种度量衡。 传统意义上对于数据利用存在的缺失是不可忽视的。

首先,传统意义上对于数据的利用形成了无数个数据孤岛。宏观数据、调研数据、社会化数据和企业数据之间存在数据孤岛,而政府内部和企业内部同样存在数据孤岛。 各个政府部门、甚至每个政府部门内部都有自身因专门的业务内容而产生专项数据,但是这些专项数据仅仅在服从专项需求时才被局部调用。企业内部也是这样,除了必要的信息披露之外,企业各部门之间的数据也是缺乏协同和共享机制的。数据孤岛的存在比我们想象得还要多而广泛,也极大地降低了对数据的利用。

其次,传统数据存在缺失和错误的比率较大。商务系统和互联网尚未发展的情况下,企业和社会运营的数据很多是通过人工的方式进行记录的,因此就很容易存在数据缺失和数据失实的情况。更重要的是,很多数据的产生需要大量的人力、物力去完成,在不可估量商业价值的情况下,数据的累积往往具有很强的延时性。

再次,数据的价值被低估, 缺乏专业的数据分析人员对数据的商业和社会价值进行分析。我们会发现,传统意义上的数据管理是基于某些特定的目的和需求,例如定期的信息披露,盈余管理和预测等。但是这些目的和需求都不是为了能够创造价值而设立的,更多的是一种业务和管理层面的辅助。在缺乏商业利益动机的前提下,也就没有专业数据分析师存在的必要。

近两年国内 市场对数据分析师职位的需求逐步涌现。 根据猎聘网数据显示,全国中高端职位中数据分析师职位由 2014 年初的 200 多个职位逐步增长到接近 3000 个职位,数据分析师职位无论从绝对数到相对数量而言都出现了快速增长的态势。就地区发展而言,数据分析师职位主要分布在北京、上海、杭州、深圳和广州的一线城市,二线城市目前对于数据分析师的需求相对滞后。分析师职位主要集中在互联网、金融、消费品、制药和医疗等行业,其中互联网和金融行业的分析师职位数超过了 80%。 目前数据分析师的薪酬水平高于行业平均水平,体现出数据分析师以及数据的价值正在逐渐被市场所认可。

数据分析师职位的大量涌现和对数据分析师市场价值的认可主要是基于数据分析3.0时代的到来。1954-2005年,电脑设备广泛应用,数据库的初步形成;2005-2013年,互联网蓬勃发展,互联网公司为了解决自身数据量较大、数据复杂的问题引入了解决数据问题的分析工具;2013 年至今, 传统行业开始引入互联网行业中运用的数据分析方法,数据分析3.0时代开启。2013年至今,数据相关企业迅速发展,包括为数据?供分析、服务、软件和硬件相关的商业化和开源公司。鉴于互联网行业对于大数据分析成功的经验,市场开始重视数据和数据分析对创造商业价值的重大潜力。

大数据时代我们拥有的数据是足够大的。在互联网的世界里,每分钟 Facebook平均有600次的访问量,并有新增用户28万;Amazon 每分钟销售高达8.3万美元;全球 IP 网一分钟能够传输639TB的数据;你需要花费5年的时间才能看完互联网上一秒钟传输的视频。同时,大数据时代的数据开始逐步走向多元化的趋势。 数据来源包括移动数据、店面交易、网络行为、定位信息、电商、用户调查、社会网络以及企业CRM 等。大数据时代可视化趋势明显,开始重视展示数据的在线动态模式以及分布形态。 数据可视化是一种新的数据分析手段、一种叙事手段,并且包含了思考和批判的思维。通过数据可视化的方式,我们能够探查数据之间的关联。随着技术的发展,可视化将推动数据时时动态,以及自动化更新和发布的发展。

但是无论数据的形态和体量发生了何种变化,缺乏数据分析的数据本身是不具备商业价值的。数据分析能够为大数据时代带来质的飞跃。SAS 公司将数据分析分为了八个等级,分别是常规报表、查询、多维分析、警报、统计分析、预报、预测建模和优化。常规报表、查询、多维分析、警报,这数据分析的前四个等级都只能展示已经发生的历史状况,但是数据分析不仅仅如此。 统计分析能够帮助我们找到触发事件发生的相关因素、 确认最为有效的潜在交易方案。 预报可以告诉我们未来股市预期变动或者是企业未来盈利水平预期。 预测建模可以帮助金融机构预测新的金融产品的潜在客户。 运筹优化能够帮助企业在限定的条件下把握最优的业务机会。

数据分析的核心思路就是要与实际业务、商业目的和运营目标相结合,进而为社会、经济和个体创造价值。 数据分析与业务流程相结合可以体现为五个基本步骤,包括认知、运营、交互、销售和维护。商业运营要与数据分析的关键指标紧密联系,用数据提高产品市场营销效率和推广效率。大数据的维护和累积能够为商业运营描绘完整的企业画像、客户画像。大数据画像包括了了解企业或者客户的基本信息、需求倾向、用户行为等等。通过追踪核心的数据指标,进一步完善企业或者客户画像,进而将其转化成为产品元素和营销战略。通过数据分析,我们可以知道通过什么渠道、以最小的成本将竞争对手的客户 转化为自身的客户, 进而创造营业收益。 通过大数据与运营维护的结合可以很大程度上提高客户满意度,降低客户的流失率。

目前数据分析实践的运用主要体现在物联网、定位服务、客户制成以及反欺诈领域。首先是物联网领域。以 UPS 为例, UPS 每天通过 5 万台快递车派送约 1630 万个包括。 UPS 在每台快递车上都安装了传感器,并且通过传感器传输数据分析,制定每天每台车少跑一英里的运营战略,该战略为 UPS 每年实现了约 3000 完美元的盈利。其次是定位服务。以美洲银行为例,美洲银行为其客户?供汉堡王的优惠券。该优惠券以美洲银行客户刷卡记录数据为基础,判断汉堡王潜在竞争对手的客户,并对这些客户进行了定向、定位的优惠券推送。该项营销战略既维护了美洲银行客户,也为汉堡王实现了创收。再次是客户支撑。通过文本挖掘、自然语言处理、情感分析等手段,对客户评论、客户投诉、海外舆情、媒体报道数据进行分类处理, 进而充分掌握客户潜在的需求,达到及时有效维护客户的商业目的。最后是反欺诈领域。最典型的例子就是保险公司骗保。我们都过神经网络分析等多元的数据分析方法及时识别和判断已有的欺诈模式和潜在的欺诈人群,进而有效的进行客户管理,确保企业运营和效益。

在传统的数据分析模式下,我们通常是先提出假设检验,后带着问题去进行数据分析。在大数据时代下,我们更重要的是关注小数据完善和收集的同时,构建完善的数据交互平台。在先有数据的基础上,在数据中找寻新的思路和创新机遇,进而实现价值的飞跃。在数据爆炸和新媒体时代的背景下, 文字、图片、 视频、 网络数据等新兴的数据模式使得我们需要掌握和运用全新的数据处理方式。 同时, 我们还需要对数据进行生命周期的管理, 对非结构数据进行筛选和标签化。数据分析看重的是数据的多元性和数据的质量,我们需要构建起大数据谱系, 同时结合数据的特性采用不同的数据分析方法、分析工具和分析模型。因此,数据分析需要较为综合的思维和能力。

综上可知,数据分析是一门技术也是一门艺术,数据分析起源于生活,也为生活创造着新的价值。 从事数据分析师需要累计多元化的知识和素质,包括统计学、机器学习、工程、可视化、深刻行业知识、强数据库能力,炼精炼信息的能力、运筹学等。数据分析师还需要具备怀疑态度以及创造能力,才能将数据的技术和艺术相结合,使得数据分析能够业务相结合,更加贴近我们的生活。 多元化的学识背景以及对于生活的感知能够造就一名优秀的数据分析师。 大数据时代已经来临,数据分析行业的急速扩展必然给数据分析师们带来广阔的发展空间。数据分析师是一门需要掌握多元数据分析技术,是拥有生活感知、经济分析能力的高端人才就业岗位。

目前,数据分析师行业仍然处于发展的初期阶段,也就存在着发展初期必然有的一些问题。数据分析整体的发展区域集中在几个少数的一线城市,发展和就业机会相对还是比较有限的。数据孤岛仍然在很大程度上未被消除,需要政府和政策上进一步对此进行扶持和推动。数据分析全自动化流程尚未形成,半自动化的数据环境下,数据分析还是存在时间延迟和残缺等一系列的问题。 上述几个方面都需要政府相关部门、行业领军人物以及数据分析浪潮的每个参与者共同努力。

二、 数据分析师职业发展历程

数据分析师,是指在互联网、金融、电信、医疗、旅游、零售等多个行业专门从事数据的采集、清洗、处理、分析,能够利用统计数 据、定量分析和信息建模等技术制作业务报告、进行行业研究、评估和预测,从而为企业或所在部门提供商业决策的新型数据分析人才。

1. 国外数据分析行业发展历程

2015 年 2 月 ,美国白宫正式命名DJ Patil担任首席数据科学家和制定数据策略的副首席技术官。 DJ Patil曾在LinkedIn、 eBay、 PayPal、 Skype和风险投资公司Greylock Partners等诸多硅谷知名公司工作过,积累了丰富的经验,在上任之后将会扮演负责政府大数据应用开发专家的角色,尤其是针对奥巴马的医疗改革方案。美国政府正在用实际行动告诉全世界, 其已经意识到要充分利用其他们的数据。

IDC(互联网数据中心)预测,目前每年数据的生产量是8ZB,2020 年将达到40ZB。属于大数据的时代已经到来。

1

图 1. 全球数据年产量

数据生产量“ 拐点” 已至,将开始爆发式增长。我们正处在一个数据量爆发增长的时代,当今的信息产业呈现出前所未有的繁荣,新的互联网技术不断涌现,从传统互联网的PC终端,到移动互联网的智能手机,再到物联网传感器,技术革新使数据生产能力呈指数级提升。

在欧美日等发达国家,数据分析行业不仅仅在企业的运营管理中起到举足轻重的作用,也在政府的社会治理等方面发挥着重要作用。2012年的美国总统的大选中,奥巴马就利用数据分析武器,来了解不同选民的需求,设计并策划合理有效的“自我营销”亊件,最终在选举中击败劲敌罗姆尼赢得违任,此案已经传为“数据分析”致胜的佳话。

数据分析行业在发达国家,不仅仅在企业中有大量的从业人员,并且发展出很多具有规模的专业性服务机构。这些专业的服务机构有的来源于信息技术公司,如 IBM、惠普、微软;有的则来自数据库软件公司,如甲骨文;更有的来自传统行业如亚马逊、沃尔玛;当然也有一些新兴的专业咨询企业,在投资公司和私募基金的资金支持下,获得飞速的发展,如: Mu Sigma, TeraData 等。其中美国有近万家专门从事数据分析的服务公司,年营业额达到几千亿美元,英国有三千多家,日本有一千多家,瑞典也有五百多家有影响的数据分析服务公司。

从数据分析师职业来看,数据分析行业在国外从业人群众多。在美国,几乎所有大中型企业里都有专业的数据分析人才从事相关的数据分析工作,数量有数百万之多,日本有十五万多,瑞典也有十万多名数据分析专业技术人员。数据分析高端人才的需求这几年仍在迅速扩张和增加,数据分析人才的供应量远远赶不上需求量,缺口很大。

IDC(互联网数据中心)发布预测报告称,2017年大数据技术和服务市场将增至324 亿美元,实现 27%的年复合增长率。此外还预测基于大数据的决策解决方案将开始取代或影响知识工作者角色,这势必引发人才转型。

2. 国内数据分析师职业发展

数据分析行业在国外历史已久,伴随着互联网技术、信息技术、通信技术的发展,目前已经非常成熟,并远远领先国内的发展水平,据估计,这一差距至少要有5-10年。

自改革开放以来,随着国内经济的快速发展以及在各大行业与国际接轨的步伐不断扩大,国内的数据分析行业从 2003 年开始觉醒和渐热,如今已经过 12 年的发展。这期间数据科学相关职业从少到多、认证协会从无到有、数据分析挖掘工作从模糊到清晰。如今,中国的数据分析行业经过十多年的磨砺,正迎来辉煌灿烂的井喷式发展期。

2004 年至 2006 年是数据分析行业的起步阶段;从 2006 年到 2010 年,数据分析行业已经全面成型,相关的培养方案和课程体系进一步完善,全国性行业协会的申请工作正式开展。我国数据分析师人数从零起步,猛增至近万人。数据人才的分布领域也从最初的分析评估业和金融业,迅速扩展到会计师、投融资机构、政府审批和企业管理等众多领域,涉及的行业从银行保险等金融行业到分析服务业、制药业、石油和天燃气行业以及 IT 行业,数据分析师迅速成为国内炙手可热的职业之一。

2011 年,“云计算”的概念风靡世界,并开始在全国推广,国内一些大型互联网公司如阿里巴巴等建成了一大批以“云计算技术”和“云存储技术”为概念的“云计算中心”,并投资开发多个开发区。这为数据采集后的存储、处理、传输和分析提供了基础。数据分析师职业有了更加具体的应用方向。

自2012年开始,“大数据”一词横空出世,国外的一些行业领导者开始提出“大数据时代”的概念。“大数据”一开始就不止步于理论,它对大量和复杂数据的处理,在技术上提出了新的拓展思路和方向。随着互联网技术的提速、第四代移动互联网的广泛应用、社交媒体的移动化,各行各业在数据的内容、结构、复杂程度和数量方面都呈现出几何倍增的特征。很多企业的数据分析师对如何更好地利用海量数据为政府管理、企业运营等决策提供了科学的依据。这也为“数据分析师”这一职业的快速发展开拓了巨大的空间。 CSDN 的一项调查报告指出,国内的大数据应用目前多集中在互联网领域,并且有超过 56%的企业在筹备和发展大数据研究。未来5年,94%的公司都需要数据分析专业人才。

埃森哲一项分析报告曾指出,数据分析人才价值倍增的原因在于业务分析法已经从企业的辅助角色跃升至核心地位,并能够帮助企业制定许多重要的决策和流程。对处于这一发展趋势最前沿的互联网行业而言,分析法已经成为一项企业战略性能力。即便是在分析法仍处于起步阶段的电子和高科技等行业,分析人才也是企业未来高速发展的关键所在。在报告中,在所调查的包括分析服务业、银行业、石油天然气行业、通信技术行业等七大传统行业内,新增的数据分析就业机会在中国的发展速度仅次于美国,在2015年将增加30500人, 74%的新增数据分析专家工作将会出现在中国、印度和巴西;尽管美国提供供了最多的数据分析就业机会,但是,中国、印度和巴西的数据分析职业发展速度更快,并且只需要短短十年,中国和印度就将在这些行业中雇用近一半的数据分析人才。

2

图 2. 数据分析相关人才职位数调查预测

不难看出,美国提供了最多的数据分析相关人才就业机会,但是中国、印度和巴西的相关职位发展速度更快。

如今,我们已经进入了企业发展日新月异的“互联网+”时代—一个用数据说话的时代,也是一个依靠数据竞争的时代。目前在世界 500 强企业中,有 90%以上都建立了数据分析部门。 IBM、微软、 Google 等知名巨头公司都在积极投资数据业务、建立数据部门、培养数据分析团队。各国政府和越来越多的企业意识到数据和信息已经成为企业的智力资产和资源,数据的分析和处理能力正在成为企业日益倚重的技术手段。我国在互联网行业热钱涌动的又一波浪潮下,对数据分析方面人才的需求更加迫切,培养力度更是空前。

三、 数据分析师人才行业现状

1. 人才模型/岗位划分

在国内,大数据的应用才刚刚发芽,人才市场还不那么成熟。很多公司根据已有的资源和短板,招聘能和现在团队互补的人才。有的强调统计学知识,有的突出数据库操作,有的要求算法编程经验,有的则要求有咨询公司或者投资银行相关的经验,所以“职称”众多,诸如数据分析师、数据挖掘工程师、大数据分析师、数据工程师等。

针对 SAS、 Tableau、 钱方银通、民生银行、和堂科技、星图数据等公司 的调研,我们了解到:一些大的互联网、金融等公司,及专门的数据公司均设有数据部门,

部门拥有完整的数据采集、数据存储、数据分析挖掘、数据可视化等整套体系。而一般的企业多数只需要数据分析师,提供决策辅助和咨询。所以,繁多的“职称”背后,万变不离其宗的是数据相关职位的职能,按照职能我们可以分为四类,对应的专业和职责如表 1 所示:

职业 专业要求 岗位主要职责
[1].数据分析师 统计学,数学,计算机,信息管理 运用工具,提取、分析、呈现数据,实现数据的商业意义
[2].数据挖掘工程师 计算机,数学,统计学 机器学习,算法实现
[3].数据工程师 计算机,数学,统计学 开发运用简单数据工具,实现数据建模等功能,对业务有较好理解
[4].数据科学家 计算机,数学,统计学 高级算法设计与优化,数据相关系统设计与优化,对行业有较深的理解

表 1. 数据分析相关人才职位表

1.1 数据分析师相关职位:

首先,来看下数据分析师的情况。这个职位的主要技能是[1](数据分析) ,附带[2](数据挖掘) ,有少量的[3](运用已有工具建模) 的需求。因为企业对这个职位的要求是作为业务部门的参考与辅助,因此希望是多面手。“职位”包括数据分析专员 /分析师、数据运营主管等

数据分析师招聘要求样本如下:

样本一(美团网) :

招聘岗位:数据分析专员

工作经验: 1-3 年

月薪范围:¥6000-8000

学历要求:本科及以上

岗位职责:负责移动平台产品的日常数据统计、整理,为产品运营?供日常数据支持;负责移动平台产品数据分析,定期完成日、周、月、季报等数据报告工作;负责产品数据分析与数据挖掘的分析体系的构建;负责用户调研、及用户行为分析等数据商业价值挖掘工作;负责数据统计平台的维护、优化、升级

岗位要求:本科及以上学历,统计学、应用数学相关专业优先考虑;一年以上互联网数据分析经验(移动互联网优先);具备一定的文档能力,能够独立完成数据分析报告的撰写;具有一定的数据挖掘、数据建模能力,能够熟练使用统计工具软件者优先;熟练使用 Excel、 PPT 以及相关办公软件

样本二(京东金融):

招聘岗位:数据分析师

工作经验: 3-5 年

月薪范围:¥15000-30000

学历要求:本科及以上

岗位职责:分析与设计业务风险控制规则,建立风险识别、监控与预警机制;建立风险监测指标体系,对业务线进行日常监测与运营分析,提供运营分析报告;对可疑交易/账户进行预警分析与问题定位,提供有价值的结果,提高运营有效性;建设业务相关的数据库表,并能固化到指定的数据库中,提高查询效率;建立针对欺诈行为的风险管理策略,构建欺诈行为识别与侦测机制;将研究成果转化成风控规则并跟进落实,协调产品、研发、运营团队,推动风控规则与风险模型的实施。最终部署在控制决策系统中;其他工作,参与完成各类分析报告、报表等其他指定的工作

岗位要求:本科及以上学历,数学、统计、计量经济学、金融等相关专业优先; 3年以上相关工作岗位经验,具有支付机构、金融机构、风险管理相关经验者优先;能够熟练使用 Hive、 SQL、 R、 SAS、 SPSS 及其他数据查询统计软件者优先;曾经参与过完整的数据采集、整理、分析工作;具有一定的交易风险规则设计、风险模型开发经验;精通 Excel、 PPT、 WORD 等办公软件;具备较强的数据分析能力、逻辑思维能力、对内外组织沟通能力、执行能力和团队精神;有诚信、愿意分享和承担责任,勇于探索与坚持创新。

1.2 数据挖掘相关职位:

数据挖掘相关岗位更多的分布在一线城市互联网、 金融行业,合格的数据挖掘工程师通常需要有 3 年以上工作经验,主要技能为[2](数据挖掘) ,有少量的[3](运用已有工具建模) 。

相关招聘要求样本如下:

样本一(人人车):

招聘岗位:数据挖掘

工作经验: 1-3 年

月薪范围:¥15000-30000

学历要求:本科及以上

岗位职责:负责人人车数据挖掘的算法改进及策略研发;通过数据挖掘、机器学习等方法,深刻理解数据本质,进行核心策略的研究及开发;参与和负责数据仓库基础设施和平台的搭建、开发及维护工作;优化数据存储和计算平台,确保数据平台的可靠运行

岗位要求:具有较强分析问题和解决问题能力、良好的团队合作意识、沟通能力;熟练掌握数据挖掘、机器学习相关算法及工具;熟练使用 Linux 系统,具有非常扎实的数据结构和算法基础,至少会写一门脚本语言;有文本分析、自然语言处理或者大数据分析工作经验优先

样本二(百度):

招聘岗位:数据挖掘

工作经验: 3-5 年

月薪范围:¥20000-40000

学历要求:硕士及以上

岗位职责:针对百度知识系产品,开展数据挖掘、文本分析、用户行为建模等工作;深化用户与内容分类,属性挖掘以及体系建设;整体?高产品的用户体验;跟进业界相关技术进展并进行策略技术到产品的落地

岗位要求:计算机或相关专业硕士以上学历;良好的逻辑思维能力,能够从海量数据中发现有价值的规律;良好的团队合作精神,敢于接受挑战;精通C\C++,PHP,PYTHON 等至少一门常用语言,对数据结构和算法设计有较为深刻的理解;熟悉大规模数据挖掘、机器学习、自然语言处理、分布式计算等相关技术,并具备实际工作经验;具有互联网公司内容挖掘、推荐、检索相关工作经验者优先

1.3 数据工程师相关职位:

数据工程师的相关职位名称相对较多一些。但是总结起来,都是在已有平台和工具的基础上实现开发和运用。大部分我们见到的“数据**师”其实都归属此类。技能要求为[3](运用已有工具建模) ,其次是[1](数据分析) 和[2](数据挖掘) 。以最常见的职称——数据工程师为例。

相关招聘要求样本如下:

样本一(广发证券):

招聘岗位:数据开发工程师

工作经验: 3-5 年

1月薪范围:¥20000-30000

学历要求:本科及以上

岗位职责:对公司的基础数据层进行规划、梳理、优化与扩展性开发,范围涵盖所有业务数据;公司内外数据的汇集开发、基础数据层的持续开发与完善;各类业务项目的数据支撑开发、各类数据集市的开发。

岗位要求:计算机、应用数学、数据科学等相关专业;有大型数据仓库的规划/开发/分析经验,熟悉金融数据体系架构,有丰富的数据建模实践经验;技术上精通关系数据理论、深刻掌握 SQL 及相关技术,对企业数据模型有深刻的认知和理解;至少掌握: Java、 Python、 Perl 等一门编程语言;能够积极创新, 乐于面对挑战, 勇于承担工作压力;优秀的团队合作精神;诚实, 勤奋, 严谨,敬业。

样本二(人人车):

招聘岗位:数据开发工程师

工作经验: 5-10 年

月薪范围:¥20000-30000

学历要求:本科及以上

岗位职责:负责业务数据分析和数据模型设计,设计实现关系型数据库、数据仓库、实时数据库、内存数据库、分布式数据库和分布式文件系统等存储方案,构造最优的数据库模式,负责设计、评估及审核,主导开发和实施;与业务方沟通,用数据支持业务,改善运营

岗位要求:超过 5 年以上的数据模型分析设计、数据仓库建设和数据集成经验;熟悉大型互联网产品的架构,对大数据量的互联网产品有丰富经验,熟悉大规模数据处理的机制和框架;强 coding 能力;强工程实践经验;熟悉 MySQL 等关系数据库。

1.4 数据科学家相关职位:

最后我们来看看数据科学家,这是整个数据产业上的顶端职位。这个职位,要求是[4] (软件工程技能在多数统计学家之上;高级算法设计与优化;数据相关系统设计与优化;需要有垂直行业经验) 。既要懂行业,又要技术资历(最少 3 年,一般 5-10年),该职位相对上述三种职位来说需求量相对较小,但是空缺量巨大。

企业的招聘要求样本如下:

样本一(某知名电商):

招聘岗位:数据科学家

工作经验: 5 年以上

年薪范围:¥500000-700000

学历要求:博士

岗位职责: 规划和管理全公司数据使用,指导数据工程师构建数据仓库、分析流程和应用。基于分布式计算系统,处理和分析 PB 级别移动互联网数据; 应用统计建模和机器学习方法建立模型解决实际问题; 与业务部门沟通合作,将数据模型应用于实际业务; 支持数据的对外发布和合作

岗位要求: 2 年以上数据相关工作经验 ; 热爱数据工作,相信数据的价值; 扎实的计算机和数学背景,有机器学习基础优先; 具有较好的商业敏感度,深入理解数据处理过程和业务场景; 熟练掌握至少一门编程语言,具备分布式计算系统( Hadoop/Spark)开发经验 ; 擅长与商业伙伴的交流沟通,具有优秀的跨部门协调和沟通能力; 优秀的合作精神和团队管理能力

样本二(某大型互联网金融公司):

招聘岗位:数据科学家

工作经验: 5 年以上

年薪范围:¥600000-900000

学历要求:硕士及以上

岗位职责: 根据具体业务和产品对数据模型进行统一分析和规划; 深入理解产品业务的方向和战略,通过数据分析、 挖掘,为产品和运营?供决策支持; 应用统计建模和机器学习方法建立模型解决实际问题; 与业务部门沟通合作,将数据模型应用于实际业务; 指导数据工程师、分析流程和应用

岗位要求: 研究生以上学历; 扎实的计算机和机器学习背景; 熟练掌握 Python或 Java 等语言; 具有商业敏感度; 深入理解数据处理过程和业务场景; 5 年以上工作经验

综上所述,数据相关的职位,指向的是数据采集、数据分析、数据挖掘、数据结构四大技能,即使初级职位,要求也是一专多能。高级职位则要求每个模块都有理解,对统计、编程、行业理解都要求很高。对分布式系统原理有较深的理解,理解数据库相关理论及操作;有数据分析和挖掘经验者优先,有在互联网公司或海量数据处理工作经验,有系统开发经验者优先。

2. 国内数据分析师人才薪资水平

2.1 不同岗位薪资水平比较

从上面的人才结构中,我们大体可以看出数据科学相关人才的薪资待遇平均水平对于其他行来说是较高的。下面我们根据过去几年的统计观察, 得到不同岗位的薪资水平, 如下:

3

图 3. 不同岗位薪资

上图显示,在全国范围内 ,数据分析师的平均薪资大约为8100元,数据挖掘工程师的平均薪资为13900元,数据工程师的平均薪资为13700元,而数据科学家的平均薪资为42000元。

智联招聘在 2015 年春季发布的《2015 年春季中国雇主需求与白领人才供给报告》中列出了2015年春季求职期十大高薪职业, 其中前三名分别是高级管理、 IT管理/项目协调、证券/期货/投资管理/服务,对应薪资分别为13555元、 9450元、 8085元。由此可见,数据分析师岗位的平均薪资排在十大高薪职位里面的上游水平。未来10年,互联网将在中国 GDP 增长总量中贡献 7%到 22%,而移动设备、云计算、自带设备办公、 SNS、大数据将推动整个行业。大数据分析和预测技术人才备受追捧,云计算、可穿戴设备领域人才需求变热。不仅仅是薪水, 互联网企业员工持股计划提速,更多企业强化长期激励及个性化的福利,而传统 IT 领域相对式微。

与此同时, 薪资水平随时间的变化如下图:

4

图 4. 数据相关岗位薪资变化

可以看出, 近几年数据相关岗位平均薪资的变化。不难看出,2012 年之前,数据相关岗位平均薪资较低,在 6800-8500 之间, 而且每年增长幅度不大。2012年,维克托迈尔舍恩伯的书籍《大数据时代》一书的出版, 标志大数据时代的到来,大数据的概念也是从2012年开始火热起来, 更多企业开始意识到数据分析对于企业决策的重要性, 企业对于相关人才需求增加,相应的薪资待遇也逐年增加, 且增加幅度相对之前几年较高。

2.2 薪资水平的不同维度比较

2.2.1 薪资水平与工作经验的关系

O’Reilly Media 公司在报告《2014 Data Science Salary Survey》 中指处,根据他们的模型预测,数据相关职位每积累一年的工作经验,年薪将会增加1400美元左右;对于数据分析师和数据工程师而言, 即使没有技术等方面的改变,该模型预计他们每年的工资也会增加 2500 美元左右。

在国内 ,数据相关职位薪资亦会随工作年限的关系,如下图:

5

图 5. 数据相关职位月薪与工作经验关系

数据相关职位会随着工作年限的增加而增加,而且工作经验越丰富,在进入下一阶段时的薪资涨幅越大。数据分析专员 一般要求1-3年工作经验,数据分析师、 数据挖掘工程师及数据工程师一般要求3年以上工作经验,而数据科学家则要求5年以上经验。

2.2.2 不同应用工具的价值体现

事实上,不止现在数据工程师需求缺口严重,根据国外的情况,未来这块仍有很大缺口 。美国人才招聘市场的数据分析领先者 Wanted Analytics 最近的报告指出,过去几年大数据相关工作岗位上需求增长最快的三项技能分别是:Python, Linux 和SQL。

反观国内 ,根据我们做过的一项调查了解到,在数据科学相关工具(包括但不限于: 统计学软件、编程语言、 BI 商业应用、 数据库、大数据平台、可视化软件、 操作系统)中,使用率最高的 10 种工具是 Windows、 SQL、 Excel、 SPSS、 SAS、 Python、 R、Linux、 Java、 Hadoop。

然而,薪资最高的 5 种工具中, 有四种是大数据相关平台,分别是 Hbase、 Spark、Pig、 Hadoop,这四种平台使用者的平均月薪在 13500 元以上; 我们分析,大数据从业者作为数据科学领域的前沿实践者, 在数据科学领域拥有较强的知识基础、经验与能力,通过不断的学习来?高自己的技术水平,走在领域的前沿,所以相应的也会获得一份较高的薪水;而 R 软件由于经常用于数据挖掘工作, 所以所对应的使用者的平均薪资也是较高,平均在 10000 元以上。

6

图 6. 从业者薪资与使用工具的关系

3. 国内数据分析师人才分布

易观智库在针对大数据市场行业的一项研究报告显示,2014年中国大数据市场行业投资结构中,金融、通信、零售为前三大行业,投资占比分别为 16.0%、 15.6%和 13.9%。

政府、医疗、旅游投资比例分别为 12.7%、 9.0%和 4.1%。六大行业占比 71.3%。其他行业包括教育、制造、能源、媒体、互联网等,累计占比 28.7%。

7

图 7.2014 年中国大数据市场行业应收结构

不过,数据科学相关工作岗位集中分布在金融、互联网、通信三大行业,三大行业提供了近 60%的岗位。尤其是金融和互联网行业, 前者银行、互联网金融类公司对于数据科学相关岗位的需求最多;而后者则由于积累了大量数据,更多价值信息等待挖掘,所以对于数据科学相关人才有很大的需求,对应的人才分布相对较多。

在已统计的数据相关企业中,北京、上海、广东( 主要是深圳) 和浙江( 主要是杭州) 的占比达 92%,其中北京处于遥遥领先的地位,全国占比接近 60%;在北京的大数据企业或产品中,海淀区又占有绝对的优势地位,占北京大数据企业的 63%,在全国来看占比在三分之一左右。

8

图 8. 大数据企业地区分布

包括百度、阿里巴巴、腾讯在内的很多互联网公司及数据相关企业分布在北京、上海、 深圳、 杭州等地, 在很大层面上决定这些省份城市的数据相关人才分布较为集中。

4. 国内数据分析师人才需求

埃森哲的之前的一份报告预测, 2010 年至 2015 年,在发展中国家,分析类专业服务和制药业将创造出最多的数据科学相关就业机会。而在发达经济体中,保险和银行业提供最多的数据科学相关职位。

9

图 9.2010-2015 年新增数据科学相关就业机会在调查所覆盖各国的分布情况

(注: 黄色的单元格代表了 每个国家新增数据科学相关职位占比最高的行业)

目前看来,在未来五年,互联网、金融及医疗行业将会创造大多数的数据科学相关职位。互联网行业将积累大量的数据,传统金融行业转型面临巨大的数据科学相关职位的缺口;对于医疗行业来说“ 3521 工程”,即建设国家级、省级和地市级三级卫生信息平台,加强公共卫生、医疗服务、新农合、基本药物制度、综合管理 5 项业务应用,建设健康档案和电子病历 2 个基础数据库和 1 个专用网络建设,当前全国有数十个个省份在搭建省级的信息化平台、 100 多个城市在不同程度上搭建市级平台,以及区域医疗建设和医联体等,都会积累大量的数据,而且未来利用大数据解决医疗问题是面临的急需解决的问题。

根据对阿里巴巴、星图数据、钱方银通、和堂金融等公司的访谈及调研,并根据这些数据做出的预测显示,到 2018 年,数据分析师的职位空缺将达到近40000人,而且各行各业均会对数据科学相关岗位产生很大的需求。

四、 数据分析师人才职业规划

1. 目前人才职业现状

目前国内企业招聘的数据分析师这一职业所要求的所有技能,包括统计知识、软件应用( SPSS/SAS/R 等)、数据挖掘、数据库、报告撰写、项目经验等。一名合格的数据分析师需要胜任企业不同层次的数据分析工作。

1.1 数据分析师职业发展方向

概括来说,数据分析师的发展方向主要有三个:政府机关、企业以及各类研究机构。

方向一:政府机关

主要有两类,第一类是计委、经委、国家及地方统计局等一些经济综合管理部门所设置的调研处和研究处。统计部门还分别成立了城市调查组与农村调查组,经常开展社会和市场调研工作,为政府的决策?供支持。第二类是商业、粮食、物资、银行等经济主管业务部门设置的信息中心或调研室,从本系统、本部门的业务出发进行专业性调研,提供支持本部门的市场信息。

方向二:企业

目前在通信、互联网、金融、 零售、旅游等这些行业每天都会产生巨大的数据量(长期更是积累了大量丰富的数据,比如客户交易数据等等)。据预测到 2020 年,全球每年产生的数据量将达到 3500 万亿 GB。随着软件工具、数据库技术、各种硬件设备的飞快发展,使得我们分析海量数据成为可能。而数据分析也越来越受到企业领导层的重视,借助报表告诉用户什么已经发生了,借助可视化工具等分析工具告诉用户为什么发生了,通过监控告诉用户现在在发生什么,通过预报告诉用户什么可能会发生。数据分析会从海量数据中?取、挖掘对业务发展有价值的、潜在的知识,找出趋势,为决策层的?供有力依据,为产品或服务发展方向起到积极作用,有力推动企业内部的科学化、信息化管理。很多大的企业像百度、 腾讯、联想、宝洁等都会有专门的数据分析职位。这些职位按分析层级分,有数据调查员、数据分析助理、数据分析专员、项目经理、研究主管、研究经理、研究总监等;按分析内容分,有投资分析、战略分析、媒介分析、信用分析、网站流量分析、财务分析、客户分析等。

方向三:研究机构

第三种方向是去专门的研究机构,比如市场研究公司、咨询公司、证券公司、投资公司、广告公司、研究院等等。

这些研究机构基本是专门以数据分析为业务,比较重视员工的专业素养的提高,往往会给员工提供参与项目和参加培训的机会。通过项目和培训,会高强度地强化从业者的能力,使对方能够在 2~3 年的时间里就掌握数据分析的基本流程、方法模型和工具操作, 比较知名的公司有埃森哲、毕马威、德勤等。

1.2 数据分析师职业生涯发展

1) 数据分析师职位体系:

10

图 10. 数据分析职位体系

2) 数据分析师职位层级:

层级 1:助理数据分析师

业务分析能力:

● 在一定的指导下准确识别问题

● 在一定的指导下完成分析规划

● 提取简单数据、了解分析方法

● 能够形成报告并传递分析结果

● 完成业务需求并?出建议

● 合理分配和安排,完成分析任务

分析方法要求:

● 数据预处理、检验和清洗

● 各种常用统计检验方法

● 描述述性统计分析

● 对比分析

● 简单的多元统计分析方法

● 数据库知识

层级 2:数据分析师

业务分析能力:

● 能够独立清晰地识别问题

● 明确范围并做好分析规划

● 熟练提取数据并应用分析方法

● 展现演示时条理清晰、逻辑清楚、表达明确

● 能够提出建议并推动建议被采纳

● 作为核心成员控制项目进度和质量

● 推动建议被采纳,跨团队沟通协调

分析方法要求:

● 除助理分析师要求掌握的分析方法之外,还需熟练掌握及应用结构分析、趋势分析、关联分析等

层级 3:资深数据分析师

业务分析能力:

● 发现问题并转化为分析目标

● 提炼问题并做好分析规划

● 熟练提取数据、指导员工分析数据

● 做演示时结论突出清晰,能够指导员工

● 能够提出有效建议,并且独立主动

● 能够领导跨部门项目、寻求资源

● 具备一定影响力和判断力

分析方法要求:

● 与数据分析师相比增加数据挖掘模型这一分析方法,例如:回归、聚类、因子分析、神经网络、时间序列、关联规则、决策树、 支持向量机等

层级 4:数据分析专家

业务分析能力:

● 识别问题并推动解决问题

● 提炼问题并做好分析规划

● 熟练推取数据并指导员工分析

● 做演示时结论突出清晰,能够指导员工

● 能够提出有效建议,并且独立主动

● 能够完成影响力大的复杂项目

● 具备较强的影响力和判断力

分析方法要求:

● 与资深数据分析师相同

层级 5:高级数据分析专家

业务分析能力:

● 思考数据的价值并规划推进

● 提炼问题并做好分析规划

● 熟练提取数据、指导员工分析

● 做演示时结论突出清晰,能够指导员工

● 能够提出有效建议,并且独立主动

● 能够独立主动完成影响大的复杂项目

● 在公司层面具有影响力

分析方法要求:

● 与资深数据分析师相同

层级 6:资深数据分析专家

业务能力要求:

● 提出对业务发展的前瞻性建议

● 提炼问题并做好分析规划

● 熟练提取数据、指导员工分析

● 做演示时结论突出清晰,能够指导员工

● 能够提出有效建议,并且独立主动

● 能够独立主动完成影响大的复杂项目

● 在专业领域有一定的影响力

分析方法要求:

● 与资深数据分析师相同

3) 数据分析师的级别:

① 数据跟踪员:机械拷贝看到的数据,处理数据较少

虽然这个工作的人还不能称作数据分析师,但是往往作这样工作的人还都自称是数据分析师,这样的人,只能通过企业应用的数据系统看到有限的数据,并且很少去处理数据,甚至不理解数据的由来和含义,只是机械地把自己看到的数据拷贝出来,转发给相应的人。这类人发出来的数据,是否有意义,怎么解读,他自己并不清楚。

② 数据查询员 /处理员:数据处理没问题,但缺乏数据解读能力

这些人可以称为分析师了,他们已经对数据有一定的理解了,对于大部分数据,他们也知道数据的定义,并且可以通过监控系统或者原始的数据,处理得到所需数据。他们精通统计学方法,对统计学的工具用起来也得心应手,能够胜任因子分析和聚类等问题,在各类检验的操作上可称炉火纯青。他们的不足在于:如果不告诉他们命题,那么他们就不知道该应用什么样的方法去得到结论。虽然对于数据的处理没问题,却没有很好的数据解读能力,只能在统计学的角度上解释数据。

③ 数据分析师:解读数据,定位问题?出答案

数据分析师这群人,对于数据的处理已经不是问题,他们的重点则转化到如何去解读数据。同样的数据,在不同人的眼中有不一致的内容。好的数据分析师,是能通过数据找到问题,准确地定位问题,同时准确地找到问题产生的原因,为下一步的改进找到机会点的人。往往科班出身的人,欠缺的不是在处理数据上,而是在解读数据上。至于将数据和产品结合到一起,则是其更缺少的能力了。

④ 数据应用师:将数据还原到产品中,为产品所用

“数据应用”这个词很少被?到。但是应用数据被?及的次数很多。分析大量数据之后,除了能找到问题以外,还有很多数据可以还原到产品中,为产品所用。典型的是在电子商务的网站中,用户的购买数据,查看数据和操作的记录,往往是为其推荐新商品的好起点,而数据应用师就是要通过自己的分析,给相应的产品人员一个应该推荐什么产品,购买的可能性会最大的一个结论。国内能做到这个级别的数据人员目前人数尚少,而真正意义上的能数据应用师,可以用数据让一个产品变得更加地简单高效。

⑤ 数据规划师:走在产品前面,让数据有新的价值方向

数据规划师在业务水平上不一定比数据应用师高很多,但却是另外一个让数据有价值的方向。因为在实际的应用中,数据往往是有其生命周期的,用来分析和应用的数据也是,这一点在互联网公司表现得尤为明显。一个 APP 版本的更新,可能导致之前的所有数据都在一定程度上失效。数据规划师能够在一个产品设计之前就已经分析到这个产品应该记录什么样的数据,这些数据能跟踪什么问题,哪些记录到的数据可以应用到 APP 中去,以及这些应用可以对产品产生什么样的价值。

2. 数据分析人才学习路径

2.1 大数据方向学习路径

1) 基础课程

● 大数据的 Java 基础

● 大数据的 Linux 基础

● 大数据的网络基础

● Python 网络程序开发

● 大数据的统计学基础

● 大数据的矩阵计算基础

● Scala 语言入门

● 大数据的 C++基础

● 深入 JVM 内核——原理、诊断与优化

● 深入理解 Linux 内核

2) 大数据平台架构方向

● 搜索引擎构建与爬虫技术

● 高并发大数据平台架构设计

3) Hadoop 方向

● Hadoop 数据分析平台

● Hadoop 应用开发实战案例

● Mahout 机器学习平台

● Hadoop 源代码导读

● Hive 数据仓库实践

4) Spark 方向

● Spark 大数据平台

● MLLIB 机器学习平台

5) NoSQL 方向

● 数据库引擎开发

● HBase 架构、管理与应用

● MongoDB 架构、管理与应用

● Neo4J 图数据库应用实践

● Redis 实战

● Nodejs+MongoDB 快速开发实战

6) 虚拟化方向

● Openstack 云系统

● Cloudstack 云系统

● 云桌面实战

7) 高性能计算方向

● CUDA 从入门到精通

● MPI 并行计算框架

8) 流数据实时分析方向

● Storm 数据实时分析平台

2.2 数据挖掘方向

数据挖掘的含义:

数据挖掘(Data Mining) 就是从大量数据中发现潜在规律、提取有用信息的方法和技术。因为与数据库密切相关,又称为数据库知识发现(Knowledge Discovery in Databases, KDD) ,就是将高级智能计算技术应用于大量数据中,让计算机在有人或无人指导的情况下从海量数据中发现潜在的,有用的模式(也叫知识)。

广义上说,任何从数据库中挖掘信息的过程都叫做数据挖掘。从这点看来,数据挖掘就是 BI(商业智能)。但从技术术语上说,数据挖掘(Data Mining) 特指的是:源数据经过清洗和转换等成为适合于挖掘的数据集。数据挖掘在这种具有固定形式的数据集上完成知识的?炼,最后以合适的知识模式用于进一步分析决策工作。从这种狭义的观点上,我们可以定义:数据挖掘是从特定形式的数据集中提炼知识的过程。

数据挖掘往往针对特定的数据、特定的问题,选择一种或者多种挖掘算法,找到数据下面隐藏的规律,这些规律往往被用来预测或支持决策。

数据挖掘的主要功能

1) 分类:按照分析对象的属性、特征,建立不同的组类来?述事物。例如:银行部门根据以前的数据将客户分成了不同的类别,现在就可以根据这些来区分新申请贷款的客户,以采取相应的贷款方案。

2) 聚类:识别出分析对内在的规则,按照这些规则把对象分成若干类。例如:将保险申请人区分为高度风险申请者,中度风险申请者,低度风险申请者。

3) 关联规则和序列模式的发现:关联是某种事物发生时其他事物随之发生的这样一种联系。例如:每天购买啤酒的人也有可能购买香烟,比重有多大,可以通过关联的支持度和可信度来?述。与关联不同,序列是一种纵向的联系。例如:今天银行调整利率,明天股市的变化。

4) 预测:把握分析对象发展的规律,对未来的趋势做出预见。例如:对未来经济发展增速的判断。

5) 偏差的检测:对分析对象的少数的、极端的、特例的?述,以揭示其内在的原因。例如:在银行的 100 万笔交易中有 500 例欺诈行为,银行为了稳健经营,就要找出这 500 例欺诈行为的内在因素,减小以后的经营风险。

需要注意的是:数据挖掘的各项功能不是独立存在的,它们在数据挖掘中互相联系,共同发挥作用。

数据挖掘的方法及工具 :

作为一门处理数据的新兴技术,数据挖掘有许多的新特征。首先,数据挖掘面对的是海量的数据,这也是数据挖掘产生的原因。其次,数据可能是不完全的、有噪声的、随机的,或者有复杂的数据结构、维数大。最后,数据挖掘是许多学科的交叉运用,它综合了统计学、计算机科学、数学等学科的技术。以下是常见和应用最广泛的算法和模型:

1) 传统统计方法:

① 抽样技术:通常在数据挖掘的过程中我们面对的是大量的数据,对所有的数据进行分析是不可能的也是没有必要的,因此需要在理论的指导下进行合理的抽样。

② 多元统计分析:如因子分析、聚类分析等。

③ 统计预测方法:如回归分析、时间序列分析等。

2) 可视化技术:用图表等方式把数据特征用直观地表述出来,如直方图等,这其中会运用许多?述统计的方法。可视化技术面对的一个难题是高维数据的可视化。

数据挖掘的具体流程

第一步:数据准备:( 70%时间)

● 获取数据(爬虫,数据仓库)

● 验证数据

● 数据清理(缺失值、孤立点、垃圾信息、规范化、重复记录、特殊值、合并数据集)

● 使用 python 进行文件读取 csv 或 txt 便于操作数据文件( I/O 和文件串的处理,逗号分隔)

● 抽样(大数据时。关键是随机)

● 存储和归档

第二步:数据观察(发现规律和隐藏的关联)

● 单一变量:点图、抖动图;直方图、核密度估计;累计分布函数

● 两个变量:散点图、 LOESS 平滑、残差分析、对数图、倾斜

● 多个变量:假色图、马赛克图、平行左边图

第三步:数据建模

● 推算和估算(均衡可行性和成本消耗)

● 缩放参数模型(缩放维度优化问题)

● 建立概率模型(二项、高斯、幂律、几何、泊松分布与已知模型对比)

第四步:数据挖掘

● 选择合适的机器学习算法(蒙特卡洛模拟,相似度计算,主成分分析)

● 大数据考虑用 Map/Reduce

● 得出结论,绘制最后图表

数据挖掘方向职业能力要求

1) 基本能力要求

数据挖掘人员需具备以下基本条件,才可以完成数据挖掘项目中的相关任务:

① 专业技能

● 硕士以上学历,数据挖掘、统计学、数据库相关专业,熟练掌握关系数据库技术,具有数据库系统开发经验

● 熟练掌握常用的数据挖掘算法

● 具备数理统计理论基础,并熟悉常用的统计工具软件

② 行业知识

● 具有相关的行业知识,或者能够很快熟悉相关的行业知识

③ 合作精神

● 具有良好的团队合作精神,能够主动和项目中其他成员紧密合作

④ 客户关系能力

● 具有良好的客户沟通能力,能够明确阐述数据挖掘项目的重点和难点,善于调整客户对数据挖掘的误解和过高期望

● 具有良好的知识转移能力,能够尽快地让模型维护人员了解并掌握数据挖掘方法论及建模实施能力

2) 进阶能力要求

数据挖掘人员具备如下条件,可以?高数据挖掘项目的实施效率,缩短项目周期:

● 具有数据仓库项目实施经验,熟悉数据仓库技术及方法论

● 熟练掌握 SQL 语言,包括复杂查询、性能调优

● 熟练掌握 ETL 开发工具和技术

● 熟练掌握 Microsoft Office 软件,包括 Excel 和 PowerPoint 中的各种统计图形技术

● 善于将挖掘结果和客户的业务管理相结合,根据数据挖掘的成果向客户提供有价值的可行性操作方案

数据挖掘方向应用及就业领域:

当前数据挖掘的应用主要集中在电信(客户分析)、零售(销售预测)、农业(行业数据预测)、网络日志(网页定制)、银行(客户欺诈)、电力(客户呼叫)、生物(基因检测)、天体(星体分类)、石油化工、医药健康等行业领域。目前它能为企业解决的典型问题主要是:数据库营销 (Database Marketing) 、客户群体划分(Customer Segmentation & Classification) 、背景分析(Profile Analysis) 、交叉销售(Cross-selling) 等市场分析行为,以及客户流失性分析(Churn Analysis) 、客户信用记分(Credit Scoring) 、欺诈发现(Fraud Detection) 等等。数据挖掘已经在许多领域得到了成功的应用。例如,当你访问著名的亚马逊网上书店(www.amazon.com) 时,会发现当你选中一本书后,会出现相关的推荐书目“买了这本书的顾客也购买了其他的书” (Customers who bought this book also bought) ,这背后就是数据挖掘技术在发挥作用。

数据挖掘的对象是某一专业领域中积累的数据,其挖掘过程是一个人机交互、多次反复的过程,挖掘的结果要应用于该专业。因此数据挖掘的整个过程都离不开应用领域的专业知识。“ Business First, technique second”是数据挖掘的特点。因此学习数据挖掘不意味着丢弃原有专业知识和经验。相反,有其它行业背景是从事数据挖掘的一大优势。如有销售、财务、机械、制造、客户中心(call center) 等领域的工作经验,通过学习数据挖掘,可以提升个人职业层次,在不改变原行业的情况下,个人的职业发展可以从原来的事务型角色向分析型角色转变。从上世纪 90 年代末的初露头角到近十几年的广泛应用,以数据挖掘为核心的商业智能(BI) 已经成为 IT 行业及其它传统行业中的一个新宠。

2.3 业务决策方向

1) 数据为王,业务是核心

● 了解整个产业链的结构

● 制定业务的发展规划

● 确定用以衡量的核心指标

无论在哪个行业里,巨量的数据必须和业务分析相结合才能为企业带来收益。在应用数据分析进行业务决策时,首先需要摸清楚所在企业产业链的完整结构,以期对行业的上游及下游的经营情况有一个大致了解。然后根据当前的业务需要,制定处发展计划,再由此归类得出需要整理的数据。最后在进行业务分析时需要详细地列出数据核心指标(KPI) ,并且对几个核心指标进行更细致的拆解,同时要具体结合相应的业务属性来处理,从而找出那些对指标影响幅度较大的影响因子。另外,前期的资料收集工作以及业务现状的全面掌握也非常关键。

2) 思考指标现状,发现多维规律

● 熟悉产品框架,全面定义每个指标的运营现状

● 对比同行业指标,挖掘隐藏的提升空间

● 拆解关键指标,合理设置运营方法来观察效果

● 针对核心用户,单独进行产品用研与需求挖掘

在进行业务分析时,发现规律不一定需要很高深的编程方法,或者复杂的统计公式,更重要的是培养一种感觉和意识。不能用个人感觉去揣测用户的感觉,因为每个人的教育背景、生活环境都不一样。很多数据元素之间的关系没有明显的显示,需要运用直觉与观察,最终以数据可视化技术来呈现。

3) 规律验证,经验总结

在进行模型分析时,发现了某些规律之后不能立刻上线,需要在测试机上对模型进行验证。与此同时,数学建模能力对培养数感以及最后的业务决策也有一定的帮助。

3. 总结

数据科学相关人才不再局限于理工背景,一个完备的数据科学相关人才需要具备多领域的知识和经验, 包括一些跟数学相关的知识, 接下来是跟统计相关的,然后是跟编程相关的。 作分析的时候会用很多工具,这些工具都有一个基本的假设,当数据量大到一个程度,可以通过编程的方式来对数据进行处理, 当然处理完以后,接下来这个工作可以交给工具来做。但是有时候工具有一些局限性,这时候我们要看跟编程相关的能力, 所以如果不是计算机专业出身,也有必须学一下编程,将来才不会在某些领域知识感觉到困难。

另外, 大量套用工具和套用现成的软件,当发现有些问题是当今工具没有办法解决的时候, 懂得原始的算法显得尤为重要,它的基本原理是什么,为什么它没有办法解决这个问题, ……, 数据科学相关工作者可以改变原来的想法,想出一个新的办法,甚至设计新的算法。数据科学从业者经常在考虑如何解决目前工具没有办法解决的问题, 所以要有比较强的背景,因为没有一个算法是完美的。

还有, 数据科学相关人才需要具备文字勘探的技能, 大数据时代面对海量数据,数据可视化显得很重要。 工作中经常遇到的问题是常常产生一大堆报表,但是视觉化其实可以做的更好, 我们可以用一张报表去取代多张报表,这样会使工作效率和工作产出率大大提高。

五、 CDA 数据分析师培训及认证

经管之家(原人大经济论坛, 详见附录 1. )“数据分析培训中心”自 2006 年成立以来,致力于开展统计软件、数据分析和数据挖掘的培训与咨询服务,目前已有专家、讲师团队 100 多位,拥有自主版权的视频课程 100 多门,每年开设现场培训班 40余场,建立了完备的数据分析培训课程体系,每年培训学员 3000 多人。服务过的企业包括中国电子商务中心、招商银行、中国人民银行、中国邮政储蓄、中信银行、中国联通、中国移动、中国电信、艾瑞咨询、东芝医疗系统(中国)有限公司、携程旅行网、中国证券金融公司、北京铁路局代收款清算中心、南京梅钢等机构。这对国内数据分析师人才的培养和贡献毋庸置疑。

1. 考试简介

2013 年 7 月,经管之家(原人大经济论坛)联合大陆、台湾、美国等地学者、企业专家,在美国特拉华州推动成立“ CDA 注册数据分析师协会”,致力于行业研究和探讨数据分析人才培养标准,以满足企业对数据分析人才日益增长的需求,促进数据分析行业的高质量持续快速发展。 CDA 数据分析师等级标准来源于 CDA 协会成员长年从事数据分析教育与工作的经验和实践,对数据分析行业的研究,对数据分析教育的不断完善开发,从而总结出来的一套专业化,科学化,规范化,系统化的标准来认证什么样的人才是合格的 CDA 数据分析师。 CDA 数据分析师证书在国内需通过经管之家( 原人大经济论坛)举办的 CDA 等级认证考试后获得。此证书可作为企业事业单位选拔和聘用专业人才的任职参考依据。

1.1 CDA 等级认证考试

CDA Level Ⅰ: 业务数据分析师。专指政府、金融、电信、零售等行业前端业务人员;从事市场、管理、财务、供应、咨询等职位业务人员;非统计、计算机专业背景零基础入行和转行就业人员。 CDA Level Ⅰ业务数据分析师需要掌握概率论和统计理论基础,能够熟练运用 Excel、 SPSS、 SAS 等一门专业分析软件,有良好的商业理解能力,能够根据业务问题指标利用常用数据分析方法进行数据的处理与分析,并得出逻辑清晰的业务报告。

CDA Level Ⅱ: 建模分析师。两年以上数据分析岗位工作经验,或通过CDA Level Ⅰ认证半年以上。专指政府、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与数据挖掘的人员。在 Level Ⅰ的基础上更要求掌握多元统计、时间序列、数据挖掘等理论知识,掌握高级数据分析方法与数据挖掘算法,能够熟练运用 SPSS、 SAS、 Matlab、 R 等至少一门专业分析软件,熟悉适用 SQL 访问企业数据库,结合业务,能从海量数据?取相关信息,从不同维度进行建模分析,形成逻辑严密能够体现整体数据挖掘流程化的数据分析报告。

CDA Level Ⅱ: 大数据分析师。 两年以上数据分析岗位工作经验,或通过CDA Level Ⅰ认证半年以上。专指政府、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与云端大数据的人员。在 Level Ⅰ的基础上要求掌握 JAVA语言和 linux 操作系统知识,能够掌握运用 Hadoop、 Spark、 Storm 等至少一门专业大数据分析软件,从海量数据中提取相关信息,并能够结合 R、 python 等软件,形成严密的数据分析报告。

CDA Level Ⅲ: 数据分析专家。五年以上数据分析岗位工作经验,或通过二级认证半年以上。专指从事各行业、企业整体数据资产的整合、管理的专业人员,面向用户数据创造不同的产品与决策,一般指首席分析师( CA)。数据分析专家需要掌握CDA Level Ⅱ的所有理论及技术要求,还应了解计算机技术,软件开发技术,大数据分析架构及企业战略分析方法, 能带领团队完成不同主题数据的有效整合与管理。对行业、业务、技术有敏锐的洞察力和判断力,为企业发展提供全方面数据支持。

1.2 CDA 等级认证考试招生对象及报考条件:

专业不限,但拥有本科学历或相当的专业水准(工作经验)

Level Ⅰ: (满足以下之一皆可报名)

(1) 拥有本科及以上学历或在校本科大四学生

(2) 本科以下学历非学生需从事数据分析相关工作 1 年及以上

Level Ⅱ: (满足以下之一皆可报名)

(1) 获得 CDA Level Ⅰ认证半年以上

(2) 本科及以上学历并从事数据分析相关工作 2 年以上

(3) 本科以下学历需从事数据分析相关工作 3 年以上

Level Ⅲ: (满足以下之一皆可报名)

(1) 获得 CDA Level Ⅱ认证 1 年以上

(2) 本科及以上学历并从事数据分析相关工作 5 年以上

(3) 本科以下学历需从事数据分析相关工作 6 年以上

说明:上述数据分析相关工作不限制行业,工作涉及统计,数据分析,数据挖掘,数据库,数据管理等内容即可。

2. 为什么选择 CDA 等级认证考试?

CDA 注册数据分析师协会会员是来自学界、实务界,国内大陆、台湾及国外数据分析和数据挖掘相关领域顶尖的教授、专家、工程师及企业高端人才,代表了国内数据分析研究领域的一定水平。 CDA 数据分析师等级标准是根据国内各大企业对人才技术的需求而设立,旨在为国内数据分析发展阶段提供一个科学、专业的标准规范,说明究竟什么人才是优秀的数据分析师。

CDA 数据分析师的就业前景可选择于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研、教育等多个行业和领域。根据三个不同的等级胜任不同的数据分析工作任务。

3. 如何成为一名 CDA 数据分析师?

CDA 数据分析师 LEVEL Ⅰ、Ⅱ、 Ⅲ系统培训,由人大经济论坛根据 CDA 协会认证标准而设立的一套针对数据分析师技能的全面系统培训。培训师资目前均来自学界、实务界相关领域的讲师、教授、专家、工程师以及企业资深分析师,名师荟萃,代表了国内数据分析培训的最高水平,可以很好地保证培训的学员既能学到扎实的数据分析理论知识,又能具备较强的利用软件解决实际问题的能力,保证学员能胜任各行业数据分析师工作的要求。学员可以参加“ CDA 数据分析师 LEVEL Ⅰ系统培训”或“ CDA数据分析师 LEVEL Ⅱ、Ⅲ系统培训”进行深入学习。

经管之家( 原人大经济论坛)于每年 6 月和 12 月举办 CDA 数据分析师考试。 通过考试后即可获得 CDA 数据分析师等级资格认证证书,后续可参加 CDA 线下聚会、沙龙、招聘会、研讨会等各项活动,促进数据分析师领域的高效发展。

4. 人大经济论坛 CDA 优势

经管之家(原人大经济论坛),于 2003 年成立于人大经济学院,致力于推动经济学科的进步,传播优秀教育资源,目前已经发展成为国内最大的经济、管理、金融、统计类的在线教育和咨询网站,也是国内最活跃和最具影响力的经管类网络社区。

经管之家运营团队:北京国富如荷网络科技有限公司,成立于 2006 年 6 月,公司以人大经济论坛为运营平台,经营业务包括培训业务、数据处理和分析服务和教辅产品等。发展至今,经管之家 “数据分析培训中心” 已经成为最具影响力和知名度的数据分析培训机构,一直努力做到:将数据分析变成一门常识,让统计软件成为学术研究的好伙伴,企业经营的好军师。经管之家具有如下优势:

优势一:师资

CDA 数据分析师系统培训,由经管之家根据 CDA 协会认证标准而设立的一套针对数据分析师技能的全面系统培训。培训师资目前均来自学界、实务界相关领域的讲师、教授、专家、工程师以及企业资深分析师,名师荟萃,代表了国内数据分析培训的最高水平,可以很好地保证培训的学员既能学到扎实的数据分析理论知识,又能具备较强的利用软件解决实际问题的能力,保证学员能胜任各行业数据分析师工作的要求。CDA 数据分析师培训注重结合实际,把最具技术含量、最具价值理念的课程传授给学员。课程还注重启发式教学,让学员在动手解决问题中去学习。

CDA 数据分析师课程的大纲和内容,既由经管之家和国内数据分析、数据挖掘领域专家潜心开发和反复研究,又经过科学的调研确定,并且将不断地随着数据分析的市场需求和数据分析技术的发展而调整,课程内容始终关注市场、关注前沿。课程内容的设计更注重阶梯化、体系化的原则,每一个学员,不论学习和工作的背景如何,都能在该课程体系中很快找到适合自己的课程,并不断学习提高。

优势二:继续学习

所有 CDA 学员除了学习现场课程之外,还会得到全程视频录像及辅助学习视频课程(包括 SPSS、 SAS、 R 语言等软件数据分析、 挖掘等内容),此系列视频课程可以进行后期巩固学习和进修学习,可扎实现学技能、拓展课余知识、升华技术层级。

优势三:在线学习

Peixun.net(经管之家在线课堂)学习视频可实现随时随地在线听课, 10 分钟一小节,可进行个性化、碎片化学习,更具针对性与便利性。 CDA 上课方式分为现场及远程两种方式,远程在线学习引进了最新设备与技术,解决了各地区学员的需求,并实现了如同现场般的远程答疑及讨论。

优势四:交流社区

经管之家有十二个社区,七百个版块,六百多万会员。每日讨论的热点话题及资料以千计。学员在学后可以到“ CDA 数据分析师”版块进行交流、提问、下载资料等,

形成数据分析专业聚集地,促进学员在圈子交流中高效发展。

可以说, CDA 数据分析师等级培训代表了数据分析行业的前沿培训教育技术、水平。 对于人才培养积累了很深的资源、 经验、口碑,所培养的学员 绝大多数具备了 较高的技术水平和素质。 并且, 经管之家凭借自身多年的积累,不仅在学术上有很深的造诣,而且与众多企业建立了很深的联系,并且不定期向企业推荐相关学员 ,并获得企业的一致认可。

六、 数据分析师行业发展前景

1. 优势、劣势

1.1 数据分析行业的优势

数据科学的运用领域广泛,数据分析技术可用于各个行业,因而各行各业都有进行数据分析从而进行科学决策的需求,数据科学的价值正逐渐被认识和承认。数据科学相关人才能够将分析法模型和算法的结果与特定的商业知识相结合,从而产生洞见并做出决策;同时, 他们可以根据业务需要更直接地应用建模并进行统计分析,将技术语言转化成企业其他部门可以理解的内容。 数据分析行业的社会价值越来越受到认可。

据全球最具权威的 IT 研究与顾问咨询公司高德纳( Gartner)预测,到 2016 年,大数据将在全球创建 440 万个工作岗位,其中有 190 万个工作岗位在美国。但是,目前拥有数据分析技能的专业人员严重短缺,只有三分之一的新工作岗位能招聘到人员。

美国面临严重的分析法人才短缺, 数据科学家的供应比例仅为 23%, 从而导致近40000名人才的缺口 。在中国,能理解与应用大数据的创新人才更是稀缺资源。美国和其他经济体以及中国所面临的人才短缺的现象不能仅仅通过研究生和毕业生的涌入填补这一空白,培训相当数量的数据分析人才是相当必要的。

埃森哲在近期的一项面向企业高管的调查中发现, 对于问题“哪些工具和能力对于在新领域实现增长而言是最重要的? ”,中国企业高管中有 63%的比例认为是数据分析技术,而且这一技术与社交网络技术及移动计算/应用开发技术并列第一, 如下:

11

图 11. 埃森哲面向企业高管调查

数据分析行业在国外发展已经很成熟了,随着我国经济发展与发达国家的距离缩短,技术力量的加强,及产业结构的完善,我国对于数据分析进行科学决策的依赖度会越来越高,相应的对于专业工作者的需求亦会增高。

1.2 数据分析行业的劣势

目前数据分析行业的劣势主要体现在以下几个方面:

首先,数据分析行业仍处于发展阶段,行业规模不大,行业规章制度与基础设施还不完善,这造成技术运用与人才培养在一定程度上略显缓慢, 不利于行业的快速、稳健发展。

其次,从业人员相关技能还需要进一步?高,包括对于公司业务的理解能力,数据科学专业技能等,从而能够形成行业竞争壁垒,促进行业社会认可度。

2. 展望

大数据将迎来发展黄金期,数据分析行业将迎来社会的广泛认可,数据科学人才的需求将迎来新的井喷期。

首先,数据分析行业具有广阔的市场前景。近年来,互联网、 电子商务、 互联网金融、医疗等行业的迅速发展,行业规模不断扩大, 数据量不断增加,对于数据隐含的价值分析挖掘的需求越来越大,职位机会不断增加, 从业人员相应的待遇也随之上涨。中国企业高管坚信数字技术的力量,必将促进数字行业的发展,相应的对技术方面的人才需求将会增加。

其次,数据分析行业受益于国家政策支持(详见附录 2.)。自2014年3月 将“ 大数据” 首次写入《政府工作报告》 以来,中国国务院总理李克强在多个场合提及这一“热词” ; 2015 年 4 月,全国首个大数据交易所——贵阳大数据交易所正式挂牌运营,并完成首批大数据交易;根据贵阳市出台的《关于加快推进大数据产业发展的若干意见》,提出力争到 2017 年在贵阳市建成全球首个块上集聚的大数据公共平台,贵阳市大数据产业的总量规模突破 2000 亿元,贵阳大数据交易所预计,未来 3-5 年每天交易量达到 100 多亿元。政府引导大数据产业健康发展,在信息消费和数据产业发展上提供积极的政策支持, 把大数据转换成真正意义的资产,让大数据资产在全球范围流通,并产生价值, 对于缺乏获得优质数据的民营企业、小微企业、 创业者都是巨大机遇;同时,大数据作为一种商品, 可交易可流通,将对互联网、金融、传统产业构成深远影响,从信息消费到数据消费的转变。

2015 年8月19日 , 国务院常务会议通过《关于促进大数据发展的行动纲要》。会议认为,开发应用好大数据这一基础战略资源,有利于推动大众创新、万众创新,改造升级传统产业,培育经济发展新引擎和国际竞争新优势。 纲要强调, 一要推动政府信息系统和公共数据互联共享,消除信息孤岛,加快整合各类政府信息平台,避免重复建设和数据“打架”, 增强政府公信力,促进社会信用体系建设。优先推动交通、医疗、 就业、 社保等民生领域政府数据向社会开放,在城市建设、社会救助、质量安全、社区服务等方面开展大数据应用示范,?高社会治理水平。 二要顺应潮流引导支持大数据产业发展, 以企业为主体、以市场为导向,加大政策支持, 着力营造宽松环境,建立市场化应用机制, 深化大数据在各行业创新应用, 催生新业态、新模型,形成与需求紧密结合的大数据产品体系, 使开放的大数据成为促进创业创新的新动力。三要强化信息安全保障,完善产业标准体系,依法依规打击数据滥用、 侵犯隐私等行为。 让各类主体公平分享大数据带来的技术、制度和创新红利。

当前中国在大数据应用方面的技术已经成熟,而完善政策导向和法律法规才是关键,此次纲要中明确了政府和市场的职责,为接下来进一步细化措施的出台打下了坚实基础, 为大数据发展创造更有利的坏境。

七、 数据分析师行业对《促进大数据发展行动纲要》 的响应

2015 年 8 月 31 日 国务院发布了《促进大数据发展行动纲要》( 以下简称《纲要》),这无异于对目前蓬勃发展但又面临不确定性的数据分析行业吃了一个安心丸。俗话说巧妇难为无米之炊, 在数据分析行业,数据就是基础。 以往数据分析中数据质量一直是瓶颈, 尤其是各方面基础数据匮乏、可信度低等问题一直困扰着分析师。

《纲要》 明确指出“讲加快政府数据开放共享,推动资源整合,提升治理能力”。明确指出在 2017 年底前,明确各部门数据共享的范围边界和使用方式,跨部门数据资源共享共用格局基本形成。到 2018 年,中央政府层面实现数据统一共享交换平台的全覆盖,信息系统通过统一平台进行数据共享和交换。 2020 年底前,逐步实现信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、资源、农业、环境、安监、金融、质量、统计、气象、海洋、企业登记监管等民生保障服务相关领域的政府数据集向社会开放。这样的承诺令数据分析行业的从业人员欢欣鼓舞。 为了使数据分析师行业得到更好的发展,数据分析师内部也达成了如下共识,作为对《纲要》的响应。

1. 知识分享氛围的培养

知识是科技发展的动力,知识分享对促进社会发展有这正面积极的意义。数据分析的直接产品就是知识,因此数据分析师在知识分享中有着重要的价值。虽然很多知识以专利的形式存在,不便于分享。但是一些基础性知识,比如分析技能的培养、经典商业案例等应该广泛普及与扩散。

2. 人才培养体系的建立

很多商业分析师在工作中发现,高校毕业生需要 1-3 年时间才可以转变为一个合格的商业分析师。这使得一些企业面临高额的人才培养成本,尤其是初创类公司,还要面临成材率低和人员流失严重的双重压力。究其原因,是高校在数据分析人才培养方面还没有建立起一套与商业接轨的体系。 由于学科的限制,目前高校没有一套完善的针对于数据分析人才的培养方案。由于商业数据分析践性强,学校老师的考核多以科研能力为主,因此学校教师存在着能力偏差。虽然部分高校已经注重外部导师项目的发展,但是体系化不强,个人的作用有限。因此,亟需商业数据分析师内部合作,从实战方面建立起人才培养体系,以满足商业界对数据分析人才的需求。这类事情在国外比较普遍,比如注册金融分析师( CFA),管理会计师( CMA),这些都是从业人员自己建立起来的人才培养体系,极大的促进了本行业的发展。但是,国内外针对于数据分析师的人才培养体系很少,这更需要本行业从业人员共同合作,为本行业发展积极出力。

3. 从业人员自律文化的形成

数据分析是一个过程高度不透明,而且验证结果的成本很高,因此分析师的自律极为重要。分析师自律文化的核心是诚信。以往的学校教育以成果为导向,而且数据分析师多是毕业生中成绩优异的,因此多是积极进取的学生。进取心强是优点,但是过分强调成果,忽略诚信,会造成严重的经济后果。目前学术造假行为比比皆是,学术上这种行为影响虽然恶劣,但是不会造成直接的经济后果。商业数据分析的特点是成功率低,必须经历长时间反复测试才可以得到有商业实践意义的成果,如果不讲诚信,急于求成,会给企业未来带来严重的经济损失。因此数据分析师行业内部需要建立起一套从业人员的信息共享体系, 培养从业人员的自律意识。

《纲要》指出到 2020 年,培育 10 家国际领先的大数据核心龙头企业, 500 家大数据应用、服务和产品制造企业。而且注重市场在大数据发展中的重要地位。诚然,大数据产业是智慧产业,基于的是可再生的智力与数据,不存在天然垄断的基础。合作是取得多方共赢的基础, 而阻碍知识分享与人才培养的任何自私的行为都是与国家政策有违的,也损害了本行业从业人员的共同利益。

八、 附录

附录 1. 经管之家(原人大经济论坛)发展历程

2006年,人大经济论坛数据分析培训中心设立,至今经历9个春秋,建立了大陆、台湾一线师资团队,培养人才已达3万余人;

2013年,CDA数据分析研究院成立,CDA数据分析师课程第一次走进大家的视野,截至到现在,累计培养1200多名专业CDA数据分析师;

2013年,“中国数据挖掘与数据分析俱乐部CDMC”在人大经济论坛旗下成立,2014年改名为“中国数据分析师俱乐部CDA”。来自政府、金融、电信、零售、电商、互联网、教育等行业人士加入会员,累积了近1000名行业资深会员,成功举办了近二十场行业聚会;

2015年,CDA就业学院成立,响应国家职业教育人才培养的号召,与企业对接,在全国高校培养数据分析专业人才。截至到目前,帮助在200多个高校成立了大数据俱乐部和兴趣小组。

附录2. 国内重要大数据相关政策行动梳理

时间 部门 政策行动名称 政策行动详情
2012年7月 国务院 《“十二五”国家战略性新兴产业发展规划》 明确提出支持海量数据存储、处理技术的研发和产业化。
2013年7月 重庆 《重庆市大数据行动计划》 2017 年将大数据产业培育成全市经济发展的重要增长极。
2013年7月 上海 《上海推进大数据研究与发展三年行动计划(2013-2015年)》 数据硬件及大数据软件产品具备产业核心竞争力。
2013年8月 国务院 《关于促进信息消费扩大内需的若干意见》 推动商业企业加快信息基础设施演进升级,增强信息产品供给能力,形成行业联盟,制定行业标准,构建大数据产业链,促进创新链与产业链有效嫁接。
2014年2月 贵州 《关于加快大数据产业发展应用若干政策的意见》 打造大数据产业发展应用新高地,建成全国领先的大数据资源中心和大数据应用服务示范基地。
2015年3月 国务院 制定“互联网+”行动计划 推动移动互联网、云计算、大数据、物联网等与现代制造业结合,促进电子商务、工业互联网和互联网金融健康发展,引导互联网企业拓展国际市场。
2015年4月 发改委 《创新投资管理方式建立协同监管机制的若干意见》 提出运用互联网和大数据的技术来创新监管的方式 。
2015年5月 工信部 将编制实施软件和大数据产业“十三五”规划 大数据产业第一次明确出现在规划中。
2015年6月 国家信息中心 联合深圳大学成立深圳大数据研究院 致力于充分融合双方优势,打造大数据领域新型创新载体,推动我国大数据技术、人才与产业化发展。
2015年6月 工信部 加快推进云计算与大数据标准体系建设 将加快云计算与物联网、移动互联网、现代制造业的融合发展与创新应用,积极培育新业态、新产业,加快推进云计算与大数据标准体系建设。
2015年 7月 国务院 《关于运用大数据加强对市场主体服务和监管的若干意见》 运用大数据加强对市场主体服务和监管,明确时间表
2015年 8月 国务院 《促进大数据发展行动纲要》 健全大数据市场发展机制,建立标准规范体系

经管之家,原人大经济论坛, 2004 年创立, 历经十多载成为国内最大、最具影响力的经济、管理、金融、统计类的在线教育网站社区。在经管教育领域具有极强的品牌号召力!注册会员数量逼近 700 万( 2015 年 10月),平均日增 3000 新会员,日均访问人数(UV)40 万以上,日均发帖量为 15000,微信用户 23 万以上;现有100多个栏目(版块),内容涵盖经管资源分享、学术交流、提问学习、发布项目、考研考博等经管类学习的必备资源,同时为经管学习者题供求职招聘、在线教育、财经新闻等全方位服务,打造优质的经管人生态闭环,是众多经管学习的首选在线学习平台。

CDA 数据分析师品牌,是经管之家(原人大经济论坛)积累十多年的数据分析培训经验,打造的一套针对数据分析师技能的全面系统培训。培训师资目前均来自学界、实务界相关领域的讲师、教授、专家、工程师以及企业资深分析师,名师荟萃,代表了国内数据分析培训的最高水平,可以很好地保证培训的学员既能学到扎实的数据分析理论知识,又能具备较强的利用软件解决实际问题的能力,保证学员能胜任各行业数据分析师工作的要求。年培训人数超过 3000 人,为中国数据分析师行业发展提供强有力的推动。

来源:人大经济论坛

感谢支持199IT
我们致力为中国互联网研究和咨询及IT行业数据专业人员和决策者提供一个数据共享平台。

要继续访问我们的网站,只需关闭您的广告拦截器并刷新页面。
滚动到顶部