网上科普有关“数据科学家需要具备什么能力”话题很是火热,小编也是针对数据科学家需要具备什么能力寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助到您。
数学功底:微积分是严格要掌握的。不一定要掌握多元微积分,但一元微积分是必须要熟练掌握并使用的。另外线性代数一定要精通,特别是矩阵的运算、向量空间、秩等概念。当前机器学习框架中很多计算都需要用到矩阵的乘法、转置或是求逆。虽然很多框架都直接提供了这样的工具,但我们至少要了解内部的原型原理,比如如何高效判断一个矩阵是否存在逆矩阵并如何计算等。
数理统计:概率论和各种统计学方法要做到基本掌握,比如贝叶斯概率如何计算?概率分布是怎么回事?虽不要求精通,但对相关背景和术语一定要了解。
交互式数据分析框架:这里并不是指SQL或数据库查询,而是像Apache Hive或Apache Kylin这样的分析交互框架。开源社区中有很多这样类似的框架,可以使用传统的数据分析方式对大数据进行数据分析或数据挖掘。笔者有过使用经验的是Hive和Kylin。不过Hive特别是Hive1是基于MapReduce的,性能并非特别出色,而Kylin采用数据立方体的概念结合星型模型,可以做到很低延时的分析速度,况且Kylin是第一个研发团队主力是中国人的Apache孵化项目,因此日益受到广泛的关注。
机器学习框架:机器学习当前真是火爆宇宙了,人人都提机器学习和AI,但笔者一直认为机器学习恰似几年前的云计算一样,目前虽然火爆,但没有实际的落地项目,可能还需要几年的时间才能逐渐成熟。不过在现在就开始储备机器学习的知识总是没有坏处的。说到机器学习的框架,大家耳熟能详的有很多种, 信手拈来的就包括TensorFlow、Caffe8、Keras9、CNTK10、Torch711等,其中又以TensorFlow领衔。笔者当前建议大家选取其中的一个框架进行学习,但以我对这些框架的了解,这些框架大多很方便地封装了各种机器学习算法提供给用户使用,但对于底层算法的了解其实并没有太多可学习之处。因此笔者还是建议可以从机器学习算法的原理来进行学习。
在InformationWeek每年公布的IT从业人员薪金调查中可以看出大数据从业人员面临巨大的缺口。现今大数据呈现出“4V + 1C”的特点。既Variety:一般包括结构化、半结构化和非结构化等多类数据,而且它们处理和分析方式有区别;Volume:通过各种设备产生了大量的数据,PB级别是常态;Velocity:要求快速处理,存在时效性;Vitality:分析和处理模型必须快速变化,因为需求在变;Complexity:处理和分析的难度非常大。而IM专业让人才知道如何使用新兴的大数据平台(如Hadoop、NoSQL)来处理和分析大数据。
回顾InformationWeek多年的IT薪金调查报告,BI(Business Intelligence)和IM(Information Management)专业人才一直是IT领域中的高收入人群。Information2012年的调查报告显示BI从业者的平均薪金为90000美元,而2011年的数字为85000美元。BI管理者的平均薪水为119000美元,相比去年同期110000美元增长了9000美元。而在数据整合/数据仓库领域的薪金曾更高,普通从业者和管理者的薪金分别为97000美元和120000美元,相比2011年(普通从业者和管理者的薪金分别为98000美元和118000美元)变化不大。
大数据从业人员的平均薪金看起来已经相当不错,但还有哪项职位可以获得更多的薪水?大数据浪潮正在推进CEO寻找能够告诉他未来发展(在上周乃至上个月没有事情发生)的人才。
这类人才具备前瞻性和预见性的见解。埃森哲人才与组织绩效服务线下属的文化变革小组负责人Stacy Blanchard表示“他们通常是统计学家并且精通数据建模,同时他们知道如何在可用数据中使用最佳的算法,这极具技术含量”。他们帮助组织在大量信息中挖掘有价值的数据,并将数据转化为深入的认知和精准预测的模型。
大数据时代也迫使许多行业发生变革,当今制造商就在研究需求的数据和供应链信息,以便削减产品开发周期,提高制造和供应链的效率。同时向AOL、comScore、eHarmony等级与互联网的企业正在将客户的点击流数据进行分析,以提供有价值的个性化和定位服务,同时帮助找到最合适的客户进行精准营销。
从星巴克到沃尔玛,他们正在分析密集型数据,以便得出最合适的产品选型和定价。对于医疗。如哈佛医学院通过对临床资料的分析可为患者提高诊断、治疗的效率。总之企业和政府机构越来越看重通过数据驱动决策,这导致他们对分析和信息管理专业的需求不断增加。以下是大数据领域从业人员的十个趋势。
趋势一:薪金将继续增长
BI分析和IM专业人才现今薪金水平已经由于许多其他IT职位,但未来这样的趋势还会继续下去,尤其是管理人员,未来BI管理者的薪金将达134000美元(在InformationWeek所调查的23个IT职位中排名第四),而普通BI从业者未来薪金将达到96000美元(在InformationWeek所调查的23个IT职位中排名第十)。而数据整合和数据仓库管理人员薪金在未来将达到131000美元,普通工作人员薪金也有101000美元。(它们在InformationWeek所调查的23个IT职位中分别排名第六和第七)。
趋势二:大数据人才供不应求
事实上,麦肯锡全球研究院的研究预测在未来6年,仅在美国本土就可能面临缺乏14万至19万具备深入分析数据能力人才的情况,同时具备通过分析大数据并为企业做出有效决策的数据的管理人员和分析师也有150万人的缺口。而美国和其他经济体所面临的人才短缺的现象不能仅仅通过研究生和毕业生的涌入填补这一空白。而《Big Data: The Next Frontier for Innovation, Competition and Productivit》则认为培训相当数量大数据人才是相当必要的。
趋势三:雇佣外包
BI分析和IM人才需求的另一个迹象是外包,在调查报告中660名外包工作受访者的薪金要高于平均水平。25%的组织将其大数据分析业务外包给美国和境外企业,17%的组织表示只外包给美国境内企业,22%的组织表示外包业务完全交给境外企业。而在InformationWeek参与调查的13880位IT专业人士中,这个数字分别为18%、15%和18%。从大的系统集成商(像Accenture和IBM)到软件和平台商(像SAS和TeraData),他们提供特定行业的资讯和分析服务,这些企业在填补大数据分析缺口中发挥了重要的作用。
趋势四:人才团队内出现分歧
埃森哲Stacy Blanchard
埃森哲Stacy Blanchard表示分歧将出现在BI分析和IM团队之中,新生代和老一代的专业人员之间的差别不仅仅是年龄,而态度才是最重要的。新生代的从业人员更喜欢使用开放的开源工具和云计算,埃森哲的研究同时表明新生代从业人员还会与他们的同行对比收入情况。新生代从业人员想要确保他们正在使用的技术是最新最好的,以便跟上市场和商业化发展的脚步。而对于企业来说不利的因素是新生代对他们的工作环境更加敏感,一旦他们无法与志同道合的同时合作或是无法看到自己的见解对实际业务的影响,那么企业将会失去他们。
趋势五:大数据专业人士需要不断进步
BI分析、IM从业人员和管理人员需要引入更多特定技术培训和认证课程。而统计学和分析学的培训是非常具有价值的。更重要的是,对与在金融和市场营销等领域的业务技能培训要远高于普通IT培训。
趋势六:精通大数据的专业人才将成为最重要的业务角色
BI分析和IM专业人才将要比他们的同龄人承担更多非IT领域的职责。在660位受访者中,55%的管理和工作人员表示他们具备IT以外的相关经验。BI和IM管理人员对IT以外的领域富有更多的责任——如业务的发展、研究与开发方向等。
趋势七:大数据领域需要数据科学家
Ancestry.com Scott Sorensen
美国家谱网站Ancestry.com正在雇佣大数据从业人员,Ancestry.com Scott Sorensen表示他们正在犹他州和旧金山聘请大约80名具备从业能力新员工。新员工将填补Web开发、数据库管理等职位。同时公司也聘请了10余名精通大数据的专业人士,这其中包括少数的数据科学家。而数据科学家到底如何定义?Scott Sorensen认为对于数据科学家,很难找到权威的定义。但Scott Sorensen表示数据科学家擅长采用统计学方式用于开发算法。大多数时间他们是统计数专家,他们了解如何建立统计模型,使企业在处理大数据时开发出新的算法。
趋势八:高校回应大数据人才缺口
企业都在寻找机遇R语言统计编程和基于Hadoop和MapReduce编程人员。美国家谱网站Ancestry.com就试图从Google、Yahoo和Microsoft等公司招募员工。同时他们也将目光着眼于学校,旨在引入机器学习课程学位的学生。Scott Sorensen表示“当今卡耐基梅隆大学、加州州理工大学以及加州大学伯克利分校等众多大学都在加强机器学习的相关课程”。
趋势九:数据驱动的工作令人满意并充满挑战
BI分析和IM管理专业人员相比与常见IT人员,他们对工作和职业生涯所面临的挑战都较为满意。在调查中,69%的BI和数据整合/数据仓库的从业人员选择了“非常满意”和“满意”。当被问及他们的工作是否在对他们的智力有所挑战时,91%的BI/分析/IM人员以及93%的管理人士表示事实上他们确实正受到一些挑战。
趋势十:大数据专业人士将拥抱未来
时代在变,以往的历史查询和报告能力在当今的大数据时代显然已经力不从心,BI和IM领域的“老兵”或许已经领取不菲的薪金,但他们完全可以提高他们的薪酬待遇并延长自己的职业生涯,这需要他们做出改变,他们应当熟悉下一代专业知识的方法和技术。而大数据平台、非结构化信息管理技术、文本分析技术和先进的分析方法正在成为未来业务洞察力的关键因素。明智的企业和聪明的员工应该接受大数据时代所带来的变化。
关于“数据科学家需要具备什么能力”这个话题的介绍,今天小编就给大家分享完了,如果对你有所帮助请保持对本站的关注!
本文来自作者[伍路喧]投稿,不代表赤玉坊立场,如若转载,请注明出处:https://www68.cn/bkqs/202412-19647.html
评论列表(4条)
我是赤玉坊的签约作者“伍路喧”!
希望本篇文章《数据科学家需要具备什么能力》能对你有所帮助!
本站[赤玉坊]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览:网上科普有关“数据科学家需要具备什么能力”话题很是火热,小编也是针对数据科学家需要具备什么能力寻找了一些与之相关的一些信息进行分析,如果能碰巧解决你现在面临的问题,希望能够帮助...