• 大数据
    10个针对企业的免费大数据分析工具 虽然收集和分析“大数据”存在一些分析和技术方面的挑战,但事实上大部分公司已经能够应对这种挑战。这是因为有一些非常强大的分析工具都是免费、开源的,可以充分利用这些工具来提升自己的能力。   Alex Jones推荐了10个针对企业的大数据分析工具,这些工具不仅免费、使用方便,而且具有强大的功能和良好的资源。   1、Tableau Public 这是一个简单直观的可视化工具。它在商业活动中表现的很强大,因为它通过可视化来表达。它有足够的空间和免费使用时长让你体验,在分析的过程中,Tableau的图片呈现可以让你快速的调查一个假设、验证你的直觉,做更好的商业决策。 2、OpenRefine 它是以前的GoogleRefine,OpenRefine是一款数据清理软件,可以对准备好的一切数据进行分析。例如最近我清理了一个含有化学名称的数据库,并且各行有不同的拼写、大小写、空格等,用计算机来处理非常困难,幸运的是, OpenRefine包含许多聚类算法,对这个问题可以快速解决。 Tip:可以用 IncreaseJava Heap Space 处理文件。   3、KNIME KNIME可以通过可视化编程的方式来操作、分析和建模。不仅可以写代码。你还可以在操作中建立联系节点。基本上你只需要将功能模块拖拽到工作区,并将模块按照运行流程连接起来,就可以实现以往编程才能实现的工作。更重要的是,KNIME可以扩展到运行R, python, text mining,chemistry data等等,这可以让你选择用更先进的编码来分析。   Tip:读取CSV文件时需要用“File Reader”代替CSV阅读器。     4、RapidMiner 和KNIME类似, RapidMiner通过可视化编程操作,建模和分析数据。最近,RapidMiner赢得kdnuggets的软件调查。 5、GoogleFusion Tables 这是针对数据分析、大数据集的可视化和映射的一个非常强大的工具,谷歌的地图软件在其中起着重要作用。拿下面这张图来说,这是一张墨西哥湾石油生产平台的图,我只需要上传数据,Google Fusion Tables确认维度和经度的数据之后就开始工作了。 6、NodeXL NodeXL是针对网络和关系的可视化分析软件。想想科技巨头地图上代表LinkedIn或Facebook的连接,NodeXL提供了进一步精确的计算。如果你在不需要那么先进的东西,你可以看看Google Fusion Tables,或者尝试用Gephi。     7、import.io 从网上抓取网页和信息曾经是技术人员的专利,现在用import.io,每个人都可以从网站和论坛获取数据。简单提出你想要的数据,几分钟之后import.io就可以通过你的搜索知道你在找什么,从而会挖掘、提供数据用于你的分析或输出。     8、Google Search Operators 不可否认谷歌最初是一个强大的资源和搜索公司,运营商可以让你快速过滤掉谷歌的结果得到的最有用的和相关的信息。比如说,你正想从ABC咨询里寻找一个今年的数据科学报告。如果我们认为该报告可能是PDF格式的,可以搜索 “数据科学报告”网站::ABCConsulting.com Filetype:PDF 然后在下面的搜索栏,使用“搜索工具”来屏蔽去年的结果。这在发现新的信息或市场研究方面非常有用。     9、Solver Solver是一个在excel中做优化和线性规划的工具,允许你设置一些约束条件(例如不超过什么价格,要在哪天之前完成之类)。虽然更有效的优化可能会需要另一个程序(例如R的优化包),但是Solver应用范围比较广。   10、WolframAlpha Wolfram Alpha的搜索引擎是一个隐藏的宝石,可以媲美苹果的Siri。WolframAlpha类似于不那么智能的Google,对科技搜索提供详细的回复,对微积分作用也能快速的搜索。对企业用户来说,它提供了信息图表,对历史价格、商品信息、主题概述。 虽然这些工具使得分析更简单,但他们只是把信息放进去然后进行分析,这些你自己也可以做到。所以用一点时间来学习新的技巧,用这些工具来提高自己完成工作。   来自公众号:数据客   扫一扫,关注“HRTechChina",聆听人力资源科技的声音!
    大数据
    2015年05月06日
  • 大数据
    美国大数据创业公司总结-融资篇           从以上数据,可以得出一些有意思的结论,比如,美国的大数据公司虽然很多,但是billion或者近billion级的不多,例如hortonworks, cloudrea, splunk, teradata。下面是个人分析的一些可能原因: 大数据技术分散,以开源为主,很难由少数几家公司主导市场,占领主要市场份额。 大量企业用户还是以传统数据库技术为主,新兴的大数据技术还不能完全取代传统技术。 大数据用户需求分散,往往需要针对特定案例做定制化解决方案,所以大数据公司比较难上规模。 从成功的几家公司来看,如果能抓住某些大数据通用需求,提供通用解决方案,扩大用户基数,那么还是有机会做成billion级别的公司。另外,公司需要有技术前瞻性,培育或投资于未来潜在大数据技术,这样才能在大数据技术成熟之际抓住市场和用户,从而得到自身的快速发展。 via:segmentfault
    大数据
    2015年05月05日
  • 大数据
    HRTechChina 2015人力资源数据化思维与实务论坛圆满结束 2015年4月16日,由HRTechChina举办,hrsalon承办的2015年人力资源数据化思维与实务论坛在上海紫金山大酒店圆满结束。近年来,数据化思维,大数据分析这一话题以及参与这一话题学习的热情越来越高,HRTechChina特别邀请人力资源行业中优秀的企业和嘉宾来就“大数据”的发现,挖掘再到整理分析与大家分享,同时也邀请跨行业的数据专家加入其中,给大家分享其独到的观点和见解。   此次论坛在王文斌(HRTechChina中国合伙人)的开幕致辞《全球人力资源科技的发展趋势》中开始,盛吉安 [普华永道(中国大陆及港澳地区) 人力资源总监]的演讲《发现你的数据-人力资源数据分析及预测 》,开启了大家数据化思维。 叶阿次(复星集团人力资源副总经理)的演讲《人力资源数据化抉择》紧随其后,从发现数据到数据化抉择,再次强化数据化思维的重要性。而接下来的圆桌论坛--《如何让数据来说话,建立HR的数据化思维》,正如现场版的让数据说话,建立数据化思维的示例,对话由张月强(SAP中国人才管理方案总监、北京大学MTI教授)主持,叶阿次,陈昊昕,刘晶,杨冰四位嘉宾分别与大家分享了他们的相关看法。   下午的大数据招聘演讲,无论是刘邵波(Linkedin 商业分析部高级经理,专注于大数据招聘)的《大数据如何让招聘更美好》,还是王勇(丁丁网人力资源总监)的《大数据在企业招聘中的应用浅析》,相信都从大数据这一角度给予招聘新的解读,陆游(微学堂总经理)的《企业学习数据的实时展现与分析》给大家带来了一堂生动活泼的数据分析课,而潘欣(HRsalon调研顾问)的《员工满意度调研数据分析及应用》和杨冰(科石高级顾问,中国人力资源沙龙特聘顾问)的《经营导向的人力资源数据分析》再次丰富了人力资源数据化思维论坛的话题。由周欢、刘绍波、王勇、郭宏伟进行的圆桌互动和最后环节的互动问答可谓讨论热烈,大家纷纷发表自己的见解,分享自己的经验心得。本次论坛在参会人员的热烈互动中圆满结束。   让我们一起来重温一下本次论坛各位嘉宾演讲的精彩剪影吧。   盛吉安 [普华永道(中国大陆及港澳地区) 人力资源总监]的演讲《发现你的数据-人力资源数据分析及预测 》   叶阿次(复星集团人力资源副总经理)的演讲《人力资源数据化抉择》 由张月强(SAP中国人才管理方案总监、北京大学MTI教授)主持,叶阿次,陈昊昕,刘晶,杨冰四位嘉宾进行的圆桌论坛--《如何让数据来说话,建立HR的数据化思维》     聚精会神听演讲的参会人员   王勇(丁丁网人力资源总监)的《大数据在企业招聘中的应用浅析》 陆游(微学堂总经理)的《企业学习数据的实时展现与分析》 潘欣(HRsalon调研顾问)的《员工满意度调研数据分析及应用》  
    大数据
    2015年04月17日
  • 大数据
    亚洲前十的大数据公司都在做些什么? 互联网时代,大数据分析已成为IT、电子商务、零售业、银行业和保险业最至关重要的工具之一,可以帮助他们正确锁定客户群,为客户提供个性化的定制解决方案。使用分析工具的公司已在客户招揽、保留和促进销售上看到了巨大的改善。   亚洲的很多大数据公司都在海外市场书写了成功故事。不过,亚洲市场正成为大数据业务的主战场,因为世界总人口的60%都居住在亚洲,且亚洲上网人数在不断上升。   这里为您列出亚洲大数据分析领域十强:    Aureus Analytics:总部位于新加坡的大数据分析公司Aureus Analytics为企业提供集成的大数据分析平台,使企业不用再为理解客户需求、分析业务风险和找出运营低效之处而网罗多种分析工具。它的ASAP统计与分析平台被设计为能跨越多种数据仓库类型和数据结构类型的集成分析平台,无论结构化或非结构化数据、内部数据或外部数据、大型数据仓库或小型数据源,都能用这个平台进行统计分析。这家公司最近刚在在线交易平台LetsVenture上筹集到85万美元资金。    Mu Sigma:位于印度班加罗尔的Mu Sigma公司成立于2004年,帮助企业利用大数据建立数据驱动的决策制度。它在诸如市场营销、风险控制和供应链等关键领域解决业务问题,为企业客户提供融合了技术平台、过程和人力的生态系统。公司声称拥有超过3500名决策学专业人士和75家财富500强客户。   截止目前,Mu Sigma已从红杉资本和泛太平洋资本集团一类的风投公司筹集到超过2亿美元资金,并正在与投资者商谈另外2亿的新鲜资金注入。   Mu Sigma在全球各地都设有办公机构。    Fractal Analytics:Fractal Analytics组建于2000年,为企业(消费品公司、零售商和金融机构)提供理解、预测和培养消费者行为,及改善市场营销、定价、供应链、风险管控和索赔管理的工具。   其旗舰产品‘客户基因组’帮助营销人员在个体级别掌握复杂的客户行为。客户基因组从每笔交易和包括社交媒体在内的客户互动中学习客户特征,帮助营销人员建立关于单个客户的完整视图。这家公司的解决方案也可以用于预测经营业绩。   Fractal的背后是私募投资公司TA Associates,自2013年起已接受其2500万美元投资。去年,多伦多证券交易所上市公司Aimia也对Fractal进行了投资。   Fractal拥有职员800多人,客户遍布一百多个国家。其总部位于美国,但在伦敦、孟买、新德里、新加坡和迪拜等地都设有办公机构。   Manthan Software Services:位于班加罗尔的Manthan软件服务公司为企业提供商务智能和大数据分析解决方案。Manthan成立于2004年,结合先进的预测分析、可行性分析和客户知识帮助零售商分辨和抓住成长机会。   这家公司受富达(印度)成长基金和诺维斯特风险投资支持,总部设在班加罗尔,在美国、英国、菲律宾、新加坡和巴西都设有办公机构。    Crayon Data:Crayon Data成立于2012年,总部分别在印度钦奈和新加坡。与常规的以人为本的分析模式不同,Crayon通过融合企业、公众、外部网络和社交数据打造能产生真正的业务解决方案的工具。   Crayon Data的旗舰产品‘简单选择’为企业带来大数据与分析的巨大力量,使客户能够增加他们的销售转换,从已有帐户上增加收益。这家公司主要面向酒店业、金融业、零售业和技术行业。目前为止,已从Jungle Ventures和Spring Seed Capital募集到550万美元天使投资。    Heckyl Technologies:成立于2010年,为经纪公司、短线交易员、投资者和基金经理提供实时新闻与数据分析平台。其集成解决方案可以提供信息、可视化效果、情绪热点图和市场数据以帮助交易员在市场中找到交易机会。   与传统的解决方案不同,Heckyl在它的平台里引进了社交媒体因素。它还准备为金融机构和对冲基金开发一款大数据挖掘平台。2013年12月,由国际数据集团创业投资公司和Seedfund Advisors种子基金引领的第二轮投资中,Heckyl获得了350万美元资金。这家公司在孟买和英国设有办公点。   Spire Technologies:总部位于班加罗尔的Spire Technologies为企业管理他们的人才需求提供上下文搜索引擎。Spire成立于2008年,为供应链管理、客户关系管理、欺诈信息、人才成长管理和前瞻性人才信息提供多种解决方案。同时,它还通过从文档、电子邮件、短信息和评论中抽取数据构建欺诈监测工具。2013年12月,这家公司从不知名的投资者手中募集到8百万美元的首轮投资。    Altizon Systems:Altizon是基于大数据的物联网初创企业,其主要关注点在工业互联网上。它为制造业厂商提供可以打造智能连接设备并从云端进行控制的平台。这家初创公司有一套传感器数据设备和软件开发包,可以从工业设备的传感器里将数据提取到它的Datonis平台进行大范围数据摄入和聚合。   去年9月,Altizon吸纳了数额未公开的种子基金,提供者是印度一家专注大数据投资的早期基金Hive India,风投公司Infuse Ventures和Persistent Ventures也有参与。   TookiTaki:TookiTaki是一家专注于受众发掘与预测的市场营销情报初创企业。 它正在打造一个软件即服务(SaaS)平台,为企业和媒体机构提供受众行为的可行性分析。作为其分析基础的预测模型结合了公众数字信息与突出投资回报率的反馈环。   TookiTaki在新加坡和印度都有办公机构。今年1月份从风投公司Jungle Ventures、Rebright Partners和Blume Ventures募集到一百万美元的种子基金。    Corporate360:成立于2012年,为企业提供IT销售数据分析服务。有四种产品:Tech SalesCloud(为技术产业设计的数据解决方案,可提供公司概略、技术安装情报、联系人数据和预测分析);DataFactory(以数据即服务模式运行的B2B市场营销数据软件,提供公司概略和联系人情报);Peep(社交媒体可视化应用程序,聚合并形式化社交媒体个人资料/联系人数据,将之在统一的窗口中呈现出来);SataStudio(数据服务,提供精选数据服务、数据挖掘、预测性分析和社会情感分析)。   Corporate360办公机构分布于加利福尼亚、利物浦、马尼拉、新加坡和印度。最近,这家公司收获了20万美元的天使投资。   扫一扫,关注“HRTechChina",聆听人力资源科技的声音!
    大数据
    2015年04月14日
  • 大数据
    李德毅:大数据突破点在于聚类 [摘要]这种聚类是跨学科、跨领域、跨媒体的,并且已经成为许多行业的核心竞争力。 2015年4月9日,第三届中国电子信息博览会在深圳召开。工业和信息化部电子信息司司长刁石京主持开展了新一代信息技术产业发展论坛。中国工程院院士李德毅发表了主题为“大数据认知”的演讲,对大数据的发展前景做出了展望。   人类社会文明已经进入到了数据密集型的新时代,大数据已经成为重要的资产。在李德毅看来,大数据本身既不是科学,也不是技术,它反映的是网络时代的一种客观存在。而数据数量巨大,价值密度低,实时在线,多源异构,给人们的认知造成了很大的困扰。   李德毅认为, 人类的认知科学要想有所突破,首先就要在大数据聚类上去的突破,聚类是挖掘大数据资产价值的第一步。这种聚类是跨学科、跨领域、跨媒体的,并且已经成为许多行业的核心竞争力。人脑的认知能力不能够全部、完整、统一地形式化,但特定的情境下的认知能力是否可以先局部地形式化。   智能机器人是物联网不可或缺的端设备,一直以来都是人类关注的重点。李德毅认为,机器人既使用大数据也产生大数据,既是大数据的产物,也是大数据的推动者,机器人是大数据的认知的典型代表。人脑的认知能力不能够全部、完整、统一地形式化,但特定的情境下的认知能力是否可以先局部地形式化,而机器人就是人类的思维移植。   以下为李德毅演讲全文: 尊敬的怀部长,各位来宾,女士们,先生们,我汇报的主题是大数据认知,云计算、大数据、认知,大家知道认知是现在全球都感兴趣的话题。所谓认知,就是怎么样获取知识和技能的能力,所以我的第一个小标题是讲一下认知。   大数据标志着一个新时代的到来,这个时代的特征不只是追求丰富的物质资源,也不只是无所不在的互联网带来的方便的多样化信息服务,同时还包含区别于物质的数据资源的价值发现和价值转换,以及由大数据带来的精神和文化方面的崭新现象。   大数据来源于人类的测量、记录和分析世界的渴望和无尽的追求。随着信息技术,尤其是传感器、通信、计算机和互联网技术的迅猛发展和广泛应用,人类获取数据的手段越来越多,速度大大加快、成本急剧降低,层次和尺度更为精细,揭示自然现象和社会现象更加深刻,人联网和物联网又使得人人物物都成为数据源,这样一来,大数据成为网络时代人类社会的重要资产。   我想说一个观点,大数据本身既不是科学,也不是技术,我个人认为,它反映的是网络时代的一种客观存在,各行各业的大数据,规模从TB到PB到EB到ZB,都是以三个数量级的阶梯迅速增长,是用传统工具难以认知的,具有更大挑战的数据。   数据量巨大,价值密度低,实时在线,多源异构,怎么办?举个例子吧!聚类,物以类聚,人以群分,这是人类几千年来认识世界和社会的基本能力,是从大数据中发现价值必须面对的一个普遍性、基础性问题,是认知科学作为学科的学科,要解决的首要问题。无论是政治、经济、文学、历史、社会、文化、还是数理、化工、医农、交通、地理、各行各业的大数据或宏观或微观的任何价值发现。   2008年XX专刊登了一篇文章,人们对小标题关注不够,这个小标题讲的PB时代的科学怎么做。大数据分析和挖掘的首要任务是聚类,这种聚类是跨学科、跨领域、跨媒体的。   聚类的挑战性很多,有人是并行计算等等,我不细讲了。我想说的是大数据聚类表现形态。   我想用几个例子来讲一讲,人类走过了几千年的实验科学、几百年的理论科学,保险是一个很传统的行业,基于概念评估的生意,保险公司对车险客户是这样聚类的:A类连续两年没有出车祸的,B类,最近一年没有出车祸的,C类过去一年出了一次车祸的,D类过去一年出了两此及以上车祸的。我从机场到深圳来,你坐飞机从北京到深圳,保险公司给你付了,我一了解,这个保险是20块钱,这个保险公司买了你三个大数据,身份证,还有你的手机号,各位企业、各位领导,各位老百姓,你们想一想。   物联网时代,当汽车成为轮式机器人,成为大数据发生器以后,就是一个大数据发生体,每一次驾驶,每一次维修,每一次行驶,甚至每一次刹车,都会记录在岸,利用大数据聚类,保险公司可对一个车况好、驾驶习惯好、常走线路事故率低,不勤开车的特定客户,给予更大的优惠,而对风险太高的客户报高价甚至拒绝,例如出租车司机跑的比老百姓多得多,总之能够给出包括保险费支付方式在内的个性化解决方案,这就颠覆了保险公司的传统商业模式。这就是大数据聚类成为保险公司的核心竞争力,我扩张一下,就是大数据聚类成为很多行业的核心竞争力。   非大数据时代,做一个人脸的识别,我们可以提取它十个特征,第二类先结构化存起来,你想一想,如果十个特征都一样的话,两个人是不是同一个人呢?当然,这也是不可能的,但是我们再想一想,人类智能来看,它忽略了什么呢?我认为它忽略了太多,这种人脸识别仅仅是几何结构的聚类,落入集合学框架,忽略了聚类的不确定性,忽略了聚类的多样性等等。   再举个例子,大数据写诗,人们熟读众多诗词,记住了针对各种意境的大量字串。例如说李白一生写诗1010首,把他所有诗句进行机械切割。李白给毛主席诞辰100周年写一首诗,就是这样。   大数据对形式化方法的挑战是非常严峻的,在数据密集型的网络时代,任何传统学科,或者传统的行业,它的公理、原理和定理组成的语境,遇到互联网+的挑战之后,这样一来,传统的学科行业,或者是交叉学科,成为一个大数据、小模型、小定律、交叉学科的时代,模型和程序要围绕数据转。   创新,表示在创造一个新的语境,新的坐标系,在这个坐标系下研究大数据,在互联网情况下,如何创造你新的坐标系,新的语境,否则难以有新的发现。   实践中的研究,由下而上要深入,数据要胜过程序,价值要胜过知识,关联要胜过因果,更多要关注有意义的小众,把这些小众累积起来才成为大众。   通过大数据聚类即时发现价值,要充分认识大数据中的不确定性和价值的隐蔽性。   机器人如何认知是我讲的第二个问题,这七个字,可以有两种划分,一种是机器人如何认知,你要把这个弄清楚,我觉得实际上是在弄这个,机器人在想,人如何认知,智能机器人是集新材料、新工艺、新能源、机械、电子、移动通信、全球定位导航、移动互联网、云计算、大数据、自动化、人工智能、认知科学、乃至人文艺术等多个学科、多种技术于一身的人造精灵,是人联网、物联网不可或缺的端设备,是人类社会走向智慧生活的重要伴侣。   机器人既是使用大数据也产生大数据,既是大数据的产物,也是大数据的推动者,机器人是大数据的认知的典型代表,机器人时代真的来了,我们希望我们以后的黄牛退休、铁牛耕地,这个铁牛就是机器人,农民进城,机器人耕地,医疗与健康机器人,服务机器人更是上上下下,当然还有太空机器人等。   我先讲一下服务机器人,高考机器人,就是由知识的碎片化,大数据来认知,就说明我们的教育不能光是填知识,我们现在做一个报告,我们可以用机器人来撰稿,机器人导航,机器人手术等。   如果语言、文本、歌曲、剧本,都可以用虚拟机器人,训练他的形象、情感、动作、语音、语调、风格,利用大数据,发出新的歌声。   机器人革命是世界性的、时代性的,机器人换人首先不是换掉理发师之类的劳动者,而可能是产业工人、文秘人员、医生、服务员、甚至士兵,他们将升级转型成为机器人的创造者和使用者,成为懂得集成、维修、管理机器人的专业人才。跨界渗透和跨界创新诞生的智能制造也是我国抓住历史机遇的又一次崛起。   我想做一个可穿戴设备的案例,如果你能做一个人和人的衣服,动力驱动,研制一个可穿戴的机械,帮助负重、助行、转体、条约的话,不仅可以让机器人站起来走路,还可以让特种兵成为飞人、超人。   这就是这样一些机器人,可穿戴的外部增强的机器人,这是我想做的家庭服务机器人,今天企业家很多,我在这投一个标,我想做这边这一个机器人,谁能做下面的轮子,从餐厅到卧室,从卧室到书房,希望大家有兴趣能够谈一谈。   机器人还将进一步刮起穿戴风,苹果做了手表,这个手表里面有一个检查老年痴呆的,苹果发表了5个APP商家,启动全新医疗应用,我们想一想,如果有一天让手机或者手表成为医疗诊断的工具,成为用于慢性管理的医患视频互动平台,成为医疗互联网个人健康与医疗的数据发生器,成为远程诊疗的开始,成为某种流行病的社会调查,成为病友社交网络,甚至会颠覆传统看病模式,颠覆传统医学研究。   生物机器人遐想,我们人的想象中,生物的多种形象,如果器官移植越来越发达,那么移花接木就屡见不鲜。将来,谁是谁搞不清楚了,如果这个人的脸换到另一个人的身上去,怎么界定?从定制治疗到定制婴儿,改造人类胚胎DNA,会不会避免遗传性疾病?如果将人的思维移植到机器人,那么思想是不是不朽的呢?   我现在想做一个东西,我想做一个机器驾驶脑。在脑科学取得重大突破前,能不能做得出来?人脑很复杂,我跟一个美国科学院士,是个华人,在科技部开的咨询会上,他告诉我一句话,让我很吃惊,他回答我的问题,脑里要花一个脑袋功能结构图,100年都画不出,他说你看一看生命科学的书,那叫人脑的组织结构图,全球已经发现500多种脑部疾病。   科学界正把脑科学和认知科学作为当前的重大研究领域,我们热切期待生物脑的出现。   难道认知科学就是研究生物脑的自然属性吗?怎样把社会属性研究进去呢?我提出来要研究文字、文明和传承,我们各种高端生物都会有语言、文字的,因为有了文字,才有了文明。要研究脑认知的后天属性,研究脑发育、可塑性与自然环境的关系,认知也是后天学习和积累的结果,是与社会环境、社会实践、群体交互等密切相关的,要建立人脑认知的成长机制:如何创建神经元之间新的连接和新的认知。   我们想一下,人的智能,除了记忆之外,在学习和思维上,到底有什么能耐?客观地说,或者概括地说,一个是逻辑思维,一个是形象思维,形象思维最主要的是两个,一个是类比,一个是联想,主要解决的是图象。   因此我的技术观点是如果人脑的认知能力不能够全部、完整、统一地形式化、但特定的情境下的认知能力是否可以先局部地形式化,例如算术运算、简单游戏、博弈、定点开车等。   就在此时此刻,美国的一个汽车公司,真的从洛杉矶往纽约开,他要开5000多公里。我们有很多摄像头,还有汽车本身的运动参数,再一个就是我们的导航地图,还有雷达传感器,我们利用一次规划,和驾驶地图,形成一个初位化。我们认为,我们的驾驶脑主要涵盖了人脑关于驾驶行为的主要功能,长期记忆、短期记忆,还有瞬间记忆,就是感觉记忆,从感知到认知,到行动。我今天在博览会上找了好几个厂家,希望跟他们合作,X1芯片,我们能不能做出我们自己的XPA,让我们的汽车工业在智能时代到来中不错失又一次机遇。谢谢大家!   中国脑计划马上要启动了,我个人认为是要将三项研究同步进行,因为大数据三化来认识脑袋,保护脑,模拟脑,谢谢!
    大数据
    2015年04月10日
  • 大数据
    大数据在人力资源中的神奇之处 似乎每个人最近都在谈论大数据。只有在企业配备了所需的正确人才和技能时,大数据分析才能助其提高学习效果和利润水平。 大数据是令人生畏的,但是对其进行分析可以在组织内产生显著的效果。通过对跨越各个职能部门的复杂的数据集进行分析,组织可以获得一些独到的见解,为促进变革推波助澜,增加获取专家建议的机会,加速入职培训,留住人才,并且找到产生复杂问题的根本原因。它改善了学习环境,以及学习和发展组织本身。 为一个组织创造价值的人不一定是正式组织结构图上握有权力的那些人,而往往是那些具有深厚和广博的专业知识、能够影响别人、知道组织是如何真正发挥作用的、而且可以运用本部门范围以外的资源来实现目标的人。 发掘大数据应用的价值 水利工程公司美国美华集团(MWH Global)使用了大数据分析来确定该公司的顶级合作伙伴,然后把它们作为催化剂进行调配,以帮助加强各种活动,这样,该公司就从一个以部门为划分单位的IT结构逐渐过渡到共享服务的模式。“公司确定了最重要的变革推动者,并且公开承认以他们为榜样。六个月后,美华集团就节省了2500万美元。”业务开发和市场营销高级副总裁塞西尔·霍布斯(Cecyl Hobbs)在社交网络分析公司Activate Networks上这样说。通过增加内部专家,该公司能够更快地(以在其他情况下很难达到的速度)克服瓶颈和障碍,并且更有效地在整个网络进行资讯传递。 一项网络分析显示了哈利伯顿公司(Halliburton Company)多个员工集群之间的联系很少,于是该公司与Activate Networks进行了合作,以改善其全球各个站点之间的交流状况。在该分析的基础之上,哈利伯顿公司通过组建混合型的项目团队、将人际关系良好的人员轮岗至其他平台上、创建电子专业知识定位器,来加强跨平台之间的联系。九个月后,该公司的各种联系增加了25%,运营效率提高了10%,由于质量不佳而造成的成本下降了66%,客户不满意度下降了24%,新产品收入增长了22%。这些改进归因于员工能够更加有效地共同做出决定,并且能够针对最佳实践方法和创新进行交流。 也有企业利用大数据分析来留住人才。“敬业、业绩和社交联系是人员逃走风险的关键因素,”霍布斯指出,“员工们是否找到了发挥专业知识的机会,对一个项目来说他是非常重要、靠边站,还是负担过重?在一段时间内你可以关注这些事情,并且了解人岗匹配的情况。那些变得越来越孤立并且缺乏动力的人可能都有逃走的风险。” 对于新员工的入职学习,个人社交网络是他们获得成功的关键。“如果在30天内一个顾问还没有与公司很好地融合在一起,那么这就是一件令人担忧的事情。”霍布斯给企业高管的时间长一点。在60天内,他说,就应该能够很明显地看出企业的新高管是否能够与必须打交道的人员和部门密切合作。“如果新高管没能做到这一点,或者其人际网络一边倒,那么这就是该高管还没有彻底进入角色的关键警告。” 改善学习和发展 国防军需大学(DAU)采用了不同的方法,利用大数据分析来了解其学习计划的有效性。 DAU为整个美国军方系统内的超过15万名现役和预备役采购和信息技术人员提供培训,被全球企业大学联合会公认为2013年度最佳企业大学。DAU与知识顾问一起合作,将来自多个系统的数据(包括人力资源、预算和会计)与学习数据库和学生信息结合在一起。因此,“我们可以以十年的调查结果为基础设置基准,审阅课件和设施,以及每门课程是如何影响组织绩效的。”DAU战略规划和学习分析主任克里斯·哈代(Chris Hardy)博士说。 每年,在课程结束时和课程结束60天后,DAU都会对课程质量和导师有效性进行调查,发放成千上万的问卷,以便评估课程对学生的工作绩效和业务成果的影响。主要调查结果表明,与喜欢传统课堂和导师的年长学习者相比,那些喜欢在线学习的年轻学生以及具有研究生教育程度的人员认为课件质量更加重要。导师有效性被标上了可以改善的标记,因为分析显示“导师有效性和课件质量之间有匪浅的关联”。通过比较基本数据,哈代博士认识到DAU导师在DAU比在其他组织更有影响力。特邀演讲人可以激发更高水平的个性化学习,其反映在以后的工作影响和业务成果中。 哈代博士正在与一个进行趋势分析的新的学习分析团队一起工作以提高DAU的整体能力,该分析团队跨越多个业务部门。“在主动分析了诸如毕业率和回报率、课程质量、课程地点、业务部门的差异等数据之后,趋势就变得非常明显。然后,我们就可以发掘出根本原因,并且解决出现的任何问题。例如,我们使用知识顾问(Knowledge Advisor)的Metrics that Matter软件来分析为什么远程学习的回报率正在下降,了解到政府关门和休假大大打击了士气,所以学生没有完成调查或者前来上课。” 目前,哈代博士的团队已经将该系统连接到学生信息系统上,以便将业务成果与培训连接在一起。DAU跟踪了培训地点、质量、成本、学生评价,以及在工作上的应用效果。全部完成以后,这个连接在一起的系统就像一个用于学习的人才管理系统一样运行,与知识共享系统连接在一起,并且还具有诸如模板、法规和即时培训等功能。 利用隐藏信息 有时,企业已经拥有了一些隐藏在数据之中的信息,但是没有使用或未能意识到这些信息,先进的分析能力则是解开这些信息谜团的关键。大数据分析方法将网络科学和行为科学结合在一起,可提高协作能力和员工敬业度。正如霍布斯阐述的那样:“我们收集信息来识别社区当中网络、个人的影响力、以及对团队的影响。这是一种弹性的解决方案,为工作中的关键联系提供了微观和宏观两种角度。”他指出,影响力并非“权威”的必要组成部分。 Activate Networks的企业社交平台(Activate Social Platform for Enterprise)软件解决方案可以为数以百万计的用户绘制网络地图。例如,它从电子邮件流量中收集并且分析元数据和标题信息,包括发件人/收件人和时间标记(但不是电子邮件内容本身),来识别个人的通信网络。通过进行先进的分析,企业可以获得一些识别信息中介人和信息瓶颈的定性方法。 在识别信息中介人的时候,公司可构建一个描述性数据分布图,例如地点、性别和任期,然后把它们分层堆放在行为信息上,包括他们的网络和电子邮件数据、敬业度和其它技能,该分析结果能够精准地找到在组织内为人们带来力量的真正激励者。 了解了这些关系之后,就可以把时间花在市场营销上,简化组织的复杂性,增强协作,最大限度地减少可以预测到的错误,并且在较长的一段时间内帮助企业监视变化的结果。这样,可以通过缩短销售周期、提供更加温馨的指导、为内外部客户创造无缝的客户体验,来加快收入增长的步伐。 最终,在企业使用大数据分析进行跨职能部门联系的时候,大数据分析能够发挥它们更大的价值。它们能够提高你的洞察力,帮助你解决影响学习的问题核心,从而提高生产力和利润,这些才是一切问题的关键。 公司具备大数据技能吗? 美国管理协会(American Management Association)近期的全球调查显示,只有四分之一的企业表示他们能够满足数据分析需求,其余有17%的公司正在计划额外招聘一些员工来做这件事。大多数受访者(47%)计划投资培训以弥补其技能差距。与其它组织职能相比,人力资源和销售被视为分析技能当中最落后的部分。这一调查指出,资源和企业文化的缺乏是企业发展运用大数据能力的最大障碍。 快速提示 企业生产力研究所(i4cp)的最新研究《大数据时代:企业和HR发展报告》称,HR专家在创建和塑造善于分析的新劳动力时有着举足轻重的作用。从当今的领导者身上,可以学习如何开始在企业的人力资源当中应用大数据。 确定企业中的分析需求。评估员工整体的分析能力,并通过参考这些分析数据来决定首先将重点放在哪里。分析数据在平均水平之下的任何部门都应该最先得到处理,但是如果每个部门的数据都差不多,就应通过培养高管或者聘请新的领导者,专注于提升高层领导者的分析能力。 加强分析力量。如果想打造分析头脑,培训应当将重点放在“使用数据更好地做出决策”上,而不是只关注特殊的工具和数据分析技术,尽管后者对某些工作来说仍然很重要。这种培训将帮助员工从更加实证的角度处理问题。企业当中一些职能部门的员工可能已经具备了所需的技能,可以作为主题内容专家来教导其他人。 准备好管理大数据流。关于大数据的浪潮多半是因“大”这个字而起。如果企业正在计划搜集可利用的巨大的数据集,基础设施必须事先到位。企业范围内的人力资源系统可能有能力运用收集到的海量数据,也可能没这个能力。因此,在你仓促地投入当前势不可挡的大数据浪潮中之前,必须要先明确你希望找到一些什么。 拥抱分析决策的思维模式。有的企业在做决策时基于经验、出于本能,若要变革成为由数据驱动的企业,不只是提升其分析能力那么简单。看待问题的方式需要改变,领导者也必须理解以数据和证据为基础的决策方式,并且能够运用这一方式。 (本文编译自Training) (来源:培训杂志 文/ 盖尔·达顿(Gail Dutton) ) 中国第一个关注人力资源大数据的论坛,详情请戳http://bigdata.hrtechchina.com/
    大数据
    2015年03月26日
  • 大数据
    品牌课程:数据分析在人力资源管理中的应用 用数据驱动见解和创造价值 是学习,也是反思 是关键技能,也是管理思想 有矫枉过正,也有独门秘笈 有关键理念,也有工具模板 讲师写在前面的话 从2012年开发这门课程开始,通过一线城市公开课和企业内训的方式,到当前已是第五版了,我们不断完善和打磨,力求兼顾到宏微观、理念与工具,广度、深度以及实践应用,大家已然都很认可HR数据分析是一种关键手段,但我们在这个背后真正需要的思考是,我们该如何重新定义人才管理价值?我们需要思考的是如何从关注模块化HR的效率价值,转向关注人才管理和组织效能,聚焦问题导向、成果效力和关键价值,回归出发点、聚焦独特价值以及寻找效能杠杆! 这一切都需要数据的帮助,HR数据分析应更多关注从Metrics到Analytics,从数字到信息整合,从逻辑化到循证思维的转变。个人希望本课程至少可以起到以下三点作用: 1、学会将循证、数据驱动和人才细分的理念应用在工作上; 2、在你的公司内部,建立周期性的“人才报表”; 3、建立“定义价值 - 衡量 - 改善”的新思维常态。 让我们共同开启一段全新的学习旅程! 课程模块 理念趋势:下一代人力资源管理者的关键素质 温故知新的统计学基础:回归、概率、数组特征、层次分析、相关性…与常见应用 价值四层级:反应性统计、高级、战略、建模 三项过程要素:来源、技术与应用 从大数据到小数据:基于人才细分、内容拆分、动态分析下的小数据分析 内容四模块:人力资本投资效益(HC Investment)、人力配置(Headcount Planning)、HR运营(HR Operations)、人才管理价值(Talent Management) 从定性到定量:成熟度模型、定量溶解冰山、建立预警指数 价值回归:从人才管理到组织效能 课程对象 任性的你敢于挑战难度和HR数据分析技术 关注左脑开发,聚焦理性思考与技战术 对所负责的HR职能模块并无要求 虽然我们对你的数学基础0要求,但起码你要懂一些基础的Excel操作 既有大型集团关注的宏观体系,又有小型公司所关注的微观方法 以往参训企业: 自2013年初至2014年底,已超三百家企业,近千名HR学习本项课程。 麦当劳、精工电子、中国光大银行、英特尔、复星医药、雅仕维广告、特思尔、东银实业、方太厨具、国药控股、华宝证券、中国电信、华住酒店集团、中国金茂集团、天士力帝益药业、科勒、马克华菲、唛歌餐饮、平安证券、日立机械、厦门翔业、朗泰物业、齐耀动力、睿泰集团、苏泊尔、浙商建业、中建材集团、中粮、中兴通讯、嘉实信息、一茶一坐、互动通、诺华制药、重庆长安汽车、三菱电机(中国)、森马集团、苏宁电器、创侨贸易、上海外高桥发电、新华传媒、矢崎(中国)投资。。。 报名咨询 于小姐 电话:021 5108 3646 QQ:1466990193 邮箱:hrsalon2018@qq.com 课程大纲 课时(1天) 模块 内容 授课方式 1.0小时 模块1: 人力资源管理数据分析的三个层级 1.HR价值导向与数据分析 HR职能发展与思维变革 HR关键价值与数据分析三层级 HR数据分析的特点 数据如何收集 课前预习 案例分析 现场练习 问卷与工具模板 公式库 2.数据统计的基础 统计学的基础概念 数据分析的基本方法 回归分析与关键函数 关键图表画法 5.0小时 模块2:HR数据分析的关键模块(科石HR Metrics) 1.投资效益分析 (HC Investment) 人力资本衡量的概念与方法 科石“HR MATIC”四个维度 组织效益与人力资本 HR成本水平与结构 HR成本的价值分析 关键工具 现场练习 案例分析 情景模拟 现场研讨 2.人力配置 (Headcount Planning) 人员信息收集与分类 人才队伍与人才质量的数据表达 组织形状与人才结构数据 定岗定编分析 人才盘点要点 3.HR运营分析 (HR Operations) 薪酬管理 薪酬水平内外部分析与量化诊断 薪酬体系设计的量化分析 绩效管理 绩效指标设定的量化方法 绩效管理结果与成效分析 招聘管理 招聘成效类数据分析 员工流动信息分析 培训管理 培训管理效率指标 培训成效数据 4.人才管理价值 (Talent Management) 员工满意度与敬业度 雇主价值与留才指数 从胜任力模型到人才测评的逻辑 基于人才价值的数据分析 1.0小时 模块3:HR量化管理价值指标与总结 1.HR量化价值衡量 基于人才生命周期的HR量化价值 HR运行效率指标 HR管理效力指标 HR战略职能价值指标 案例分析 量化指标练习 现场研讨 答疑 选、用、育、留各模块量化指标 2.总结与答疑 循证思维下的HR变革思路 课程工具包分享 总结与答疑   最近公开课程: 6月11日  上海  紫金山大酒店   报名咨询 杨小姐 电话:021 5108 3646 QQ:1466990193 邮箱:hrsalon2018@qq.com   如需引入企业内训,亦可联系我们。  
    大数据
    2015年03月19日
  • 大数据
    [专访]美国Top 4 CTO:大数据将消失,但融合到你的业务中了 大数据这个关键字从去年红到今年,早已成为科技业的重要趋势,研调机构IDC便预测2015年将有超过25%的企业导入巨量资料方案,而美国专业招聘公司罗致恒富(Robert Halt)公布的《2015薪资指南(2015 Salary Guide》更把大数据工程师列为今年薪资涨幅最大的六大行业之一,预计薪资年成长率9.3%,平均年薪119,250美元至168,250美元。 台湾从企业到政府也人人高喊大数据,连向来对新科技接受速度最慢的政府都开始动作。行政院长毛治国甫上任祭出的科技三箭,就有两箭跟数据息息相关,一个是开放资料,一个是大数据,新北市政府日前也推出全国第一个「传统产业大数据应用示范计划」,希望导入大数据分析,帮助金属、机械和纺织等传统产业转型,还在日前的新北大数据论坛活动中请来美国大数据分析与储存技术公司Teradata首席技术长宝立明(Stephen Brobst)来分享大数据趋势。 宝立明此次来台除了出席新北大数据论坛分享大数据趋势,更受邀至行政院与毛治国畅谈开放资料政策,分享美国政府开放资料的经验以供台湾借镜。宝立明去年被ExecBank选为全美排名第四的CTO(前三名分别是亚马逊、特斯拉和英特尔),在2500名顶尖CTO中脱颖而出,他不仅是全球一流的数据专家,更曾成功创立三家提供数据服务的公司,后来陆续被IBM、NCR等大厂并购,他也是欧巴马的创新科技顾问委员会的一员。 身为全球顶尖的大数据专家,宝立明在接受《数位时代》专访时却说,他认为大数据这个词将会在五年内消失,并认为从物理学家到社会学家都会是优秀的数据科学家,以下为宝立明专访的内容摘要: 1. 大数据这个词近年来非常火红,但也有人认为大数据已处在泡沫期,您怎么看这种人人高喊大数据的现象? 我承认现在整个社会上瀰漫着一股大数据热潮,但我认为这不失为一种好现象,因为这让大家注意到这个世界上还有许多尚未被挖掘,并且充满价值的资料,我认为在这股热潮当中,其实是有黄金的,但就像你说的,其实还是有很多人不知道大数据是什么意思,更不知道怎么用他。 他们以为大数据就是指大数目的数据,事实上,我认为这是大数据中最无趣的部分,我们真正在寻找的是非传统的、而且未曾被挖掘过的资料,并且从这些资料中去提炼出价值,我相信在五年内我们就不会再使用「大数据」这个词了,到头来大数据就只是资料而已,不是吗?资料是很重要,但是这个世界上还有一大堆以往根本不被视为是资料的资料在那边等着我们挖掘,到最后,人们会开始回头分析这些资料,他们会发现,大数据不过就只是数据的一种,大数据、小数据、结构化、非结构化的资料...这些称呼通通都不重要,因为这些都是资料啊,这是我认为为什么到最后大数据这个词汇将会退烧的原因。 2. 你认为数据经济以后将会成为每个企业的DNA吗? 是的没错,人们将会依据一家公司是否有效地运用数据,来定义这家公司是否成功。大数据这个词也许是三年前才出现的,但其实它早在十年前就有了,概念比名词出现得更早,在八年前发生了一个比较重大的转变,人们从研究一笔交易变成研究互动,我们开始往下钻研,不只研究一笔交易,更研究真实的顾客体验,因此我认为虽然不是每一个,但许多大数据应用必须要能够更妥善了解顾客的行为和体验。 我认为大数据发展可以分成三阶段: 第一阶段是.com时期,人们研究log资料,搜集人们的Cookie和搜寻行为等等,这类分析已经存在很久了,我们不只知道使用者买了什么东西而已,而是更深层地去分析行为,一笔交易只告诉我价值,但没有告诉我顾客体验,大数据想要去分析的是顾客体验。 第二阶段是社交网站,这也是我们现在正在经历的阶段,我们分析Facebook、Twitter、部落格文章...等等等,这可以帮助我们进一步了解顾客行为。 第三阶段是物联网,这是我觉得最有趣的阶段,有些企业已经开始分析来自传感器的数据了,在这边我说的物联网不只是穿戴式装置或智慧家庭而已,我说的是机器与机器之间的沟通,这些资料的价值很值得被研究。现在制造业都会订下一些规矩,例如我们的汽车每半年就要进厂维修,就跟人每年都要去做健康检查一样,我认为这是非常过时的想法,一旦我们用传感器去搜集引擎、汽车和生理数据,我们就可以精确知道何时需要进厂维修或做健康检查,这就叫做预测性维修(condition based maintenance),这个概念对于促进顾客体验、效益和健康保险等领域非常重要。 3.你对大数据的定义是什么? 一般来说我们用3V定义大数据,容量(Volume)、快速(Velocity)与多样性(Variety),其中我认为最重要的是多样性,资料不只来自那些传统管道,有更多来自非传统管道的非传统资料产生,我认为价值(Value)是第四个V,人们常常忘了这件事,他们专注于技术,却忘了创造价值,但这却是一个大数据计划能否成功的关键:这不只关乎技术,而是你能用技术创造出什么价值。 4.台湾有许多中小企业,许多中小企业也许认为大数据是个离他们很遥远的概念,因为他们根本没有「大数据」,您会给他们什么样的建议? 这些小企业一看到大数据就会想说,喔这一定是很大的数据才有办法做,但数据的量其实从来都不是重点,我认为「大数据」是个非常差劲的命名,因为它让人们直接联想到「大」,但数据的大小其实是最无趣的部分,最重要的其实是那些你从来没有想过可以用的数据以及那些非传统的资料,我认为这才是人们对大数据应有的认知。 有许多新创企业在思考如何用大数据创造全新的商业模式,例如硅谷最近有一个正在做P2P交易服务的新创公司,比如说我们一起去吃午餐,你买单,然后我透过手机给你我的部份的钱,这不是什么新的概念,但这家公司有趣的地方他不收任何手续费,而银行一点都不喜欢这个主意,你知道现在的银行交易都必须额外负担手续费,银行于是说:「你怎么可以完全不收手续费?」这家公司说,因为这些交易资料本身的价值远远超过手续费本身。 从此之后,这家公司会知道你我之间有一种连结,如果我们每个礼拜五都出去吃饭,他们就可以判断我们之间有强烈连结,如果我们一个月或一年才吃一次,那么也许我们之间的连结比较弱,这家公司可以藉此判断人与人之间的关系强弱,你也许会说:那又怎么样?这可以干嘛?这家公司将会知道谁是社交意见领袖,如果他要卖新产品,他可以先从这些人开始着手,例如我也许会买他的东西,但我没有朋友(笑)所以它就只能卖出一项产品,但你有一百个朋友,你也许是个疑心病比较重的人,所以我要花比较多功夫来说服你买东西,但你一旦用了而且觉得好用,那么你很有可能会将这个讯息散播给你其他一百个朋友,那我搞不好可以再多卖50个产品,这就是一个善加利用社交数据,而且突破旧有思考模式的例子。 5. 如何用大数据创造商业模式? 这是个颇为复杂的问题,因为大数据是由很多不同元素组成的,我会把大数据认定为是比交易系统更深一层的互动分析,首先,如果你有一笔订单,你就得到了顾客的价值,但你无法了解他们为什么如此行动,如果我能够了解他们的行为喜好,我就可以创造更好的顾客体验,我创造了更好的顾客体验,他们就会越买越多,他们会停留更久,如此我当然就可以创造一个非常强大的商业模式。 基本上所有的电商网站都在做这件事情,因为电商网站无法直接与顾客接触,所以他们必须透过分析数据来与顾客建立关系,这是个很显而易见的商业模式,如果你不分析数据去改善顾客经验,顾客就会离你而去。如果就制造业来说,预测性维修是比较常见的大数据商业模式,这跟传统的维修模式全然不同,这当中的经济价值差异是数以千万的美元,就算对中小型企业亦然,如果你知道这些企业每年花多少钱在维修设备和安全改善,你就应该知道预测性维修是门好生意。 6.这些对企业来说是技术层次的问题,但商业嗅觉是否才是如何让大数据变现的关键? 是的,我称之为直觉,你为了验证你的假说,于是你设计了一个实验模型,如果你没有商业嗅觉,你很可能会实验了一千次但得到很差的结果,我相信你一定有听过这个笑话:「一百万只猴子也可以写出莎士比亚等级的著作,只是我们要等很久而已。」你放猴子在那边一直打字,总会有好的产出的,但这其实不太好,对吧?所以我认为还是需要具备一定的商业眼光。 好的数据科学家和不好的数据科学家的差别就在于他们的商业眼光,我认为这不只是管理阶级的职责,而是一个数据科学家的职责之一。 7.大数据项目牵涉到许多跨部门的协作,而不只是IT部门的事,你认为这会更象是一个管理问题而非技术问题吗? 我的确观察到许多只专注在技术层面的公司,他们的大数据表现通常都不怎么好,管理者必须确保你在埋首进行的事是有商业价值的,而不只是在玩技术而已,在麻省理工学院有个词用来形容这些只埋头搞技术的人:追随流行者(Fashionist),这些人盲目追随科技新潮流,看到云端运算就赶快跑去搞云端运算,噢看那边是大数据耶,大家都有我们一定也要有! 他们不知道为什么需要,只是因为大家都有,他们就要有,这不是一个好策略。 你必须要思考:这有什么商业价值?为什么我需要做这个?所以那些最成功的大数据项目都是由技术部门和商业部门协作而成的,只有技术人员是不可能成功的,但同样地,只有业务部门也不会成功,他们必须在一起才能创造价值。 而数据分析的技术的关键在于,你是否有用对技术,这是许多公司低估的地方,有很多公司混淆了做报告和分析数据的人。比如说美国的教育很重视数学,但我们的统计学教得一蹋糊涂,统计学对于数据分析非常重要,很多人高中毕业后也许几何、微积分很厉害,但他们连最基本的期望值理论都不懂,他们也不懂交叉分析,但这些技能对于分析数据都是非常重要的,我认为我们的教育体系和企业在培育拥有这方面技能的人才上,投资得太少了。 近年来有很多大学开始开设数据分析课程,我觉得这是一件好事,但问题是等这些人才毕业了,到时候我们对大数据人才的需求已经远远超过供给了。 8. 你认为现在要寻找优秀的数据分析学家很困难吗? 人们常常把计算机科学家和数据科学家混为一谈,数据科学家不一定非得要写程序才能分析数据,当然你不应该害怕科技,如果你害怕新科技那你就不是那个对的人,你需要会使用科技,但重点其实还是在数据,你要会设计实验、熟悉数学和统计、如何获取资料和得到结果...等等等。 当然,数学系毕业的人是很好的选择,但我的经验是毕业自实验性科学科系的人也会成为很好的数据科学家,例如:应用物理系、化学系、天文系...等等,因为他们知道怎么设计实验、怎么搜集数据和得到结果,这让他们成为优秀的数据科学家。在麻省理工学院我们有个笑话,物理系毕业的人如果不去教物理,他们就失业了。因为除了教物理你还能干嘛?但现在物理系的人也会是很好的数据科学家,例如eBay最优秀的数据科学家就是物理学家。 你看事情的眼光还需要充满创意,所以社会学出身的人也会是很好的数据科学家,很多社会学家必须做调查,并且从中搜集和调查数据,这已经具备了数据科学家该有的特质了。但如果你不具备这种分析数据的背景的话,可能就不是那么好的候选人了。    来源:数为时代bnext
    大数据
    2015年02月25日
  • 大数据
    大数据时代的招聘 导读:「我们想要的是一名狙击手,招聘网站却为我们招来了一架坦克」。企业和应聘者的信息不对称,导致招聘网站「乱点鸳鸯谱」,这是企业中的HR习以为常的尴尬事。   编辑·李佳楠 「我们想要的是一名狙击手,招聘网站却为我们招来了一架坦克」。企业和应聘者的信息不对称,导致招聘网站「乱点鸳鸯谱」,这是企业中的HR习以为常的尴尬事。HR们到底如何才能在茫茫人海中相中「适合自己的人」,并且确保其能在恰当的位置上不会很快另谋高就,「大数据招聘」就在如此情况下应运而生。降低人为因素,让计算机做主是人力资源领域的一项新的举措。而且Facebook、亚马逊、沃尔玛和谷歌这些大牌企业已经捷足先登,利用大数据招聘技术成功找到了与之「来电」的人。   去年夏天,26岁的杰德·多明格斯(Jade Domingues)收到一封邮件,内容是一家旧金山的初创公司邀请他去面试程序员。   那时的多明格斯住在加利福利亚一间废旧的工厂里,经营着一家T恤图案设计公司,为了宣传自己的设计公司,正在自学编程。   多明格斯喜欢在各大编程论坛上和其他软件开发人员交流思想,共享代码,而且他的编程技术在全球最大的社交编程及代码托管网站——GitHub上享有很好的信誉,还曾被Jekyll-Bootstrap网站邀请编写代码,得到过很多其他网站开发人员的重用。   这家公司就是看中了多明格斯的这一点,他们在招聘时忽略了学历文凭以及是否具有专业的电脑编程技术,只是通过收集来自互联网上各大编程网站和论坛的数据信息,分析整理后找到了多明格斯这样的「天才」程序员。   这家名为镀金(Gild)的公司,把这项新的招聘技术命名为大数据招聘,大数据招聘就是希望在巨大的市场需求中,发现那些被遗漏的优秀人才,而且无须开出与一些大的技术公司相当的工资薪酬。   而大数据招聘技术的产生在人力资源领域是一个巨大的飞跃,它成功实现了智能化的员工筛选,让招聘工作变得更为简单、高效。   劳动力科学的新领域 大数据招聘是通过提升人力资源管理在人才搜寻过程中的技术,催生出的一个新的招聘系统。它属于劳动力科学的新领域。   现如今有很多类似镀金公司这样的公司正在朝着这个目标努力,他们想方设法把现有的招聘工作带入到大数据的范畴里。   对于最出名的镀金公司来说,大数据招聘技术是专门针对程序员这一职业的。数据分析主要基于各种编程网站和论坛,为其中较为活跃的参与者建立起个人的性格图谱、兴趣图谱以及关系图谱,深入了解个人的性格特点、兴趣方向和社交圈子,来最终决策出适合他们的公司岗位。   例如:镀金公司会在编程论坛中研究,参与者们写出的代码应用价值如何?是否得到其他程序员的认可?这些代码会得到专业网站的重用吗?编出优秀代码的程序员在网络社区中和其他人交流顺利吗?这都是他们考虑的范围,而且通过这些因素来预测今后这个人在工作和社交中的表现。   而镀金公司并不是第一个利用大数据招聘的公司。在镀金公司之前,一家名为Bright的在线招聘公司被创立起来。Bright公司的创始人古德曼(Goodman)发现,即使在美国的失业率高达两位数时,依旧有很多公司找不到既能胜任公司工作,又符合公司企业文化的应聘者。而且,各种招聘网站也暴露出了令人失望的一面。   很多公司的HR们只能感叹招聘到好的员工就好比大海捞针。   于是古德曼依靠100人以上的专业招聘人才,对互联网上超过数十亿份简历信息进行分析,构建出一个名为「Bright Score」的招聘评分系统。这个系统的特点在于它可以评算出一个具体的数值,用来确定工作岗位和应聘者之间的匹配度,同时创建出一个通用的评分算法,用以告诉招聘单位,对于某一个特定的工作来说,什么样的求职者才是最合适的。而对于求职者来说「Bright Score」也会为你自动匹配职业,如果你选择的职业并不适合你,它也会告诉你为什么,并按照匹配度高低为你推荐工作。   「Bright Score」是大数据招聘技术的先行者,使得人才招聘变得更有效率,而且更节省成本。   另一家来自硅谷的创业公司——Entelo,同样也在解决人力资源管理上的问题。与镀金公司相同的是,Entelo也通过人们在Twitter、Facebook等这样的社交网站发布的内容,来研究这些潜在的候选人所做的符合他们职业特点的事情。   但是与镀金公司不同的是,Entelo关注的职业领域不仅仅是StackOverflow和GitHub这些知名的程序员聚集网站,还包括Proformative(会计师网站)、Benchling(有关DNA测序点网站)和Dribbble(展示和描述设计师网站)等。   Entelo还发现并非所有用户都会用真名发布内容,那些有才华的人只会把特长当作兴趣爱好,于是Entelo便利用数据从数十家专业的社交网站中搜索到这些被埋没人才的联络方式以及居住地,用以向招聘方提供真实的信息数据。此外,Entelo还从多个网站收录并制作了600万专业人士的资料页面,利用超过70个变量来找出这些人职业变化的迹象。   Entelo公司当前已经积累了40多个企业客户,他的创始人约翰·麦克格拉斯(John McGrath)称自己的大数据招聘技术就如同一个搜索引擎,在正确的时机根据实时的新闻和社交网站上的求职信息找到对的人。   通常在时机方面,他们率先发现想要换工作或是正在寻找工作的人并和他们取得联系。   例如,Entelo通常会在一个公司在被收购时抓住先机,因为公司被收购,人事上一定会发生变动,Entelo就会迅速对其人员信息进行收集整理,这样的做法会在资源累积上争取到更多的主动权。   对的人,就是在推荐招聘前就划定正确的招聘对象范围。各种社交网站就是Entelo的首要据点。Entelo的基础工作是不断抓取网页上的信息,包括实时新闻、社交网站、兴趣社区等,当招聘客户提出需要招聘的人时,Entelo会迅速分析出符合特定条件的候选人,用大数据技术进行数据匹配。   而Entelo在大数据应用上更为人性化的一点在于常常为新创公司的HR推荐适合他们的员工,因为麦克格拉斯认为新创公司在初期一定急需注入新鲜的血液。而像多明格斯这样的「天才」肯定是他们迫切需要的。Entelo每次都有针对性地向招聘公司推荐人才,而不是在职场大量散发邮件以期获得一些回应。Entelo的目标是在未来为招聘用户设计出专属产品。   还有一家名为TalentBin的招聘网站,把自己描述为「人才发现引擎」。它的核心业务是一款聚合了来自数百家网站拥有5亿份社交资料的数据库产品。TalentBin上的大部分数据是公开的,而且比同类型的招聘网站所提供的信息更加详尽独到。TalentBin在今年推出了一款年费6000美元的高级服务,可以让应聘者进入招聘公司的人力资源管理平台,在其系统中直接和应聘公司的HR进行交流。   TalentBin可不仅仅提供招聘人才的服务,还提供包括通信工具、销售过程管理和报告等的一条龙服务。2012年,TalentBin 曾被HR Tech Conference点名为「超棒新技术」(Awesome New Technology),并在欧洲 iHR Adwards 大会上荣获「雇佣行业游戏改变者」的称号。截至目前,TalentBin共获得过约400万美元的投资。   // // 更公正更适合 大数据招聘技术的出现,并能在如此巨大的市场中有着广泛的需求群体,原因之一在于它改变了传统的人才指标。   先前的招聘者虽然也认同,不应该由于性别、长相或是名字来影响聘用决定,但是偏见往往就是以人们意识不到的形式体现出来,常规的面试还是会受到是否来自于名牌大学,在前任公司供职的经历如何,或是否来自于前辈或友人举荐的影响。   耶鲁大学曾做过一项调研,发现大部分企业在应聘经理职位的人员,聘任者会普遍认为女性求职者的能力相比具有同样资格的男性要逊色得多。   而美国国家经济研究局公布的另一项研究发现,简历上名字「听起来像白人」的求职者收到雇主回电的几率要比简历上名字「听起来像黑人」的求职者高很多。这样遗漏人才,最终造成的是雇主的损失。   然而这么多被偏见「筛掉」的人才,却可以通过机器来避免。被机器量化的信息虽然达不到百分之百准确,但是设置好的「公正」指标会在一定程度上予以均衡。   Bright公司在建立「Bright Score」的招聘评分系统时,就把一个人常浏览的网站;交谈各种技术时采用的语言类型;与人交流时多处于积极状态还是消极状态;以及在有关技能的描述上是否用词恰当;参与过哪些项目,为时多久;这个人如果来公司能做些什么等放在评分系统的得分榜的前几位。Bright的做法正在实践大数据招聘技术扭转人为因素在招聘领域的影响力。   镀金公司创始人卢卡(Luca)也曾说过,在专业学校学到的东西固然重要,但这「并不代表事情的全部」。企业真正需要的是能有自己真实见地,懂得如何应对压力,甘于同才华横溢的同伴一起共事的人。   大数据招聘技术存在的第二个价值就是找到「为你量身定做」的人才。   加州大学人力资源管理专家列文(Levin)博士说:在大数据招聘技术面世之前,很多大公司喜欢通过在职员工的推荐进行招聘,因为现任员工了解公司文化,而且推荐不好他们自己的名声和工作环境也会受到牵连。   虽然利用员工推荐的方法能招来高效率的员工,但是要想为企业招来适合自己的员工,而且是专门为其「量身定做」的人选,就需要依靠大数据招聘技术。   今年,一家名为Square的移动支付系统公司找到镀金公司,希望帮助其公司招聘员工,。   原因是Square公司经过调查发现,今年,有很多年轻人都把自己的工作成果发布在网上,其目的就是为了被更多优秀的企业发掘。而这些优秀的人才也会在挑选工作上设置一些选项。他们除了单纯找工作,更多的是想应聘到符合自己价值要求的公司。而镀金公司所要做的就是把这些「种子选手」筛选出来,规划他们的事业模型,并告诉他们选择在Square工作是正确的。   还有一个例子来自于TalentBin公司,最近他们新推出了一款Lookup寻人搜索应用软件, TalentBin的开发员说,当你使用Google来搜索你要找的人时,得到的相关信息可能分布在多个社交网络中,而Lookup会把这些零散的碎片集中起来,整合各个社交网络中的数据,列出你可能感兴趣的部分,并显示相关的社交网络活动。这样你就能很快地找到适合自己的正确信息。Lookup的受众并非仅仅针对招聘者,还包含了那些想要寻找他人的用户。   被「大数据」拯救 Evolv是一家专门检测招聘和职场数据信息的美国公司。他们通过对3万名雇员收集到的300万个数据点进行分析发现,运用自行安装的浏览器的人比运用系统自带浏览器的人表现更好,而且更少跳槽。这一研究显现出,大数据招聘技术有望拯救应聘双方信息不对称的难题。   第一个例子来自于IBM公司。 IBM公司每年在招聘销售人员上需求很大,通常IBM公司的HR在招收销售人员时基本要求就是善于言辞并且性格外向。但是在去年,IBM用13亿美元收购了Kenexa,线上招聘培训服务机构后,他们招聘标准发生了变化。因为Kenexa当年发放了4000万份问卷调查,覆盖了很多有一定销售经验的求职者和招聘者。在对其反馈回的数据进行分析后发现,成功的销售员的特质并不在于性格是否外向,而是在于自我鼓励的强度,也就是被拒绝后继续坚持的品质。   另一个真实的例子发生在名为Transcom的全球客服呼叫中心,这个公司长期困扰于人员流动率过高,于是他们找上了「大数据技术」,希望通过它来拯救眼前的困境。   「大数据技术」选择对公司的在职员工的行为进行分析,最后发现,被「大数据技术」认定「诚实」品质分数高的员工,稳定性也会更高。其准确率可以达到20%~30%。由此Transcom改变了现有的招聘策略,此后优先雇用有诚实特质的员工。采取措施之后,离职员工的数量下降20%,团队的稳定性更高,也节省了培训新员工的成本。   数据招聘技术在企业HR招聘人才方面功不可没。很多大企业都从大数据招聘技术中得到了甜头,其中包括Facebook、亚马逊、沃尔玛、谷歌和Twitter这些大牌企业。   然而大数据技术不仅仅是为企业服务,还为小型雇主或个人创造价值,提供便利。最近LinkedIn这个全球最大的职业社交网站便利用大数据技术创造出一系列适用于不同人群的产品。   一个是名为people you may hire的应用软件,是专门针对猎头的。有的时候猎头会看中一些人才但是被其看中的人才目前并不打算找新的工作,这个软件就会根据猎头的喜好向其推荐其他人才。   还有一个名为Who's viewed your profile,把这个应用软件安装在电脑上,它会实时告知用户谁看了自己的简历。得知信息的用户会在第一时间主动联系阅读自己简历的人,这为正在找工作或是正在寻找商机的人打开了一个好的沟通渠道。   「大数据」,靠谱吗? 虽然大数据招聘技术对企业有着很大的优势,但是也有其局限性。   英国的数据分析公司Altimeter Group的负责人苏珊(Susan)认为,大数据招聘技术「绝对值得一试」。但是相对而言,它也有它本身的缺陷。大数据招聘技术可以衡量预测所有的变量,但是却测量不了感性的东西,例如直觉。   大数据公司QUID创始人古尔利在认同大数据招聘的同时,也对它提出质疑:「当你在招聘过程中把人从复杂决策里排除掉,招聘来的人员也可能并不适应现在的人际关系。」   镀金公司的首席科学家薇薇安·明(Vivian Ming)博士说,大数据招聘技术并没有要消除人的判断,而是要让计算机做主,就像一个自动人才吸收机和筛检机一样。镀金公司已经积累了700万个程序员的资料数据库,并根据得分对他们进行排名。而且有很多公司利用大数据招聘技术已经从中找到了适合自己的员工。而且多明格斯就是他们挖到的一座内部金矿——他的编程分数是整个南加州的100分。   镀金公司说他们最终目的是把大数据算分拓宽到各个领域,使其可以用于搜索和评估各种类型的劳动力,比如网站设计师、金融分析师,甚至零售店的销售人员。   但是无论如何,大数据技术对于应聘者来说,得到的优势并不如招聘者明显。而且对于很多像多明格斯那样的人,他们并不知道自己的资料被收集,甚至对方已经帮助自己规划好了职业生涯;并且一个企业在决定是否录用一个人时,所收集的信息不一定会对其公开,因此大数据招聘技术对于个人信息数据的用途监管还有待加强。   Entelo公司的麦克格拉斯表示,迄今只有2个工程师要求将他们的资料从Entelo的数据库中删除。麦克格拉斯称,Entelo已经开始提供个人申请退出功能,照顾一些要求保护隐私或不愿接收邮件的招聘候选人。
    大数据
    2015年02月10日
  • 大数据
    透过10亿条招聘数据看大数据职位需求 // // // 本文转载自大数据文摘翻译作品 作者:LouiseColumbus 翻译:崔浩,蒋锐 校对:陈洁   美国人才招聘市场的数据分析领先者WANTEDAnalytics 最近给出报告:2014年计算机系统分析师和大数据专业人才的市场需求分别增加了89.9% 、85.4%; Python 编程技能的市场需求增加了 96.9% 。“大数据”,主要包括数据分析、数据采集、数据挖掘和数据结构这4项技能。为便于分析,当人们查询“大数据”这术语时, WANTEDAnalytics 即指向这4大技能。这份报告基于的WANTEDAnalytics的数据库,由从150多个国家,超过10亿条非重复独立的工作招聘条组成。   要点: 过去一年内很多职业对大数据专业知识的需求急速上升。市场上对具备大数据专长的信息技术项目经理的需求增加123.60%, 计算机系统分析员需求量增加89.80%。 大数据职位空缺最大的五大产业,依次是科学及技术服务(27.14%),信息技术(18.89%),制造业(12.35%),零售业(9.62%)和可持续性垃圾管理业(0.42%)及污染整治业(8.20%)。下图显示了2014年第4季度各行业对大数据专长的需求分布。 就2014年12月29日统计的数据来看,需要有大数据技能的工作的招聘比为76,平均每个职位的申请者为12人.招聘比例值越高,表示雇主越难找到职位的合适人选。 美国云计算方面的IT专业人士的平均招聘时间为47天 大数据专业人士的年薪中位数为10.3万美金。这些工作主要包括:大数据解决方案构架师, Linux系统及大数据工程师, 大数据平台工程师, 首席软件工程师,Java, Hadoop, SQL大数据师 等等。 相关产业综合后的年薪分布情况如下: 目前, 加利福尼亚的圣何塞-森尼韦尓-圣克拉拉地区( SanJose – Sunnyvale – Santa Clara ), 旧金山-奥克兰-弗里蒙特地区 ( SanFrancisco – Oakland – Fremont, CA ), 华盛顿DC-阿林顿-亚力山卓地区(Washington DC – Arlington – Alexandria)是美国大数据专业的前三大人才市场.下图为WANTED Analytics公司提供的城市数据分布图,它展示了美国各地区工作数量,工资水平,人才供应,平均招聘时间以及招聘比例等信息, 并总结了美国前20名的大数据人才市场的信息。 美国前20名的大数据人才市场的信息 此外,思科(NASDAQ:CSCO),IBM(NYSE:IBM)和甲骨文公司(NASDAQ:ORCL)拥有最多大数据相关的职位空缺。据统计,思科的供应商、合作伙伴和支持生态系统公司具有3613职位空缺与大数据相关。下表列出了目前排名前十的大数据雇主,就业机会分布,以及过去一年的新增就业人数。 这些岗位上需求增长最快的三项技能分别是:Python编程(96.90%),Linux(76.60%)和SQL结构化查询语言(76%) 下表列出了排名前10的技能要求: 原文:http://www.forbes.com/sites/louiscolumbus/2014/12/29/where-big-data-jobs-will-be-in-2015/
    大数据
    2015年02月09日