• 数据
    如果分析更多的是领导力问题而不是技术问题呢?—— What if analytics is more of a leadership problem than a technical problem? 我们一直在讨论分析,数据,大数据以及所有热门内容,而数据科学家被认为是“21世纪最性感的工作。”当然,这里存在瑕疵。 值得注意的是,大多数公司在收集数据方面都很好(或者开始做好),但实际上大多数公司并不知道如何处理它。这种情况已经持续了大约五年。 让我说明一下:除非能向决策者(资金人)以他们能理解的方式展示,否则这些数据将毫无用处。而在大多数公司,拥有决策权的人只有大约7-10名“真人”,这些人通常是五六十多岁的男性,在过去二三十年里,他们以非常具体的方式获取信息,因而你无法用那些数据图、可视化、算法等对付他们。他们不在乎。 实际上这些可能会威胁到他们: 他们正在讨论的这些人工智能可以接替我的工作吗? 简而言之:数据没有任何意义,除非可以向重要的人解释。这意味着我们需要重新思考我们如何去做。 大多数公司是如何接近“数据时代?” 我将引用Northwestern的报告继续话题: 一个基本问题是公司通常将分析推广视为技术挑战:雇用数据科学家,采用正确的软件,然后获得业务收益。但是,O'Toole表示,通过分析实现真正的商业价值需要更深层次的企业变革。 (O'Toole是美联航和凯悦的前执行官。)对。所以我们认为它是技术性的东西,一个过程。但事实并非如此。它是什么? 关键是公司要创造一个环境,让员工在提出可以用数据回答的业务问题,并且他们能够自由地提问。O'Toole同意他的同事的观点,即分析是一个领导力问题。“在与一系列公司合作之后,特别是今年,我看到将分析与业务成果联系起来是一个文化问题。” 答对了。但是我们现在遇到了一些问题。   比如什么? 这就是我想象许多高管对他们的招聘团队说的话:“给我找一个曾经在谷歌工作或去这些学校的人。”实际上,这个“某人”可能已经是内部的,但却淹没在低背景项目和等级制度中。要做正确的数据,基本上你需要两件事: 好奇心和好奇心的发展 被问到的聪明的问题 当然,有一些麻省理工学院的家伙会帮忙。但如果这个家伙不能和高管说话呢?如果他只是知道数字但对如何分析业务的不同方面并不感到好奇怎么办?或者他可能被一个对数据一无所知并且因为不得不管理一个天才而受到极大威胁的人进行微观管理?你知道,很多事情可能会破坏完美的MIT雇佣。因此,“擅长数据”的过程不能仅仅在技术、流程术语中加以考虑。这确实是一个领导问题。   应该做什么? 第1步 修复您的招聘流程。有没有听过“垃圾进去,垃圾出来?”这句话,说实话这是大多数企业的内在问题。 第2步 内部文化不能完全是关于等级和“完成你的工作”和“我很忙”之类的交流。必须有空间提出问题,了解其他团队部门等。没有这些,就意味着收集到的数据将会被彻底的隔离开来。 第3步 收集和清理数据。 第4步 弄清楚如何呈现数据及其对决策人的意义。什么格式?演讲应该如何?长短?你绝对需要考虑这个问题。 第5步 根据分析做出一些重大,有影响,高效的决策。然后传播它是如何作用的。在公司周围谈谈,围绕它做一些知识分享。 让人们相信整个交易。许多公司的数据/分析问题在于,它似乎集中在一个部门,也许是高管。它并非被“完全拥有”。为了让它真正适用于组织,它需要由多个人拥有 - 而不仅仅是斯坦福的一些家伙和他的直接报告。 第6步 赚钱。 注:以上内容由AI翻译,观点仅供参考。 原文链接:What if analytics is more of a leadership problem than a technical problem?
    数据
    2018年09月11日
  • 数据
    数据显示:人力分析能为企业增加价值 HR Tech China获悉人力分析最新数据,下面我们来看这组数据: 数据显示: 人力分析能为企业增加价值 全球75%的人力资源专业人员正在使用数据来了解员工绩效和生产力问题 65%在企业中具备强大的人力分析文化的专业人士,报告说业务表现强劲 在那些分析文化较弱的企业中,只有32%的人报告说业务表现强劲  对人力资源能力缺乏信心 全球53%的人力资源专业人士认为,他们的人力资源团队具有可证明的数字和统计技能,而金融专业人士的这一比例为36% 英国的人力资源分析能力和信心落后于其他市场 21%的英国人力资源专业人士有信心进行高级分析,而在东南亚,这一比例为46% 以上内容由HR Tech China综合整理报道
    数据
    2018年07月17日
  • 数据
    在时间序列预测方面,传统的统计方法往往优于机器学习方法 文/ Paul Cuckoo 今天,如果没有基于机器学习(ML)的解决方案,坐在分析环境中的会议上讨论解决问题的方法是不可能的。这是有道理的;从SVM、CART回归树到神经网络套件(BNN、RNN、LSTM)的ML技术提供了优越的预测能力。当将这种预测能力转换为时间序列预测时,自然会认为这些ML算法应该是首选。好吧,也许不是。雅典国立技术大学的3位预测专家最近发表的一篇论文可能会给出相反的建议; 就时间序列预测而言,ARIMA或ETS等传统统计技术实际上可能提供更好的预测性能。 研究小组利用来自已知数据源M3竞赛数据的1045个时间序列数据子集,测量了8种传统统计技术和8种先进的ML技术的预测性能。他们研究的主要结果,以及艾哈迈德等人早期的研究,如下图所示,其中sMAPE%用作误差指标(越低越好): 统计和ML方法的性能之间有明显的区别。然而,作者进一步考虑了这些方法的计算复杂度。通常,许多统计方法都可以在标准笔记本上几秒钟内运行。相比之下,一些神经网络需要在快速gpu上训练数小时。考虑到这一点,计算复杂度的扩展显示如以下图表: 正如现在所预期的,有一整套统计技术(Holt-Winters, SES等),它们在计算上都非常简单,并且性能良好。作者继续写道: “学术的ML预测文献存在的一个问题是,大多数已发表的研究提供了预测,并声称其准确性令人满意,而没有将它们与简单的统计方法甚至朴素的基准进行比较。这样做提高了ML方法提供准确预测的期望,但没有任何实证证据证明这是事实。” 他们的工作清楚地强调了ML方法更好这一错误假设。这也不需要考虑ML方法减少的可解释性和不确定性管理。正如一位同事最近所言,复杂性不一定是创新。 在OMD EMEA的市场情报部门,我们每天处理各种数据类型和结构,尤其是时间序列数据。尽管ML算法将继续成为我们在所有数据结构上提供的高级分析的基础,但本文的工作表明,传统的统计和计量经济学建模技术仍有很多可提供的,成本非常低。 (以上是我的个人观点,并不一定反映OMD EMEA或任何Omnicom公司的观点) 以上内容由HR Tech China AI翻译,仅供参考
    数据
    2018年07月16日
  • 数据
    挖掘“人力资源”是人力资源未来的核心:专家 文/Marcel Vander Wier 用于导航不断变化的工作场所,职业发展的坚实工具 根据该领域的专家大卫格林的说法,雇主正在转向数据“以支持更好的决策,改善员工体验,并实际提高人力资源的影响力”。 英国伦敦分析专家大卫格林表示,在人力资源领域,随着“数字革命”的推出,人力资本分析正变得越来越重要。 “我们正处于一个巨大的变革时期,”他说。 “变化从来没有发生过这么快,可以说再也不会这么慢了。 公司现在似乎在不断变革,不断尝试发明新的产品或服务,以适应在世界上的生存和发展。 格林说,在过去两年中,人类收集的数据量是以前世界历史收集量的九倍。 格林最近在多伦多举行的人力资源技术论坛上表示:“这确实提升了CHRO和人力资源部门的作用,几乎成为公司内三个最重要的角色之一,与首席执行官和首席财务官并重。” 他说,自动化角色和技能培训需要适当的准备和人力规划,分析证明是一个可靠的导航工具。 分析状态 “分析和数据是人力资源数字议程的核心,”格林说。 “它可以帮助我们理解:我们需要的组织形式是什么? 我们公司需要哪些技能?" “分析可以真正帮助将所有这些结合在一起,为公司提供一定程度的确定性。” 他说:“从本质上讲,人力资源部门正在从营销人员的书中学习经验,许多人使用分析来做出近20年的决策。” 格林说,分析可以提供高达13倍的美元回报率。 “我们可以谈论的人力资源项目并不多。” 他说,为了追求高绩效团队,高级领导人已经接受了人力资本分析是成功的重要因素,促进了这一领域的进一步发展。 大大小小的公司都在转向这些数据,以“支持更好的决策,改善员工体验,并实际提升人力资源的影响力。” 格林说,数据驱动的文化和基础来自于将分析的好处传达给所有员工 - 而不仅仅是人力资源。 “要透明。 与员工沟通您收集的数据以及原因,对他们有什么好处以及对公司有什么好处。" 最佳做法 格林表示,人力资源数据质量和一致性仍存在挑战,但大多数雇主应该有足够的资金开始。 但仅凭数据还不够。 他说,用于分析的报告数据并不总是与业务相关。 “不要从数据开始。 从业务问题开始,然后您就可以开始了解需要哪些数据源来解决这个问题,"格林说, “这不一定是在人力资源范围内使用分析和数据。 我们必须尝试打破孤岛心态,真正集中精力解决我们的业务问题。" “通常情况下,一个组织试图解决的每个业务问题,都有个人的因素。” 他说,例如,将人员分析(如员工敬业度)与业务绩效联系起来是有帮助的。 让CHRO完全相信数据的力量在识别关键业务问题,联系利益相关者,将见解转化为行动也是有益的。 格林说:“这不是要在人力资源部门内创建一个团队。” “这是关于跨职能的协作......利用人力资源外部资源的能力确实是关键。” “高级人员分析团队使用多个数据源,”他说。 “这不仅仅是围绕内部人力资源系统或调查。” “ 请放心,并非所有人力资源部门都需要突然学会如何成为数据科学家 。” Green在收集数据和进行分析以给出可操作的见解之前,推荐了一种方法,构建业务问题和建立可靠的假设。 他说,出色的故事可以促使高层领导推动建议。 前面的路 虽然人力资源趋势进一步向人力资本,但是至少在最初阶段,管理期望是必要的。 “不幸的是,当人们投资人力资本分析时,他们预计会立即回归,”格林说。 “它不一定会发生,除非你碰巧用你工作的第一个项目挖到了黄金。” 他说,个性化的职业轨迹是人力资本分析的根据,数据为工人提供技能路径,使他们能够获得他们所希望的工作。 “这对员工来说非常好,因为它真的支持了职业发展,而且它真的为员工个性化......如果没有数据和分析支持,你就无法做到这一点。” 数据收集的道德和隐私需要尽早考虑,因为在欧盟运营的所有雇主现在都必须遵守“一般数据保护条例”(GDPR)中规定的数据保护规则。 格林说,81%的分析被道德或隐私问题“危害”。 “如果你无法向员工阐明收集数据或做人力资本分析项目的好处,也许你不应该做。” 但他表示,虽然数据,分析和其他新兴技术可以增加人力资源在组织内的影响力,但人力资源将始终处于实践的最前沿。 “这不是取代判断或经验,”格林说。 “这是为了强化它,并希望它变得更好。” 用科技平衡人类 人力资源和招聘服务提供商Randstad Canada的首席执行官Marc-Etienne Julien表示,在分析时代,人力资源保持人性化仍然很重要。 “利用技术的好处和保持人性化的方法并不相互排斥,”他说。 在劳动力市场短缺的时期,公司应该利用技术来简化求职者的求职和申请流程,以及自动化人力资源流程中的重复性工作。 朱利安说:“这使得雇主再投资时间在积累更多经验上,通过面对面互动建立人际关系的方式。” 他说,虽然工作领域变化迅速,但人力资源从业者明智地开始实施分析,以便应对特定和即时的挑战,例如高流动率或招聘特定技能的问题。 Julien说,用户体验应该是整个过程的核心焦点。 “优先考虑用户体验对于为求职者和员工开发可访问和可用的工作场所工具至关重要。 尽早让您的员工参与进来,因为他们是主要用户。" 他说,通过技术解决方案节省的时间,再投资培训项目。 以上内容由HR Tech Cina AI翻译,仅供参考
    数据
    2018年07月12日
  • 数据
    为什么非正式网络将彻底改变人力资源和人力资本分析? 文/Greg Newman 迄今为止,在利用全球人力资源和全球人力资源系统领域的非正式网络和团队的力量方面所做的工作很少。 团队合作的流动性和非正式性一直意味着在任何规模上都不可能捕捉到不断变化的团队成员和动态。 虽然由Karen Stephenson和Rob Cross等人开创的组织网络分析(ONA)背后的科学已经成熟,经过试验和测试,但是这些强大的数据点成为主流的能力一直是扩大这些洞察力的主要障碍。 毫无疑问,基于ONA的传统调查产生了很好的结果,但其“时间点”性质和高成本开销意味着虽然可以识别和衡量团队和联系,但几乎不可能保持数据最新。 非正式网络终于可见了 图1:揭示支撑正式级别结构的关系。 像我自己(trustsphere.com)这样的公司最近的技术飞跃已经将ONA从基于纸张的流程转变为实时连续的数据流,这改变了组织映射其非正式网络的能力,并了解工作真正完成的方式。 随着人力资源和新成立的人力资本分析/劳动力分析团队试图解决看似Sisyphean的挑战,试图衡量参与度,生产力和员工幸福感,作为一种直接的替代方案,ONA可以提供硬数据并回答特定的业务问题。 我预测2017年将成为ONA成为主流的一年,并最终得到应有的认可,因为它展示了它如何能够快速阐明这些类型的业务关键问题: 谁是我们最有影响力的员工? 图2:找到将网络连接在一起的隐藏影响者。 通过测量中心性,特征向量中心性(以及其他一些秘密调料),ONA可以快速量化员工施加影响的能力(甚至可以在组织内部实际影响他们的非正式网络)。这使组织能够在组织中找到可以帮助推动变革和支持业务转型的隐藏影响者。 我们实际上需要做谁的持续计划? 图3:谁拥有最独特和最有用的网络? 持续计划一直是一个相当公式化和粗略的过程,通过简单地查看员工在正式层级中的位置来确定目标角色。通过查看每个员工的网络,其独特性,隔离性和重叠量,ONA帮助组织找到那些对管理关键内部和外部网络至关重要的员工,以及实际应该进行持续计划工作的员工。下一步是了解哪个员工最适合,谁已经建立了类似的网络或显示可能的继任者的网络潜力。 我的员工如何融入在组织中? 图4:反映员工融入人际网络的改变。 从跟踪新的首发网络的速度和传播到识别隐藏的僵尸,吸血鬼和识别潜在的飞行风险,ONA可用于提供员工内部和外部网络的增长,平稳,停滞和收缩的实时洞察,员工总体参与和表现的主要信号。 良好的领导行为是什么样的? 图5:领导行为的量化证据。 衡量一线经理与其直接报告之间的强大关系数量,了解优秀领导者网络如何在整个组织中传播,并对最佳领导者的网络进行基准测试现在都是可能的。提供重要数据和面向行动的辅导建议可帮助组织培养自己的领导者。 我们在哪里协作得好,哪里不好? 图6:衡量个人和团队的协作。 衡量协作一直很困难,衡量协作的变化,几乎不可能,但ONA提供有关信息流,关系的力量以及个人及其工作的团队和单位的网络活动的数据。突然间,合作已经从抽象和理论,到可衡量和可行的。 ONA能够帮助识别所有这些行为和活动,然后监控其变化,这为世界各地的组织提供了识别,培养和留住顶尖人才的独特竞争优势。 人力资源团队非常关注组织的正式结构和级别结构,但随着市场中的计算进步和创新技术,最终有可能大规模地研究组织中的非正式网络。 以上内容由HR Tech China AI翻译,仅供参考
    数据
    2018年07月11日
  • 数据
    用数据管理企业形象,Convercent完成2500万美元E轮融资 致力于开发道德与合规软件的公司Convercent今日宣布完成2500万美元融资,Rho Ventures领投,Sapphire Ventures和Tola Capital跟投。 Convercent所提供的,用MBA的话来说就是“可操作的道德”。在日常状况中,就意味着帮助企业挖掘大量企业数据集(从全球销售到HR数据等),寻找潜在的道德风险。该公司发言人表示,这就好比给不道德行为制作热图。不过,不道德行为往往难以发觉,比方说,给当地官员的贿赂可能藏在一张表格的最深处。 此外,该公司还提供许多相关服务,包括给员工的报告系统——如果谁想揭露同事的不当行为,就可以使用这一系统;管理公司员工报告的工具;以及收集第三方供应商数据的服务。 Convercent透露,其工具迄今为止已经发现15.6万起不当行为(其中1000多起与性骚扰有关)。理想情况下,如果使用不到这些工具是最好不过了,但我们所生活的世界远远做不到这一点。Convercent联合创始人兼CEO Patrick Quinlan表示:“一则简短的社交媒体帖子就能让企业名声到底。不以当前道德标准规范自己的企业无法生存下来。” 该公司透露,2017年,其营收年增长率达60%。其中大部分归因于北美市场,不过欧洲和中东地区的需求也在强势增长。Convercent拥有将近600名客户,包括联合利华、金佰利、特斯拉、Uber、Zenefits、Under Armour、Airbnb和领英等。仅今年第三季度,该公司就收获29名新客户,其客户保留率也达到惊人的100%。 Convercent的一位发言人表示,此次新一轮资金将主要用于对其道德云平台进行更多创新。更具体来说,这家公司计划提升分析能力和数据科学技术,“为客户带来更多样、更标杆性的分析”。此外,该公司还计划推出全新的机器学习和人工智能项目,并将服务拓展到美国和EMEA地区(欧洲、中东和非洲)。 【来源:猎云网(微信号:ilieyun)】12月21日报道 (编译:可芮ccino)
    数据
    2017年12月21日
  • 数据
    在美国参加了3天SaaS会议,我看到了中国企业服务市场3-5年后的未来   2016 年春节期间到旧金山参加“SaaStr Annual 2016”,三天会议期间,每天写了一篇文章,并发布到朋友圈,不过这 3 篇文章不是很系统,这里把 3 篇文章汇总成一篇,作为这次行程的总结。   SaaStr.com 是个在美国 SaaS 领域非常有影响力的在线媒体和社区,创始人 Jason M. Lemkin 是连续创业者,对 SaaS 有很多独到看法。2012 年开始时还只是个对外传递观点的 WordPress 网站加上一些 Quora 问答,后来慢慢形成一个有影响力的 SaaS 在线社区。   SaaStr Annual 则是 SaaStr 举办的一个大型会议。去年第一年聚集了 2000 多名 SaaS 公司高层,而今年第二届,参加人数约在 5000 人左右,会议主题安排非常明确:产品、企业发展、投资、销售等,基本上每个场地每半天是一个明确主题,而且其中安排了一些投资人见面环节,创业公司可以提交商业计划书,申请和投资人见面。   这个会议中,现场讨论形式要比 PPT 演示更多。很多情况下是比较有影响力的主持人(SaaStr 创始人、媒体、投资人或公司高层)和嘉宾进行某个主题的讨论。这种形式对英语考验非常大,不像有个 PPT 基本上就可以理解演讲内容。当时我录了很多现场录音,没听清的回来慢慢听。   一个非常值得称赞的地方就是 3 天下来没听到一个以做推广为目的的演讲,基本上每个演讲都是谈经验、观点、讨论,用我们话讲,都是“干货”。国内相当多行业会议讲来讲去就成了软性甚至硬性宣传了。   这个会议的参加人和影响力,基本上还在美国范围,当时见到了几家总部在印度的公司,也见到了些从印度来的参加人,但没遇到另外有从国内去的人。我想一方面是因为这个会议比较新,另一方面也是因为 SaaS 业务地域性比较强。不过,我这次参加下来觉得收获非常大,如果要了解新进展,到这种汇集了全球最多、最优质行业资源的地方,还是能够非常好拓展视野。就这次参会感受,我想有下面几点:   美国 SaaS 已形成非常庞大且丰富的生态体系   这次会议上看到很多非常大的 SaaS 公司,有很多有十多年历史,有部分已经上市或获得非常高估值,比如 Salesforce、HubSpot、ExactTarget、Marketo,这些公司已经发展到很大。   同时市场上有大量新 SaaS 公司与大公司间形成竞争或协同的丰富关系。在会上见到很多小型公司,大部分公司产品非常聚焦到某个具体功能点,一点做到非常极致。如果把这些公司大略分一下,我觉得可以分成下面几类:   一类是大型通用型 SaaS。这些企业的功能并不局限到某行业或某个具体功能,而是为企业提供比较全面的 SaaS 解决方案,而且市场占有率比较高,已经形成一定平台效应,很多企业基于他们进行服务。   比如 Salesforce 不但提供 CRM 服务,还通过自建或收购对客户提供分析、社会化媒体监测、销售机会挖掘等服务。这次会议上,Salesforce 在大力推广他们 SaaS 联盟,希望 SaaS 企业加入他们平台。除在营销方面,我看到 HR 领域也有非常大 SaaS 企业发展起来。未来在一些企业基本运营层面上,会形成一些大规模的 SaaS 企业。比如从事法律服务的 SaaS 企业,也是有可能成长为这个领域的巨头。(美国法律行业非常大)   第二类是聚焦一点的通用型 SaaS。这种企业产品只专注在某个具体功能,具有行业普适性。比如一家数据分析公司,提供基于 CRM 数据分析工具(Salesforce 有投资);提供视频 Demo 的分析工具的公司;提供网站用户互动工具的公司;只针对支付数据进行分析的公司。   看下来,这类公司中做数据分析服务的是最多的。很多这样的公司都是依附于其他 SaaS 的数据或业务,并为 SaaS 提供服务,以一种中间件形式存在(我感觉还是应该算是 SaaS 而不是 PaaS 业务)。他们的存在让整个 SaaS 生态效率大幅度提升。这种企业可能规模不一定很大,我估计有些会独立发展,有很多也可能会被大公司收购。   第三类是垂直型 SaaS。这次会议上见到的垂直 SaaS 不多,但我了解到很多专注于某一行业的 SaaS 在美国发展非常好。比如 Veeva,一家服务医药公司的 SaaS 公司,为大型医药公司提供 CRM,研发流程等方面的服务。2007 年成立,2013 年在纽交所上市。我看到 Gartner 一个统计,全球软件行业中,27% 是垂直领域的软件应用。随着 SaaS 发展,预期未来会有更多行业的流程、软件向云端转化。   SaaS 在美国已经大小通吃   美国大型企业对 SaaS 的应用已经很成熟。感觉国内 SaaS 还是首先针对的是中小企业,大型企业应用云服务的确会有很大障碍。但是从美国发展看,未来“云”会大小通吃。   第三天的会议主题是企业如何应用 SaaS 服务,在上面看到像 Adobe、Intel 这样的大型公司都已经(至少是在某些环节上)形成体系化的 SaaS 应用方法论。他们分享了如何将不同 SaaS 应用进行组合,如何提升业务人员应用能力,可以看到他们应用已经非常深入。   在同 SaaS 公司接触过程中也感受到大型企业对 SaaS 的应用。在现场和很多家公司进行沟通,好几家公司都提到既服务大企业也服务小企业。有家公司开始面对中小企业,但他们一些客户快速发展成大型企业(客户是互联网公司),他们产品和服务也跟着做起来了。   中小企业对 SaaS 应用也非常普遍,特别是 SaaS 的发展对自己这个行业有“反哺”作用。所谓反哺,就是很多 SaaS 企业发展起来,同时他们也有企业服务需求,有很多 SaaS 公司就定位于 SaaS 公司,也得到非常好发展。   对于是否可以同时服务于大型和小型企业这个问题,沟通下来感觉答案是可行的,但最终取决于公司战略和产品特点,对不同企业,答案可能不一样。有的公司回答说:他们产品是非常标准化的,不管小型还是大型企业,可以同时满足他们需求,比如一个为网站提供网站上的用户沟通工具的公司。也有公司会提到,他们会提供定制化服务以满足大客户需求。   投资方仍旧非常看好   主会场有一天是投资人专场,几个非常有影响的投资公司对 SaaS 行业发表了看法,这些公司都投了很多 SaaS 企业,虽然那几天美国股市特别是科技股大跌,但他们还是表现了对 SaaS 领域的乐观。   首先,他们认为 On Demand 是整个社会大趋势。比如 Uber,实际上就把租车服务做成了“云”,就像有个司机在你旁边等着服务你一样,你需要时马上就来。软件、服务趋势也是可以 on demand,那么就是进入云端,成为 SaaS服务。   其次,虽然美国 SaaS 已经发展相当长时间,但仍旧有巨大空间。有投资者提到目前只有 2% 的软件 SaaS 化,未来将有大量软件走向云端。   第三,过去经验表明 SaaS 投资情况回报良好。一家投资多家 SaaS 公司的投资公司提到,他们投资的 SaaS 企业收益率是其投资公司平均收益率的 6.7 倍。   第四,近期美国股市以及科技股有很大波动,出现价值回归。投资方认为 SaaS 类企业如果健康,经过初期投入阶段,可以带来很好现金收入。投资方也认为 SaaS 企业应该扎实做好自己业务,给客户提供价值,其价值也会被认可。   数据,数据,数据   这三天下来感觉 SaaS 就是个数据生意。SaaS 特点是业务流程都在网上,运营者可以收集到客户大量数据。这些数据需要深入分析可以指导业务不断优化,这种模式是离线服务或传统软件无法媲美的。这就类似传统商业和电子商务的关系。相对传统业务来说,也可以说 SaaS 是一种具备学习能力的“智慧产品”。   基于 SaaS 这种特点,衍生出了大量数据分析应用。在现场展台看到最多的 SaaS 服务就是做数据分析的,基于 CRM、支付、客户服务和沟通数据、邮件等等。很多大型 SaaS 应用的核心功能也是数据分析。   对于美国的 SaaS 使用者来说,也非常深度地进行数据分析。比如在会议过程中,a/b 测试是个高频词汇,而且会从很多负责销售的人,而非做分析的人嘴里说出来。SaaS 客户在介绍经验过程中,会提到很多数据驱动的运营方法和技巧。在数据应用方面,感觉中国和美国差异的确非常大。   在 SaaS 环境下,数据开放性非常强。SaaS 间相互打通,数据流转、应用在不同场景。这样的好处是客户可以将各类应用进行灵活组合,很多企业在不同业务环节采用不同 SaaS,形成一套组合拳,能充分利用各个应用优势。这种 SaaS 的网络效应左右是非常大的。   数据在中国,我觉得数据对接状况和美国差异很大。我想存在两方面原因,一是 SaaS 生态不丰富,互相之间无法对接,只有自动化、标准化才可能通过技术手段让数据流动和应用起来。随着 SaaS 的丰富、未来数据打通情况会更普遍。第二个是商业环境和文化问题,特别是一些大公司对数据的把持,比如 PayPal 的数据就可以通过接口在企业授权的情况下与 SaaS 工具进行打通和分析。我不是很清楚企业是否可以将银联数据或支付宝做类似应用。数据流转起来,效率提升,能够增加大量社会价值。   SaaS 的商业逻辑   SaaS 产品具有自己特点和商业逻辑,美国企业在这方面已经摸索很多年,很多经验和方法论我们可以借鉴。   SaaS 特点是初期投入大,经过一个比较长投入后,如果发展良好,会有丰厚回报。由于 SaaS 的收入模型是按账户、时间、等级等收费,开始时客户基数小,但初期投入不小。即使看到客户数量和客户在快速增长,也可能在相当长期内亏损。经营者和投资方必须正确判断亏损实际情况。   SaaS 的业务运营已经有一套非常清晰的商业逻辑和分析指标。投资人、销售负责人花大量时间分析 ARR、CAC 等指标,并形成通过这些指标判断一家企业表现,或优化运营的方法论。很多数据分析类的 SaaS 工具,也是围绕用户以及这些指标来设计的,可以帮经营者分析并优化关键业务指标。SaaS 是非常数据驱动的一种业务形态。   销售是 SaaS 的发展引擎   不同于 to C 产品,销售在 SaaS 发展过程中非常重要。SaaS 产品往往不是技术驱动,其技术门槛不是很高,而商业模式设计和销售在发展过程中非常重要。有个投资人用“空气”来比喻 SaaS 销售的重要性,销售对 SaaS 来说不是水和食物,而是空气;没有水和食物几天会死掉,没了空气几分钟就会丧命。   SaaS 和传统软件不同一点是客户续费率非常重要。SaaS 产品的销售分成三个环节:Marketing、Sales、Post-sales。SaaS 商业成功的关键之一是增加客户生命周期价值,而非一次性交易价值。   第一次往往无法收回成本,因此如何让客户续约就成为关键。SaaS 公司都会专门部署一个 client/customer success 团队,负责客户的持续采购。这个部门经常会独立于销售团队,有些公司直接汇报给 CEO。这个角色和传统软件或产品的售后服务角色不同,续费率高低可能直接影响 SaaS 业务的生死。   自动化与人   SaaS 在商业运作中的大量应用将提升企业运作效率,让工作人员更轻松。在 SaaStr 会场看了几个营销类 SaaS 产品演示,包括 leads generation,与客户的多渠道沟通,邮件整合与邮件营销自动化,customer scuess 软件等。   由于我们自己也会做很多营销和推广工作,感觉如果使用上这些自动化工具可以大幅提升效率。国内自动化工具使用还不够普遍,未来 SaaS 在中国企业的大量应用,会很大程度提升中国企业运作效率。实际上早应用这些工具的企业,可以获得更大竞争优势。   做到流程自动化之后,SaaS 会更智能。比如 EverString 等公司基于企业数据进行购买需求预测。但未来像 EverString 这种带预测能力的应用会越来越多。这类应该还是会从美国这样的国家先发展起来,因为完善的数据是这类应用的基础,中国目前还处在初期阶段。   对于效率问题,这次到美国有很多个人感受。这次来旧金山和硅谷接触了不少在中国和美国都有工作经验的人,明显感到美国工作节奏要比国内慢,即使在美国互联网公司中。但由于整个商业运作的自动化程度高、工作合作者专业性高,其效率可能是比我们更高。   我说起来国内的 “996”(一些互联网公司早 9 点上班,晚 9 点下班,每周工作 6 天),很多人都吓一跳。而中国互联网(和其他很多行业)实际上在用人力(人的生命)来弥补由于系统和环境造成的低效。在斯坦福和旧金山到处看到锻炼的人。如果早回家,回去读书、发展自己兴趣、锻炼,生活品质提高,其产出效率也会提高。   SaaS 的冲击   云服务给企业提升效率同时,也会对很多岗位产生替代。一方面可能会替代掉 SaaS 应用方的一些岗位;另一方面,会对一些提供相关服务的传统企业带来巨大压力。   SaaS 的本质和工业机器人、自动驾驶是一样的,商业世界的数字化和自动化,可以称为是“商业自动化”的过程。SaaS 发展到一定程度,会产生对工作岗位的“挤压”。很多简单重复性工作可能被 SaaS 工作替代。如果 SaaS 的智能化程度提升,可能对更多岗位产生替代作用。机器代替或部分代替人工将是趋势,不过由于中国近期人力成本相对还是比较低,这个过程比发达国家会稍微慢一些。   另一方面,SaaS 会对提供类似服务和产品的行业产生巨大冲击。从相对发展更早一些的 IaaS(基础云服务,比如亚马逊和阿里云提供的存储、计算服务)看,其对传统服务器、存储和基础软件产生了巨大冲击,IBM、HP、Cisco 等公司的大量裁员,重要原因是基础云服务的发展。企业建立网站或互联网应用,已经不需要自己购买服务器、存储设备、租用 IDC 了,只要在云服务平台上进行租用即可快速建立自己的应用。   而 SaaS 是建立在 IaaS 基础之上的,随着各个行业 SaaS 的发展,   SaaS+人   SaaS 只是一种工具,要产生效果还需要人的有效操作。在会议期间,看到很多应用 SaaS 的企业已经积累大量经验。从应用 SaaS 的销售团队组建、业务流程,到自动化邮件的具体写法。   比如 Cloudera 的 global sales 的 VP 分享一个案例,在和一个客户邮件沟通过程中,按次序发了三封邮件,这三封邮件如何写可以提升转化。SaaS 邮件发送功能可以自动化,但是邮件的发送策略,不同内容的对比测试和优化方法,还需要有经验有想法的人来实现。   另外很重要的一点,就是 SaaS 的应用需要对数据有深刻洞察和应用能力的人。会议上的 SaaS 供应商和使用者都一再强调数据收集、处理、测试等数据应用。SaaS 特点是把流程线上化、云端化,就积累了大量有价值数据,这给数据驱动的运营提供了条件。中国企业数据分析和应用能力比较差,这对我们是个挑战。   目前 SaaS 在企业内应用相对较少,但近一年来,越来越多企业看到 SaaS 价值。但开始时会“唯工具论”,认为只要应用了 SaaS 工具就可以取得立竿见影的效果。但很多企业可能由于使用能力不足造成应用效果比较差。在国内有些 SaaS 应用有可能走工具+服务/咨询的道路,也会很多基于 SaaS 的咨询或执行类公司产生。中国的这种情况,也会是很多国外 SaaS 企业进入中国的障碍之一。   通过这个会议看到了中国企业服务市场 3-5 年后的未来,云服务将给企业服务和软件行业带来一场革命性变化。在这大趋势当中,传统企业面临挑战,但同时也有巨大机会。懂得商业逻辑、有商业服务能了的企业和个人,结合云计算技术,将创造巨大商业机会。   来源:硅发布 作者:云思科技(CloudXink)创始人兼 CEO 宗瑞兴,前新浪网市场与商业分析执行总监。
    数据
    2017年01月19日
  • 数据
    纯技术角度:从 MONGODB “赎金事件” 看安全问题 今天上午(2017年1月7日),我的微信群中同时出现了两个MongoDB被黑掉要赎金的情况,于是在调查这个事的过程中,我发现了这个事。这个事件应该是2017年开年的第一次比较大的安全事件吧,发现国内居然没有什么报道,国内安全圈也没有什么动静(当然,他们也许知道,只是不想说吧),Anyway,让我这个非安全领域的人来帮补补位。 事件回顾 这个事情应该是从2017年1月3日开始的,是由安全圈的大拿 Victor Gevers (网名:0xDUDE,GDI.foundation 的Chairman),他在2016年12月27日,他发现了一些在互联网上用户的MongoDB没有任何的保护措施,被攻击击把数据库删除了,并留下了一个叫 WARNING 的数据库,这张表的内容如下: { "_id" : ObjectId("5859a0370b8e49f123fcc7da"), "mail" : "harak1r1@sigaint.org", "note" : "SEND 0.2 BTC TO THIS ADDRESS 13zaxGVjj9MNc2jyvDRhLyYpkCh323MsMq AND CONTACT THIS EMAIL WITH YOUR IP OF YOUR SERVER TO RECOVER YOUR DATABASE !" } 基本上如下所示: MongoDB ransom demand (via Victor Gevers)说白了就是黑客留下的东西——老子把你的MongoDB里的数据库给转走了,如果你要你的数据的话,给我0.2个的比特币(大约USD200)。然后,他的twitter上不断地发布这个“赎金事件”的跟踪报道。与此同时,中国区的V2EX上也发现了相关的攻击问题 《自己装的 mongo 没有设置密码结果被黑了》 然后,在接下来的几天内,全球大约有1800个MongoDB的数据库被黑,这个行为来自一个叫 Harak1r1 的黑客组织(这个组织似乎就好黑MongoDB,据说他们历史上干了近8500个MongoDB的数据库,几乎都是在祼奔的MongoDB)。 不过,这个组织干了两天后就停手了,可能是因为这事已经引起了全球科技媒体的注意,产生了大量的报道(如果你在Google News里查一下“mongodb ransom”,你会看到大量的报道(中文社区中,只有台湾有相关的报道)),他们也许是不敢再搞下去了。 不过,很快,有几个copycats开始接着干, 马上跟进的是 own3d ,他们留下的数据库的名字叫 WARNING_ALERT,他们至少干掉了 930个MongoDB,赎金0.5个比特币(USD500),至少有3个用户付费了 然后是0704341626asdf,他们留下的数据库名字叫PWNED,他们至少干掉了740个MongoDB,赎金0.15个比特币(USD150),看看他们在数据库里留下的文字——你的MongoDB没有任何的认证,并且暴露在公网里(你TMD是怎么想的?)…… 0704341626asdf group ransom note (via Victor Gerves)就在这两天,有两个新的黑客也来了 先是kraken0,发现到现在1天了,干了13个MongoDB,赎金 0.1个比特币。 然后是 3lix1r,发现到现在5个小时,干了17个MongoDB,赎金0.25比特币。 BBC新闻也于昨天报道了这一情况——《Web databases hit in ransom attacks》,现在这个事情应该是一个Big News了。 关于MongoDB的安全 安全问题重来都是需要多方面一起努力,但是安全问题最大的短板就是在用户这边。这次的这个事,说白了,就是用户没有给MongoDB设置上用户名和口令,然后还把服务公开到了公网上。 是的,这个安全事件,相当的匪夷所思,为什么这些用户要在公网上祼奔自己的数据库?他们的脑子是怎么想的? 让我们去看一下Shodan上可以看到的有多少个在暴露在公网上而且没有防范的MongoDB?我了个去!4万7千个,还是很触目惊心的(下图来自我刚刚创建的 Shodan关于MongoDB的报表)   那么,怎么会有这么多的有对象显露的MongoDB?看了一下Shodan的报告,发现主要还是来自公有云平台,Amazon,Alibaba,Digital Ocean,OVH,Azure 的云平台上有很多这样的服务。不过,像AWS这样的云平台,有很完善的默认安全组设置和VPC是可以不把这样的后端服务暴露到公有云上的,为什么还会有那么多?   这么大量的暴露在公网上的服务是怎么回事?有人发现(参看这篇文章《It’s the Data, Stupid!》 ),MongoDB历史上一直都是把侦听端口绑在所有的IP上的,这个问题在5年前(2011年11月)就报给了MongoDB (SERVER-4216),结果2014年4月才解决掉。所以,他觉得可能似乎 MongoDB的 2.6之前的版本都会默认上侦听在0.0.0.0 。 于是我做了一个小试验,到我拉Ubuntu 14.04上去 apt-get install mongodb(2.4.9版),然后我在/etc/mongodb.conf 文件中,看到了默认的配置是127.0.0.1,mongod启动也侦听在了127.0.0.1这台机器上。一切正常。不过,可能是时过境迁,debain的安装包里已加上了这个默认配置文件。不管怎么样,MongoDB似乎是有一些问题的。 再到Shodan上看到相关的在公网裸奔的MongoDB的版本如下,发现3.x的也是主流:   虽然,3.x的版本成为了主流,但是似乎,还是有很多人把MongoDB的服务开到了互联网上来,而且可以随意访问。 你看,我在阿里云随便找了几台机器,一登就登上去了,还都是3.2.8的版本。 真是如那些黑客中的邮件所说的:WTF,你们是怎么想的? 后续的反思 为什么还是有这么多的MongoDB在公网上祼奔呢?难道有这么多的用户都是小白?这个原因,是什么呢?我觉得可能会是如下两个原因: 1)一是技术人员下载了mongod的软包,一般来说,mongodb的压缩包只有binary文件 ,没有配置文件 ,所以直接解开后运行,结果就没有安全认证,也绑在了公网上。也许,MongoDB这么做的原因就是为了可以快速上手,不要在环境上花太多的时间,这个有助于软件方面的推广。但是,这样可能就坑了更多的人。 2)因为MongoDB是后端基础服务,所以,需要很多内部机器防问,按道理呢,应该绑定在内网IP上,但是呢,可能是技术人员不小心,绑在了0.0.0.0的IP上。 那么,这个问题在云平台上是否可以更好的解决呢? 关于公网的IP。一般来说,公有云平台上的虚拟主机都会有一个公网的IP地址,老实说,这并不是一个好的方法,因为有很多主机是不需要暴露到公网上的,所以,也就不需要使用公网IP,于是,就会出现弹性IP或虚拟路由器以及VPC这样的虚拟网络服务,这样用户在公有云就可以很容易的组网,也就没有必要每台机器都需要一个公网IP,使用云平台,最好还是使用组网方案比较好的平台。 关于安全组。在AWS上,你开一台EC2,会有一个非常严格的安全组——只暴露22端口,其它的全部对外网关闭。这样做,其实是可以帮用户防止一下不小心把不必要的服务Open到公网上。按道理来说,AWS上应该是帮用户防了这些的。但是,AWS上的MongoDB祼奔的机器数量是最多的,估计和AWS的EC2R 基数有关系吧(据说AWS有千万台左右的EC2了) 最后,提醒大家一下,被黑了也不要去付赎金,因为目前来说没有任何证据证明黑客们真正保存了你的数据,因为,被黑的服务器太多了,估计有几百T的数据,估计是不会为你保存的。下面也是Victor Gevers的提示: (全文完) 关注CoolShell微信公众账号可以在手机端搜索文章 (转载本站文章请注明作者和出处 酷 壳 – CoolShell ,请勿用于任何商业用途) http://coolshell.cn/articles/17607.html
    数据
    2017年01月07日
  • 数据
    创业公司该从什么时候开始关注数据? 本文作者:张溪梦,GrowingIO创始人、CEO;前LinkedIn(领英)商务分析高级总监,亲手建立了LinkedIn(领英)90多人的商务数据分析团队。原文发于GrowingIO技术博客和公众号。   人人都说数据重要,那么,创业者应该从什么时候开始关注数据?从公司成立吗?我认为,当然不是。产品早期,数据驱动是个伪命题,只有到了真正增长期,数据才能爆发力量。   数据分析流于形式 我在LinkedIn做过很多年数据分析,发现中美在数据驱动这件事上面差异还是很大的。数据分析在国内一些特别大的企业才能得到重视,但是在美国,数据已经成为驱动众多企业增长的重要引擎。   为什么国内很多企业,表面上很重视数据分析,最后却流于形式?   许多公司处于疯狂增长时期,大家一拍脑子做的决定,可能已经产生很多价值了,这种情况下他们很难意识到数据决策能产生的巨大价值。同时,他们没有太多基础方法论的认知,技术和业务彼此不了解,进一步加剧了数据使用的缓慢,不能看到价值实现。最后就变成了凭感觉来做决策,而不是真正通过数据运营来做决策。   LinkedIn的数据驱动之路 但是我们看看美国,以LinkedIn为例, 在过去6年间从一个7000万左右年营收的企业,一下子增长至 30 亿美元营业额的企业,这种增长速度在企业服务领域里面是惊人的。6 年多以前,我第一次在 LinkedIn 的公司例会上,听到德鲁克的一句话:一个事情,如果不能衡量它,就不能增长它。这句话沉淀出了 LinkedIn 的企业价值观:增长带动数据分析,数据带动变现,变现进一步促进增长。   LinkedIn在早期就有清晰的数据框架,在只有一万个用户的时候就开始在用数据驱动用户增长。   LinkedIn是 2002年底成立的,成立早期就已经把用户数据和变现的框架讲得很清楚了。无论是在产品设计还是业务运营,数据都是很重要的环节。哈弗曼(LinkedIn 创始人 & CEO)收集大量的用户信息,想了三种变现方式: 一、通过用户的基本信息来变现,比如说公司发布职位; 二、用户数量增长到一定程度的时候,有 B2B 企业投广告; 三、当有大量人的信息以后,公司的猎头会用这个平台来找候选人。   变现的方式他想得很清楚,但并没有在第一天就去做,他核心关注的是用户体验和使用度,是整体的增长,增长产生大量的数据,他从数据里学习,未来才做变现。   LinkedIn 在只有 1 万用户的时候,就开始用数据驱动业务。这段时间去观测两个渠道,一个是电子邮件,一个是搜索。从数据里发现,从搜索引擎的渠道里进来的用户,比电子邮件邀请进来的人数量差不多,但在产品平台上的活跃度要高 3 倍。   这是之前没有想到过的,于是做了一个决定:如果要获取同样数量的用户,他们更愿意投入资源在使用频次更高、更愿意把时间花在这里的人,所以,放弃低活跃的用户,专注活跃的用户。   LinkedIn 每年反复要去问的一个问题是:如果只有一件事全公司要做的话,是什么?得用数字来证明的?   一星期内加到 5 个联系人的用户,他们的留存、使用频度、停留时间是那些没有加到 5 个联系人的用户的三倍到五倍,这是他们找到的驱动增长的魔法数字。但是当时这样的人非常非常少,于是他们在产品各个入口都增加社交关系。   LinkedIn 最早的时候,并不知道为什么增加社交关系会产生那么大的留存度,我们分析了起码有两三百个各种不同的指标,最后没有任何一个指标能告诉我们,就是因为这个原因。可是加权以后的结果是,这些用户在上面花了很多时间,间接就成为变现的可能。产品经理就把非常复杂的问题简化,让所有的东西都关注这一个点:让更多的用户在第一周里加到 5 个联系人。于是,增长飞快。   创业公司如何关注数据 每个阶段的重点不同,增长期是数据驱动的关键时期。虽然说数据很重要,那么,创业者应该从什么时候开始关注数据呢?从公司成立就开始吗?不是的。一般来说,创业者会经历 4到5个产品、企业的生命周期。   第一个阶段,冷启动。 这个时候公司特别早期,用大数据驱动是一个伪命题——因为客户数量有限,样本性不足。他们需要更多地去了解潜在客户的需求,去“求”客户来用这个产品。   第二个阶段,增长前期。 冷启动接近完成。有经验的创业者,会开始布局和增长有关系的一些核心指标,比如说日/月活跃,留存度。这些指标的目的不是为了衡量产品当前当下的表现,而是为了未来做增长时有可比较的基准。并且,这些指标能够告诉我们,什么时候我们应该去做增长。产品本身没有黏度的话,去烧钱做增长,它不会真正地增长起来,因为流失速度超过增长速度。以前很多烧钱的企业能成功,是因为竞争没有那么激烈,用户没有那么多种选择。但是今天如果你的产品很差,留存不高,口碑也不好,烧再多的钱也不能获得真正核心的自然增长。   第三个阶段,是增长期。 这个阶段就能看出来好的创业公司和普通创业公司的巨大差别——效率。无论PR还是做活动,都需要人力和时间成本。如何在增长中,找到效率最高的渠道?这个我觉得,是创业公司之间PK的核心竞争力。如果不做数据驱动,靠直觉,一次两次可以,但没有人能进赌场连赢一万次。所以,直觉需要和数据进行结合,这样企业能迅速优化各个渠道,来提高单位时间的转化效率。通过转化效率的提高和叠加,变成企业的核心竞争力。一个不用数据驱动的公司,和一个用数据驱动的公司,假设运营策略一样,资本储备类似,客户也一样,后者一定会胜出。   第四个阶段,是变现期。 业务变现,要求有很高的用户基数。一般互联网产品中高活跃、体验好的用户,会转化为付费用户。类似一个漏斗,不断地去筛,这里面就是要拼运营的效率了。比如说,电商用户的转化漏斗一般是:访问——注册——搜索——浏览——加入购物车——支付,或者到未来的退货。这是非常非常长的一个漏斗,真正要做好数据化运营,要对漏斗的每个环节持续地进行追踪。为什么呢?因为不能衡量,就很难去做增长。   一个好的企业,特别是以后要做营收的企业,必须要关注各个部门各个环节的转化效率。这种转化效率,要达成的手段,可以通过市场营销的方法、产品改进的方法、甚至客户运营的方法。而其中每个环节小幅提高,加在一起就是一个倍数的提高。这种倍增,如果没有做过数据化运营的人,很难体会到会有多大。比如,以前我们在LinkedIn做数据驱动转化时,要推送某篇EDM ,同样发给 10 万人,拍脑袋决策的转化是 0.01%,但是经由数据驱动部门做个简单的数据模型,同样推送后,转化率提升到了 0.3%,高出 30 倍。如果每周都那么做的话,这种转化效果还是非常可观的。   来源:36氪,作者:GrowingIO,如若转载,请注明出处:http://36kr.com/p/5053210.html
    数据
    2016年09月21日
  • 数据
    大数据服务还是那个大数据服务吗? 编者按:本文来源微信公号“智能研究所”(ID:HCR-TMT),作者慧辰资讯TMT研究部-张凤。 目前“人工智能”无疑是最流行的词之一,“大数据”是自2012年以来的流行词之一,现在大大小小的企业服务、论坛上都充斥着有关大数据、人工智能的内容,那么人工智能+大数据的生态模式究竟是怎样的? 2012年大数据是个流行词,没想到4年过后,在一些大数据论坛上还有人会说“如果我有大数据,我会怎样怎样……”好吧,如果还停留在如果上,就不该随便上论坛演讲,讲不好说不准工作都没了。现在大数据挖掘的技术都很成熟,更完善更系统的解决方案早已有人做得非常好。如果连数据都还没有,那就什么都不用提了。毕竟,人工智能+大数据的生态模式已经开启。 7月初,据外媒福布斯报道百度将人工智能+大数据为中国政府采集数据提供支持。7月13日,李彦宏在百度的开放云战略发布会上首度公开百度开放云“人工智能、大数据和云计算”三位一体的发展战略。为什么谷歌和百度都在人工智能领域重金发力?2015年百度投入研发创新的资金占公司总营收的16%。谷歌就不用说了,在量子计算这样离实现还遥不可及的技术上都已经投入很多研发资金。因为互联网未来向智能+发展的基础是数据。有数,有趋向完整的海量数据是现在所有巨头在布局人工智能+大数据生态模式的重点。 数据获取的最新模式:众包 众包是一种整合资源提升效率的方式,通过众包可以在集合海量数据中,筛选符合一定标准的有效数据,能够降低数据收集的成本,提高机器学习训练的效率。有个生物学家叫戴维•休斯(David Hughes),他和作物流行病学家马塞尔•萨拉斯(Marcel Salathé)将机器视觉技术和深度学习算法应用于农业病虫害智能防治上。他们将关于植物叶子的5万多张照片导入计算机,并运行相应的深度学习算法,针对在明亮的光线条件及合乎标准的背景下拍摄出植物的照片,最终程序正确识别率高达99.35%。如果在互联网上随机选取的植物叶子照片,其识别准确率将降至30%-40%,这也是目前视觉识别技术在复杂环境下尚未突破的地方。为了突破算法的限制,提高准确率,休斯和萨拉斯开发手机应用Plant Village,让世界各地的农民通过Plant Village上传患病作物照片,其中包含照片如何拍摄、拍摄地点、年份等大量数据,并包含农业专家对此做出相应诊断的信息。这种方式出现之后,数据获取的难度依旧聚焦在多维度数据资源的聚合,众包可以解决从分散的个体获取目标数据的问题,但对于基础数据资源层的扩张和占领依然是一场没有硝烟的砸钱战斗。 数多了怎么办:智能计算 有些人在努力获取数据,有些人在为数据多而未能充分利用而焦虑。 数据量级达到一定程度,再利用数据优化服务需要人工智能算法。随着企业数据量的积累,挖掘数据提高效率变成了必需。比如商业应用中打车平台的应用,国内平台滴滴与快滴合并之后,业务线从出租车扩张到专车、顺风车、公交等领域,数据范围猛增,数据量包含司机行为数据、顾客行为数据及各种路线数据、实时交通情况数据,定位数据等,据滴滴官方公布,滴滴出行每天处理的数据量达到70TB,由于订单处理响应时间的要求,单纯处理数据的效率已无法满足实时服务的需求,必须借助人工智能算法才能够进一步提升服务效果。从用户体验角度,也需要实现提升定位精准度,提高接单率,缩短应答时间。目前滴滴内部基于海量数据+机器学习算法的推荐匹配系统,针对海量司机的交班时间、地点、接单/拒单情况等海量数据进行司机画像,以此为基础,针对实时的订单数据,分配订单时实时按需分配,满足服务需求。从数据应用展现更宏观价值的角度来看,基于滴滴已有数据,可整合实时交通情况数据,包括拥堵路段、集中路线、集中商圈等多维度动态数据,进行结构化处理,达到整合一个城市的车辆分布,实现统筹平衡调度的目的。 大数据服务的现在及未来:智能+生态模式 未来人工智能+大数据生态模式将更多的应用于在商业场景下。我们认为,大数据服务未来将有以下四种模式: 一是形成数据资源和计算资源提供平台。当前企业数据大多仅留存于企业内部,在开发应用上一般也只有内部应用,企业之间数据各自孤立,独立计算,行业内尚未形成整合大数据,目前第三方数据采集、监测机构已经开始致力于多维数据的采集服务,包括外部数据的直接采集和企业内部数据的间接采集,已有第三方在提供基础数据库资源。未来伴随数据维度的丰富和数据量的扩大,第三方机构将采集并使用智能算法结构化处理形成相对完整的数据资源提供平台,并针对些海量数据的存储、整合及计算提供基于云端的平台式服务。 二是出现技术服务平台,包含提供Paas服务的开源平台及计算能力、大数据解决方案及技术服务支持。从目前人工智能和大数据企业发展来看,只有巨头和少数创业企业掌握核心算法及存储真正大数据,更多企业通过合作或建立产业联盟的方式获取行业或其他领域的数据。但对于数据的存储、处理和应用需要技术支撑且突破这些技术需要消耗大量人力物力财力,没必要所有企业都去做这件事。PaaS服务将数据处理能力作为模块开放出来,使得数据挖掘技术的使用门槛和成本大幅降低,更多企业有能力利用云端数据服务创造附加价值。因此形成Paas服务平台或解决方案技术服务平台,据此可以聚合数据资源,优化算法,提高准确率。另外也会形成基于数据存储、处理及挖掘技术的整体服务解决方案提供商,企业可以将数据服务完全外包给第三方机构,第三方机构也可以通过这种方式在云端整合资源并优化技术,提高准确率,同时产生推动行业发展的效果。 三是出现资讯服务平台。大数据产业相对仍是新兴产业,发展日新月异。一方面企业需要寻找大数据资源或技术服务平台,另外一方面第三方服务机构需要推广宣传自身及行业发展、技术发展现状。在这种背景下将出现起到桥梁作用的专业资讯服务平台,连接企业和第三方服务机构,同时起到发布整个行业前沿信息的作用。 四是出现交叉/垂直化服务应用。现阶段在教育、金融领域的垂直应用以及在未来智能营销、智能制造等交叉行业的应用。如在教育行业已出现利用积累的教、考、学环节的大数据结合深度学习算法推出个性化学习平台,如国外的Knewton、国内的智学网都是这种模式。未来将延伸至农业、制造业、交通、医疗等各行各业,出现如智能农业生产管理、智能交通、个性化精准医疗等创新服务。 本文转自36氪,如若转载,请注明出处:http://36kr.com/p/5049796.html
    数据
    2016年07月21日