数据 - HRTechChina.com - 向上的力量！

数据

创业公司该从什么时候开始关注数据？本文作者：张溪梦，GrowingIO创始人、CEO；前LinkedIn（领英）商务分析高级总监，亲手建立了LinkedIn（领英）90多人的商务数据分析团队。原文发于GrowingIO技术博客和公众号。人人都说数据重要，那么，创业者应该从什么时候开始关注数据？从公司成立吗？我认为，当然不是。产品早期，数据驱动是个伪命题，只有到了真正增长期，数据才能爆发力量。数据分析流于形式我在LinkedIn做过很多年数据分析，发现中美在数据驱动这件事上面差异还是很大的。数据分析在国内一些特别大的企业才能得到重视，但是在美国，数据已经成为驱动众多企业增长的重要引擎。为什么国内很多企业，表面上很重视数据分析，最后却流于形式？许多公司处于疯狂增长时期，大家一拍脑子做的决定，可能已经产生很多价值了，这种情况下他们很难意识到数据决策能产生的巨大价值。同时，他们没有太多基础方法论的认知，技术和业务彼此不了解，进一步加剧了数据使用的缓慢，不能看到价值实现。最后就变成了凭感觉来做决策，而不是真正通过数据运营来做决策。 LinkedIn的数据驱动之路但是我们看看美国，以LinkedIn为例，在过去6年间从一个7000万左右年营收的企业，一下子增长至 30 亿美元营业额的企业，这种增长速度在企业服务领域里面是惊人的。6 年多以前，我第一次在 LinkedIn 的公司例会上，听到德鲁克的一句话：一个事情，如果不能衡量它，就不能增长它。这句话沉淀出了 LinkedIn 的企业价值观：增长带动数据分析，数据带动变现，变现进一步促进增长。 LinkedIn在早期就有清晰的数据框架，在只有一万个用户的时候就开始在用数据驱动用户增长。 LinkedIn是 2002年底成立的，成立早期就已经把用户数据和变现的框架讲得很清楚了。无论是在产品设计还是业务运营，数据都是很重要的环节。哈弗曼（LinkedIn 创始人 & CEO）收集大量的用户信息，想了三种变现方式：一、通过用户的基本信息来变现，比如说公司发布职位；二、用户数量增长到一定程度的时候，有 B2B 企业投广告；三、当有大量人的信息以后，公司的猎头会用这个平台来找候选人。变现的方式他想得很清楚，但并没有在第一天就去做，他核心关注的是用户体验和使用度，是整体的增长，增长产生大量的数据，他从数据里学习，未来才做变现。 LinkedIn 在只有 1 万用户的时候，就开始用数据驱动业务。这段时间去观测两个渠道，一个是电子邮件，一个是搜索。从数据里发现，从搜索引擎的渠道里进来的用户，比电子邮件邀请进来的人数量差不多，但在产品平台上的活跃度要高 3 倍。这是之前没有想到过的，于是做了一个决定：如果要获取同样数量的用户，他们更愿意投入资源在使用频次更高、更愿意把时间花在这里的人，所以，放弃低活跃的用户，专注活跃的用户。 LinkedIn 每年反复要去问的一个问题是：如果只有一件事全公司要做的话，是什么？得用数字来证明的？一星期内加到 5 个联系人的用户，他们的留存、使用频度、停留时间是那些没有加到 5 个联系人的用户的三倍到五倍，这是他们找到的驱动增长的魔法数字。但是当时这样的人非常非常少，于是他们在产品各个入口都增加社交关系。 LinkedIn 最早的时候，并不知道为什么增加社交关系会产生那么大的留存度，我们分析了起码有两三百个各种不同的指标，最后没有任何一个指标能告诉我们，就是因为这个原因。可是加权以后的结果是，这些用户在上面花了很多时间，间接就成为变现的可能。产品经理就把非常复杂的问题简化，让所有的东西都关注这一个点：让更多的用户在第一周里加到 5 个联系人。于是，增长飞快。创业公司如何关注数据每个阶段的重点不同，增长期是数据驱动的关键时期。虽然说数据很重要，那么，创业者应该从什么时候开始关注数据呢？从公司成立就开始吗？不是的。一般来说，创业者会经历 4到5个产品、企业的生命周期。第一个阶段，冷启动。这个时候公司特别早期，用大数据驱动是一个伪命题——因为客户数量有限，样本性不足。他们需要更多地去了解潜在客户的需求，去“求”客户来用这个产品。第二个阶段，增长前期。冷启动接近完成。有经验的创业者，会开始布局和增长有关系的一些核心指标，比如说日/月活跃，留存度。这些指标的目的不是为了衡量产品当前当下的表现，而是为了未来做增长时有可比较的基准。并且，这些指标能够告诉我们，什么时候我们应该去做增长。产品本身没有黏度的话，去烧钱做增长，它不会真正地增长起来，因为流失速度超过增长速度。以前很多烧钱的企业能成功，是因为竞争没有那么激烈，用户没有那么多种选择。但是今天如果你的产品很差，留存不高，口碑也不好，烧再多的钱也不能获得真正核心的自然增长。第三个阶段，是增长期。这个阶段就能看出来好的创业公司和普通创业公司的巨大差别——效率。无论PR还是做活动，都需要人力和时间成本。如何在增长中，找到效率最高的渠道？这个我觉得，是创业公司之间PK的核心竞争力。如果不做数据驱动，靠直觉，一次两次可以，但没有人能进赌场连赢一万次。所以，直觉需要和数据进行结合，这样企业能迅速优化各个渠道，来提高单位时间的转化效率。通过转化效率的提高和叠加，变成企业的核心竞争力。一个不用数据驱动的公司，和一个用数据驱动的公司，假设运营策略一样，资本储备类似，客户也一样，后者一定会胜出。第四个阶段，是变现期。业务变现，要求有很高的用户基数。一般互联网产品中高活跃、体验好的用户，会转化为付费用户。类似一个漏斗，不断地去筛，这里面就是要拼运营的效率了。比如说，电商用户的转化漏斗一般是：访问——注册——搜索——浏览——加入购物车——支付，或者到未来的退货。这是非常非常长的一个漏斗，真正要做好数据化运营，要对漏斗的每个环节持续地进行追踪。为什么呢？因为不能衡量，就很难去做增长。一个好的企业，特别是以后要做营收的企业，必须要关注各个部门各个环节的转化效率。这种转化效率，要达成的手段，可以通过市场营销的方法、产品改进的方法、甚至客户运营的方法。而其中每个环节小幅提高，加在一起就是一个倍数的提高。这种倍增，如果没有做过数据化运营的人，很难体会到会有多大。比如，以前我们在LinkedIn做数据驱动转化时，要推送某篇EDM ，同样发给 10 万人，拍脑袋决策的转化是 0.01%，但是经由数据驱动部门做个简单的数据模型，同样推送后，转化率提升到了 0.3%，高出 30 倍。如果每周都那么做的话，这种转化效果还是非常可观的。来源：36氪，作者：GrowingIO，如若转载，请注明出处：http://36kr.com/p/5053210.html

数据
2016年09月21日
数据

大数据服务还是那个大数据服务吗？编者按：本文来源微信公号“智能研究所”（ID：HCR-TMT），作者慧辰资讯TMT研究部-张凤。目前“人工智能”无疑是最流行的词之一，“大数据”是自2012年以来的流行词之一，现在大大小小的企业服务、论坛上都充斥着有关大数据、人工智能的内容，那么人工智能+大数据的生态模式究竟是怎样的？ 2012年大数据是个流行词，没想到4年过后，在一些大数据论坛上还有人会说“如果我有大数据，我会怎样怎样……”好吧，如果还停留在如果上，就不该随便上论坛演讲，讲不好说不准工作都没了。现在大数据挖掘的技术都很成熟，更完善更系统的解决方案早已有人做得非常好。如果连数据都还没有，那就什么都不用提了。毕竟，人工智能+大数据的生态模式已经开启。 7月初，据外媒福布斯报道百度将人工智能+大数据为中国政府采集数据提供支持。7月13日，李彦宏在百度的开放云战略发布会上首度公开百度开放云“人工智能、大数据和云计算”三位一体的发展战略。为什么谷歌和百度都在人工智能领域重金发力？2015年百度投入研发创新的资金占公司总营收的16%。谷歌就不用说了，在量子计算这样离实现还遥不可及的技术上都已经投入很多研发资金。因为互联网未来向智能+发展的基础是数据。有数，有趋向完整的海量数据是现在所有巨头在布局人工智能+大数据生态模式的重点。数据获取的最新模式：众包众包是一种整合资源提升效率的方式，通过众包可以在集合海量数据中，筛选符合一定标准的有效数据，能够降低数据收集的成本，提高机器学习训练的效率。有个生物学家叫戴维•休斯（David Hughes），他和作物流行病学家马塞尔•萨拉斯（Marcel Salathé）将机器视觉技术和深度学习算法应用于农业病虫害智能防治上。他们将关于植物叶子的5万多张照片导入计算机，并运行相应的深度学习算法，针对在明亮的光线条件及合乎标准的背景下拍摄出植物的照片，最终程序正确识别率高达99.35%。如果在互联网上随机选取的植物叶子照片，其识别准确率将降至30%-40%，这也是目前视觉识别技术在复杂环境下尚未突破的地方。为了突破算法的限制，提高准确率，休斯和萨拉斯开发手机应用Plant Village，让世界各地的农民通过Plant Village上传患病作物照片，其中包含照片如何拍摄、拍摄地点、年份等大量数据，并包含农业专家对此做出相应诊断的信息。这种方式出现之后，数据获取的难度依旧聚焦在多维度数据资源的聚合，众包可以解决从分散的个体获取目标数据的问题，但对于基础数据资源层的扩张和占领依然是一场没有硝烟的砸钱战斗。数多了怎么办：智能计算有些人在努力获取数据，有些人在为数据多而未能充分利用而焦虑。数据量级达到一定程度，再利用数据优化服务需要人工智能算法。随着企业数据量的积累，挖掘数据提高效率变成了必需。比如商业应用中打车平台的应用，国内平台滴滴与快滴合并之后，业务线从出租车扩张到专车、顺风车、公交等领域，数据范围猛增，数据量包含司机行为数据、顾客行为数据及各种路线数据、实时交通情况数据，定位数据等，据滴滴官方公布，滴滴出行每天处理的数据量达到70TB，由于订单处理响应时间的要求，单纯处理数据的效率已无法满足实时服务的需求，必须借助人工智能算法才能够进一步提升服务效果。从用户体验角度，也需要实现提升定位精准度，提高接单率，缩短应答时间。目前滴滴内部基于海量数据+机器学习算法的推荐匹配系统，针对海量司机的交班时间、地点、接单/拒单情况等海量数据进行司机画像，以此为基础，针对实时的订单数据，分配订单时实时按需分配，满足服务需求。从数据应用展现更宏观价值的角度来看，基于滴滴已有数据，可整合实时交通情况数据，包括拥堵路段、集中路线、集中商圈等多维度动态数据，进行结构化处理，达到整合一个城市的车辆分布，实现统筹平衡调度的目的。大数据服务的现在及未来：智能+生态模式未来人工智能+大数据生态模式将更多的应用于在商业场景下。我们认为，大数据服务未来将有以下四种模式：一是形成数据资源和计算资源提供平台。当前企业数据大多仅留存于企业内部，在开发应用上一般也只有内部应用，企业之间数据各自孤立，独立计算，行业内尚未形成整合大数据，目前第三方数据采集、监测机构已经开始致力于多维数据的采集服务，包括外部数据的直接采集和企业内部数据的间接采集，已有第三方在提供基础数据库资源。未来伴随数据维度的丰富和数据量的扩大，第三方机构将采集并使用智能算法结构化处理形成相对完整的数据资源提供平台，并针对些海量数据的存储、整合及计算提供基于云端的平台式服务。二是出现技术服务平台，包含提供Paas服务的开源平台及计算能力、大数据解决方案及技术服务支持。从目前人工智能和大数据企业发展来看，只有巨头和少数创业企业掌握核心算法及存储真正大数据，更多企业通过合作或建立产业联盟的方式获取行业或其他领域的数据。但对于数据的存储、处理和应用需要技术支撑且突破这些技术需要消耗大量人力物力财力，没必要所有企业都去做这件事。PaaS服务将数据处理能力作为模块开放出来，使得数据挖掘技术的使用门槛和成本大幅降低，更多企业有能力利用云端数据服务创造附加价值。因此形成Paas服务平台或解决方案技术服务平台，据此可以聚合数据资源，优化算法，提高准确率。另外也会形成基于数据存储、处理及挖掘技术的整体服务解决方案提供商，企业可以将数据服务完全外包给第三方机构，第三方机构也可以通过这种方式在云端整合资源并优化技术，提高准确率，同时产生推动行业发展的效果。三是出现资讯服务平台。大数据产业相对仍是新兴产业，发展日新月异。一方面企业需要寻找大数据资源或技术服务平台，另外一方面第三方服务机构需要推广宣传自身及行业发展、技术发展现状。在这种背景下将出现起到桥梁作用的专业资讯服务平台，连接企业和第三方服务机构，同时起到发布整个行业前沿信息的作用。四是出现交叉/垂直化服务应用。现阶段在教育、金融领域的垂直应用以及在未来智能营销、智能制造等交叉行业的应用。如在教育行业已出现利用积累的教、考、学环节的大数据结合深度学习算法推出个性化学习平台，如国外的Knewton、国内的智学网都是这种模式。未来将延伸至农业、制造业、交通、医疗等各行各业，出现如智能农业生产管理、智能交通、个性化精准医疗等创新服务。本文转自36氪，如若转载，请注明出处：http://36kr.com/p/5049796.html

数据
2016年07月21日
数据

这家公司要用NLP技术提供企业情报服务要让机器理解人类的话语，自然语言处理（NLP）是其中的关键技术。微软将这一技术用在了小冰、Cortana这样的虚拟助手，以及Skype的实时翻译上；Facebook智能助手M的核心技术之一也是NLP。但稍微调戏一下就会发现，这些通用的虚拟助手往往会答非所问，而M的背后更是有人类训练师的支撑。但这并不妨碍NLP技术在特定领域解放人力。玻森数据通过中文语义分析开放平台为开发者提供NLP API服务，目前有15个处理引擎，其中3个供内部使用，能实现文本的信息分类、情感分析、实体识别、文本聚类和关键词提取等功能，主要服务对象是咨询公司、金融及媒体机构。比如，商家可以用相关引擎分析用户对产品的评价。玻森联合创始人李臻介绍，一些实验室也有做NLP引擎，但一般会针对具体的问题，而商业化语义引擎则要能快速进入某个领域，提供快速、标准的服务。目前有约4000开发者在使用玻森数据引擎。玻森引擎对本文的摘要分析 2015年初，出于政府信息公开力度加大的原因，玻森开始开发企业情报服务系统“风报”。它以玻森的NLP引擎为基础，根据政府文书、新闻报道、公司内部文件、财务数据和行业指数等（非）结构数据，分析公司的经营信息，用于风险控制和情报分析。以往了解一家公司可能需要自行查询政府数据库，并搜索相关媒体报道才能形成初步判断，但李臻表示，他们可以按时间、性质和事件形成公司的完整报告。这显然能节省不少时间。提供企业信息服务的公司不少，有天眼查、企查查、启信宝等。李臻告诉记者，风报的核心是分析能力。企业信息涉及很多裁判文书，提炼关键信息要进行去重、实体抽取、分词、清洗及分析等，这这些不是信息汇总就能完成的。之所以选择企业情报服务是因为有一定的行业基础。玻森联合创始人之一的纪敏曾负责数十个企业上市及并购项目，具有丰富的投融资经验。风报中的关系挖掘展示李臻表示，玻森的主要优势在于NLP及语料库两方面。玻森引擎自2006年开始，到2013年正式进行项目研发，有较长时间的技术积累，NLP引擎能进行半监督半自动化的学习。它已经在汽车、新闻和体育等行业有所应用。以汽车为例，可以为汽车之家这样的网站提供汽车咨询，客户访谈方面的分析，这需要对文本信息进行分词、抽取等，结合行业用户的知识体系再做引擎开发。李臻表示，目前少有其它公司用NLP做企业情报分析，因为NLP技术有比较高的进入门槛，一方面需要大量语料库的积累，另一方面需要对应用场景有深入理解的行业专家。另外，目前主流的NLP技术以统计机器学习为基础，这就需要大规模的语料库，没办法做通用处理，需要根据行业进行定制。机器学习近二十年的进展很迅速，“更多的数据胜过更好的算法”成了业内许多人的共识。在良好算法的基础上，语料对NLP模型的准确性和通用性非常重要。而玻森目前在中文分词、实体识别、关系抽取、情感分析上积累了上百万条标注语料。未来，玻森还会开发机器人客服系统，这也是NLP应用较广泛的领域，比较知名的公司有智齿客服。甚至，它还有图像处理产品研发的打算，按李臻的说法，图像识别所用算法与NLP相近。联想到国外知名创业公司MetaMind在2015年从NLP领域转型到图像分析，这并不是令人意外的产品路线。来源：雷锋网

数据
2016年06月28日
数据

Uber 设计总监为你分享 Uber 增长团队背后的故事充满激烈竞争的叫车市场上，Uber 是怎么做到一枝独秀，快速将业务铺展到全世界各个国家的呢？这跟它的增长团队分不开关系。本文就通过 Uber 内部人士的介绍一，还原这个团队的本来面貌。创见干货： Uber 如今开始逐渐成为我们生活中必不可少的工具。不知不觉中，我们在出门的时候都会习惯性的掏出手机，在屏幕上点上几下，安心等待电话的到来。充满激烈竞争的叫车市场上，Uber 是怎么做到一枝独秀，快速将业务铺展到全世界各个国家的呢？这跟它的增长团队分不开关系。本文就通过 Uber 内部人士的介绍一，还原这个团队的本来面貌。在我加入 Uber 的时候，我还没有听说过「增长团队」。后来公司搞了这样一个团队出来，在团队启动的当天，我们的 CEO 着重强调了这个团队的重要性，他告诉我们，这个团队的目的就是要拉升公司业务的发展。出于好奇，我自发地报名参与到这个团队当中，成为了设计上的负责人。我们一开始的团队人数很少，只有两个设计师，还有几个工程师、产品经理和分析师，两年过去了，我们已经成长成为了一支 300 人的大部门，光是设计团队就有 30 人。设计在增长团队完成使命的过程中扮演着非常重要的作用，设计师应该融入到「以指标数据作为导向」的文化中。从那个时候开始，我和我的团队成员开发出来了一套方法，它既能带来商业发展所需要的高速增长，而且团队行动速度很快，工作质量很高。接下来我就将介绍这套方法，希望大家都能受益。我们将「科学」和「艺术」相结合增长团队的设计师对于每一个项目都采取的是一种「实验方法」。我们一开始，首先要确认某个标准，这个标准将用来判定我们这次设计是否成功，标准本身可以是量化的（比如有多少司机注册，有多少乘客叫车），也可以是定性的，（比如易用性），又或者是两者兼有。一旦我们确认了什么是成功，然后我们开始不断尝试着方法，提出不同的假设，围绕着假设去做实验。当设计完成后，我们展开测试，通过我们的调研团队，展开一次用户方面的测试，要么将某些设计应用到某一小撮的用户群那里，要么是就是把设计推广覆盖到全用户，然后紧密地观测各项数据的变化情况。如果我们达到了理想的目标，我们将确认之前的假设成立，全面地使用这项设计，然后马不停蹄地继续下一个项目；如果我们没有达到理想状态，我们将从站不住脚的假设上吸取经验，反思总结，然后在解决方案上进行迭代更新。上面的这个操作流程让人很容易联想到一名化学家躲在实验室，头上带着护目镜，两只手各拿着一个装着不明液体的试管，同时向某个容器里倒入，所谓设计，并不是人们想的那样，一名画家在画布上尽情地泼墨绘画。我们不是碰运气，又或者是诉诸于某种迷之灵感，我们是要将自己的设计决策，建立在被证实的一个个事实基础上，并从错误尝试中不断汲取经验教训。这种方法能够让我们在可控，且可理解的方式下，给公司不断提供增长的动力。我们一头扎进数据的海洋增长团队的设计师热爱数据，我们紧密地跟数据分析师、产品经理进行合作，不断地发掘与项目有关的各项关键指标，虽然我们设计师不做实际的分析，但是我们是必须围绕一些关键概念来开展工作的，这些关键概念包括了「点击率」、「用户获取成本」、「某项数据的权重」等等。我们持续的跟踪数字的变化，利用分析报告中所得出结论来完善后续的设计。当项目开始的时候，我们从数据中寻找某种能够作证一些假设的趋势，以及我们从用户调研中能够了解到什么。如果我们想要说服团队将项目放到产品路线图上，那么我们肯定是用数据来做支撑。这样做使得我们永远把精力放在正确的问题上，而不是「猜」下面该做什么。当设计项目完工，数据会来验证我们的设计产生了多大的效果。我们通过追踪、评估某些关键指标，来确保我们的设计结果符合之前的预期。就比如说，如果我们现在正在设计一个全新的注册功能，我们将关注下面的这些指标：「按钮点击率」、「转化率」、以及「账户新增数量」等等。如果我们在这些指标上没有看到相应的改善，我们就会不断地去迭代更新设计，直到有一天，各项指标都达到了预定的标准，这项功能才会全面地推向全体客户。这保证了我们工作的有效性，步步稳赢，稳扎稳打，一个项目做好了之后才会进入到下一个项目当中。我们做的更多我们的方法非常依赖于「AB 测试」，所以你可以想象得到，我们对于每一个需要解决的问题，设计出来肯定不只一套解决方案。但是，尽管要设计出好几套方案，我们也不是没有目的的。西方有句谚语是：把所有的面条扔到墙上，看哪个能够挂住。我们并不会以这样的方式，让运气来决定项目的成败。我们要仔细的甄选每一套解决方案中的变量都是哪些，每一套解决方案的背后都有一个非常清楚的「假说」。我们确保每一套解决方案都是有着自己清楚的逻辑路径，完成质量都很高。我们将不同的解决方案放到一小撮客户那里进行试验，直到最后，我们进行最后的评估，最终有一个解决方案能够胜出。就比如说，当我们在设计准备投放到 Facebook 上的广告，以争取到更多的司机前来合作的时候，我们不断地去测试各种标题方案，不同样式的标题带来不同的视觉效果，我们要从中找出哪个方案最能够捕捉到用户的注意力。每一个方案其实都很好地表达了 Uber 的理念，但都是从某一个角度切入，强调了品牌和服务的某一面…… 这样的测试会起到两个作用。首先，它将我们的设计效果最大化。如果我们仅仅是把我们想当然觉得最好的解决方案推出来，我们很有可能错过那个最贴合市场心理需求的方案；如果我们拿出来好几个，我们就有更大的可能性来取悦客户；其次，它能帮助我们成长。在不同的媒介，面向不同的客户，哪些方案起作用，哪些没有，这些都会一点一滴地汇聚起来，成为非常宝贵的知识库。我们将这些学习到的东西带到了未来更多的项目中，并且在下一次能够带来更加多元化，更加富有想法的「候选方案」。我们做的更少我们的设计要遵循「事半功倍」的原则。我们争取一个小小的改动能够带来特别大的影响，尽可能不会彻底地将一个产品或者功能推倒重来，我们永远在寻找着最简单，最易执行，最轻量级的解决方案。举个例子，我们在乘客的 Uber App 里考虑如何在「给予（获得）一次乘车机会」功能上做文章，我们一开始只是简单地将菜单链接从「分享」改成了「免费乘车」。这种文字描述上的改动，能够将这个功能的全部价值给体现出来，也就极大地鼓励了更多的用户邀请他们的朋友来体验。这样的改动从设计上完全不需要花费几个小时，设计师可以把省出来的时间用在打造，测试另外全新的功能上面。这种追求「做的更少」的思路，其实能让我们做的更多。我们在每个项目上面做更多的迭代，在 A/B 测试中引入更多的变量，而且在一定的时间内开发更多的项目。「做得更少」并不意味着我们不去做某些大型的设计项目，它的意思永远都是优先考虑最简单易行的解决方案，不浪费任何时间。我们行动迅速行动迅速能够最大化我们的影响力，我们越快地拿出设计作品，我们越快能从调研和 A/B 测试中得到真知灼见。这些学习成果会有效定改善下一次迭代，帮助我们的项目加速驶向成功。我们在每一个项目上越快得到满意的结果，我们整个部门所具有的价值也就越大。事实上，速度是 Uber 能够成功的关键，也是它的核心战略要求。当越来越多的人进入到这个平台中，Uber 对于整个世界的影响力也就越大。路上跑着越多的 Uber 司机，乘客等待车的时间也就越短；越多人在平台上叫车，司机也就不用辗转好几个地方来接送乘客，他每完成一单紧接着就进入到下一单的工作当中。事实上，叫车软件的竞争就是速度上的竞争，谁能在最短的时间内争取到最多的乘客和司机，谁就是这个领域的主宰者。但在「速度先行」的同时，摆在我们面前的挑战是我们仍然需要深度地思考一些问题，需要不断地完成自己的设计，我们开设了好几个项目，这些项目有一些功能是共通的，我们会召开跨各个部门的头脑风暴会议，让团队里的每个人都能参与到讨论当中，大家各抒己见，力求在会上能够得出最棒的想法。我们聚在一起不断地画草图，简单地勾勒出某一种设计方案，然后在经过筛选和打磨之后，再在某些方案上投入更多的时间。我们会不断地审视自己的工作，确保不会陷入歧途，浪费时间。我们没有忘记这世界上还存在着「魔法」尽管我们的关注点一直放在「数据」和「指标」上，但我们仍然不会忽视设计工作在情感层面给人带来的影响。Uber 的公司文化中有一条就是：「去创造魔法」。一个设计作品如果在我们的眼中达到了成功的标准，那么它不仅仅是完成了我们既定的增长目标，而且会让人觉得这个设计上有着「魔法」一般的魅力。它有可能是令人愉悦的互动，动画，又或者是精美的图片，亦或是打动人心的文字。魔法是无法用简单的指标进行衡量的，但是我们仍然看重它。我们时钟强调在自己的工作当中要存在一些能够打动人心的东西，这是我们团队最引以为傲的地方。本文来源：Medium 译文创见首发由 TECH2IPO/创见花满楼编译转载请注明出处

数据
2016年06月01日
数据

人人都在说SaaS热，客服领域里的SaaS巨头可能长什么样呢就在移动浪潮铺天盖地席卷了C端市场后，企业级软件市场也从传统PC时代装机卖软件模式过渡到SaaS模式，最近几年，中国SaaS市场以30%的年复合增长率保持着高速增长，企业级SaaS服务的风口正在积聚力量，快速渗透企业办公服务所涉及的市场、销售、客服、沟通、财务、采购、HR等各个层面。作为其中垂直细分市场，SaaS客服也已全面打开。 SaaS客服列队成三大阵营我国SaaS智能客服市场的发展除了人力成本的上升、移动互联网技术的普及和移动社交场景的涌现以及自然语言处理与机器学习技术的进步外，更多的是由特殊的时期和国内环境共同影响带来的机会。首先，企业客服市场潜力被释放。客服一直是企业工作中不可或缺的组成部分，易观预测到2017年，中国SaaS客服市场交易规模将增长至680亿元人民币，这一方面是因为企业基数大，根据工商总局统计的数据显示，截止2015年底，国内注册有25万家大型企业、中型企业350万家、小型企业150万家以及微型企业1500万家，他们对客服的需求旺盛而迫切。另一方面是因为客服工作变得越来越重要。一份来自Zendesk的统计报告显示：78%的受访者将客户服务列为影响供应商信誉的第一要素；62%的B2B和42%的B2C用户在享受到好的客户体验后会购买更多的产品；66%的B2B和52%的B2C用户在遭遇糟糕的客户服务互动后会停止购买产品；88%的人在购买决策时受到网络评论的影响......在市场竞争白热化的态势下，企业销售的不再单单是产品，用户更加在意与产品配套的客户服务。其次，国外巨头挤不进来。这一是因为国家有明确的政策监管，SaaS业务需要IDC托管服务，也就是国外企业要想在中国境内从事类电信服务，必须在国内有商业存在，且占股不得超过51%。所以微软、SAP、IBM才会分别找了世纪互联、中国电信、首都在线合作。二是由于企业客户对用户访问和使用速度要求极高，这就要求服务器会能在本地部署，但Zendesk等创业型企业并无财力支撑服务器在中国落地，从而给国内企业留足了时间和空间。最后，企业级市场需要更好的客服系统。当前客服行业一部分是传统电话客服软件，此类模式容易引起客服人员听说易疲劳，工作强度大，流失率高，工作效率低，客户体验差，客服投诉率高，也增加了企业人工成本。一部分是网页在线客服，虽然客服成本明显降低，但基于WEB的在线客服无法记录访客信息，无法找回客户，无法将服务流程中的发货、物流信息及时传递给客户，而且语音方式无法支持复杂业务，不利做统计分析、数据挖掘。同时随着社交媒体的快速发展，客户服务渠道呈多样性碎片化，这就要求企业客服能支持如电话、网页，微信、QQ、APP等多种渠道的接入，再加上智能手机的普及和用户习惯的养成，员工人手一部智能手机，让手机替代PC实现企业管理和信息化成为可能，以及传统企业无法享用传统昂贵的软件解决方案。于是就出现了一批如Udesk、环信、云软、智齿等专业的SaaS客服公司。如今征战于企业SaaS客服市场的各类平台已形成三大派系，正相争相杀。第一派：智能机器人客服，如2014年京东推出的JIMI、2015年阿里推出的“小蜜”、网易系的七鱼云客服和云问等，它们依托最新深度学习技术，采用智能语义分析技术打造，拥有更好的语义理解能力，可以处理更口语化的问法，并且具有自主学习能力。云问目前已成为海尔商城、360、酷派商城、巨人游戏、猪八戒网等科技公司的智能客服合作商，但目前多数尚未对外商用。第二派： IM转移到APP客服，如：环信、容联、极光IM等。他们主要区别于电话的同步沟通模式，因为接打电话时客服人员很难再完成其他任务。而APP客服模式则是异步沟通模式，客服人员可以同步地去完成其他任务，有利于在移动互联网环境下提高工作效率且符合消费者的碎片化操作习惯。第三派：全渠道整合客服系统，如云软IMCC、Udesk、逸创云客服等。他们将微信、微博、邮件、电话、移动APP、Web、即时通讯（IM）等多渠道优化整合，客服人员只需在一个平台上就能处理所有渠道的问题。2015年5月，逸创云客服获得由唯猎资本领投的1500万人民币和金蝶战略投资的1000万人民币A轮融资。云软则首创以即时通讯消息为主要入口的SAAS客服平台，去年云软获得深圳前海鹏德移动互联网创业投资基金2千万人民币的A轮融资。未来可期，但难点又在哪随着更多新晋品牌的闯入和巨头的掺和，SaaS客服市场势必会在经历一段残酷厮杀后进入寡头时代，那洗牌之前，整个行业的难点在哪，致胜高地又在哪？决胜之战，其实考验的就是这些能力。一、人与企业的连接能力，也是社交力的比拼未来社交将链接一切，人与人，人与企业，而且移动客服是即时通讯的衍生品，也是销售渠道的一个节点，每一个节点都会聚集到一些用户，产生兴趣，扎堆聊天，在交互连接中实现价值。所以SaaS客服就不再仅仅是冰冷机械的代码及程序，而是在考验着人与企业沟通能力、企业贴合用户需求的能力。我们评判SaaS客服价值的标准就得看他连接的能力，如何将千千万万个个体与企业统一且有逻辑的链接在一个平台上，并有序的交流互动。这种社交力能让使用SaaS的人可以和外部的人、机器、设备产生连接，在创造新的价值的同时也产生了新的壁垒。二、个性化的定制能力，也是技术沉淀的较量如今企业客户对特定领域相关应用的需要日益增多，因为就像“世上没有两片完全相同的叶子”一样，任何一个行业、任意一类领域，不同的企业情况和需求对会不一样，通用的应用软件只能解决大部分问题，但那些细小的差异性需求能否满足又往往决定着胜负。所以这就要求SaaS客服应用能适应千变万化的行业化定制需求，能为企业提供开放的接口以及个性化定制，企业用户可根据自己的特点和需求进行自定义设置系统模块。SaaS客服领域的PK也极大取决于SaaS客户平台个性化的定制能力，也就是自己的技术积累能否满足挑剔又各有差异的企业客户需求。三、数据准确性与客服风控的能力，也是对用户需求的理解能力目前出于数据安全性、业务连续性方面的考虑，部分大型企业不愿意使用SaaS服务。企业客户和个人客户最大的差别之一也是对安全的要求更高，这不仅牵涉到客户信息有无泄漏，也直接影响到客户对企业的信任以及企业自身的财务、信息安全。曾经有人总结了企业SaaS选型中的五大安全问题：云计算中的身份验证并不成熟；云标准很薄弱；保密；访问所有区域增加便利性，但同时也带来风险；你并不总是知道你的数据的位置；上诉项同样适用于SaaS客服市场。SaaS客服平台要时刻提防不安全协议、基于Web的应用缺陷以及易损或不安全的证书等威胁的发生。尽管安全性与客服风控的能力说不上是加分项，一旦发生问题，就一定会给自己减分，甚至跌入万丈深渊，难以翻身。而且目前客服中心慢慢由企业成本中心向盈利中心转变，承担起更多的营销、销售职责。这就要求SaaS客服平台对大数据处理技术以及对用户真实需求的理解能力需要上升到一定层次，能实现对客户信息数据和交易数据的分析和统计，预测并完成客户关系维护，二次销售，这无疑又加大了对数据准确性与客服风控能力的考验。四、移动化与智能化水平的考验如今客服场景越来越多样化，这也使得企业客服面临三大挑战：复杂多变的网络通讯稳定性、海量高并发的长连接即时消息以及平衡云端服务合理投入与高品质性能的投入产出比。SaaS客服平台若要在竞争中胜出就必须实现真正的移动化，在保证复杂网络稳定性及海量高并发长连接的同时，还能节省使用者的建设和维护成本。而且，好的客服往往让你感觉很专业，这就要求SaaS客服平台能提供强大的系统支持，如知识库、帮助中心或自助服务中心和数据统计分析功能等，利用关键搜索、人工智能等功能实现精准理解用户问题并匹配最佳答案，并做到快速自动回复。也就是把客户结构化和非结构化的数据进行大数据分析，反向为用户服务。同时还能把重复或干扰的问题挡在客服前面，提升客服效率。这看起来是极端的企业客户需求，却是对SaaS客服平台的基本考验。未来SaaS客服平台还可能要对客服管理数据化，完全不止于客服，而是朝着更强的综合特征发展，最终实现以客户为中心的应用一体化。总之，目前SaaS客服市场是一个巨大的增量市场，用户的客服需求开始由目的型客服需求逐渐向场景型客服需求发展，未来将大有可为，但市场份额逐渐会向领先的厂商集中，客服企业逐渐呈现出平台化趋势，大批以销售安装型软件的传统中小型软件厂商将被迫逐步退出市场，具有先发优势并能攻克以上难题的平台将获得更多发展机会。作者曾响铃微信号：xiangling0815 来源：虎嗅网http://www.huxiu.com/article/143306/1.html?f=index_feed_article

数据
2016年04月05日

数据

大数据带来的隐私泄露和歧视问题渐显，数据发展正面临转折点摘要：很多人还没搞清楚什么是PC互联网，移动互联网来了，我们还没搞清楚移动互联的时候，大数据时代又来了。近年来，大数据已经覆盖了许多领域，包括互联网领域。许多应用和平台热衷于搜集用户的信息。而在近日举行的SXSW（South by Southwest，西南偏南）大会上，专家们却表达了对于数据会歧视用户的担忧。会上，独立隐私安全专家Ashkan Soldani提及了IBM的一款能够计算“恐怖主义得分”的软件。这款软件的目的是通过用户数据，计算从叙利亚来到欧洲的人们参与恐怖活动的概率。大数据（bigdata）一词越来越多地被提及，人们用它来描述和定义信息爆炸时代产生的海量数据，并命名与之相关的技术发展与创新。但是，在大数据发挥重要作用的同时，也产生了一系列问题，给人们造成了困扰。一、许多软件因数据歧视用户，造成诸多问题目前，许多企业都会通过软件或应用搜集用户信息。在大数据时代，这种做法是无可厚非甚至是必要的，但是，用户数据可能会使用户遭到歧视，甚至造成滥用。比如，电脑投放求职广告时，就会产生歧视行为。去年，卡耐基梅隆大学的研究人员通过一款名叫AdFisher的工具，对其第三方网站上的广告定向投放过程进行了追踪。结果表明，当谷歌判定求职者为男性时，为其推送高新主管职位消息的概率远大于同等条件的女性求职者。记者Julia Angwin说：“你可能并不知道你为什么没有得到那份工作，你或许永远不会知道，其实是因为数据歧视了你”。对此，AdFisher的开发者表示：“我认为，我们的发现揭露了目前广告生态中开始浮现的诸多歧视和不透明现象。从社会的角度来看，它很值得担忧”。不仅是在工作方面，就连社交软件都会因为数据歧视用户。美国约会应用Tinder的付费版Tinder Plus推出后，其定价的差异化引发了争议。在美国的用户，18岁到29岁只需9.99美元，但是超过30岁的用户则需支付19.99美元。而处在英国地区的用户，18岁至27岁只需支付3.99英镑，而超过28岁就必须支付14.99英镑。由于这样的定价，关于Tinder歧视“大龄未婚青年”的言论一时蔓延开来。对此，Tinder副总裁的解释是，年轻用户是高频使用者，但缺乏金钱，定价较低是为了刺激其购买欲。而大龄用户对价格或许敏感度更低，所以愿意购买服务。因此，定价差异化是基于公司测算，并非年龄歧视。不管这些应用是出于怎样的目的，都或多或少地带有歧视色彩，并且大数据有泄露用户隐私之嫌。一份研究大数据影响的白宫报告中写道：“我们长期坚持的公民权利保护政策对居民信息如何在住房、信用卡、雇佣、健康、教育和交易市场等方面使用有严格的限制，而数据分析技术有可能会击溃这一防线”。研究者指出，对于企业追踪用户的过程以及投放广告的算法有一定的了解，对人权组织及监管机构来说，是相当重要的。当然，企业也应该采取一些相关的措施，消除数据对用户带来的歧视。大数据是在互联网时代不可避免的发展趋势，但同时，它产生的问题也让人们有些恐慌。二、大数据发展正面临转折点，需努力趋利避害大数据的意义就在于，从庞杂的数据背后挖掘并分析用户的行为习惯与喜好，从而找出更符合用户“口味”的产品和服务，并结合用户需求有针对性地调整和优化自身。这种作用对于当今企业来说，是极其重要的，其商业价值大致体现在四个方面。大数据可以实现客户群体细分，并为每个群体量身定制特别的服务；大数据可以对现实环境进行模拟，发掘出新的需求并使投资回报率有所提升；大数据可以加强部门之间的联系，提高生产链条与管理链条的效率；大数据可以使服务成本降低，找出隐藏线索，对产品和服务进行创新。对于社会来说，大数据的发展也是有诸多好处的。大数据定理表明，在试验不变的条件下，重复试验过程多次。在大量重复中，会呈现出几乎必然的统计特性。随着计算机处理能力的增强，获得的数据量越大，挖掘出的价值就越多。如果银行能够及时发现风险，社会经济将越发强大；如果医院能够及时发现疾病，我们的身体会更加健康；如果通信公司能够降低成本，我们的话费将更加实惠。以上情况，都可以通过大数据的不断积累和不断分析实现。通过这一过程，我们可以发现规律，从而实现更好的未来。但是，任何事物都有两面性，大数据时代所产生的问题也同样不少。第一，数据不够安全。无论是企业还是个人，在实践过程中都会或多或少地产生数据。这些数据在当今时代并不安全，会有很多方法使它们泄露。第二，数据泄露产生不平等。对于用户来讲，数据是一笔财富，但是遭到了别人的窃取，而自己并未得到任何收益，这对于用户来说是不公平的。第三，用户隐私问题。当用户在网上注册信息后，这些信息很有可能已经被扩散，当用户收到一些莫名其妙的邮件、电话、短信时，其实用户的各种信息早已被非法的商业机构贱卖了。无意中拍的照片，可能会使人一夜成名。用户的想法、行为、都可能被商家记录在案。人们担心身份被盗用，担心数据造假，害怕数据框定，反感数据的不公平造成的歧视。要解决这些问题，需要克服许多困难，面临巨大的挑战。虽然企业可以更加细致地去检验他们的系统和流程，但是依然不能完全解决问题。通常数据驱动的决策都比较隐蔽，即使产生威胁，也不会被轻易发现。任何的领域都需要统一，但是大数据行业尚不能立法，因为大数据趋势变化多端，无法掌握立法所面临的全部背景。业内专家认为，有必要在计算机课程中增加数据伦理教育，并且更改有歧视倾向的计算机程序。尽管不能完全解决问题，但也能起到一定的作用。马云说：“很多人还没搞清楚什么是PC互联网，移动互联网来了，我们还没搞清楚移动互联的时候，大数据时代又来了”。不管是喜是忧，大数据时代已经降临。哈佛大学社会学教授加里·金说：“这是一场革命，庞大的数据资源使得各个领域开始了量化进程，无论学术界、商界还是政府，所有领域都将开始这种进程”。现在的大数据领域正面临一个转折点，努力的方向决定着其属性的发展。我们应该尽量消减其负面影响，让大数据发挥其正面作用，从而更好地为人类服务。（本文首发钛媒体）【钛媒体作者介绍：东方亦落，本文版权归“最极客”所有】

数据
2016年03月15日
数据

为什么跨设备数据将成为企业新宠编者按：本文作者 Brian Ferrario 是一名营销经理，在本文介绍了跨屏设备在日常生活中的应用以及发展趋势。近年来，消费者在手机端和桌面端的活动界限正逐渐模糊。无论操作内容是什么，你实际用的是哪种设备已经越来越无关紧要。拥有银行账户的智能手机用户中，一半以上使用手机银行。“黑色星期五” 期间近 60%的流量来自手机端，尽管这只占到线上交易量的三分之一。如今手机和桌面之间的转换已经可以无缝衔接，且成为我们数字生活中不可缺少的一部分。几年前很难想象银行交易和购物之类的任务可以在手机上进行，而现在它们已经是占据手机端行为的大头。消费者用的是什么设备越来越不可捉摸。对企业来说，精确化和规模化的跨设备框架具有非凡的价值。从发邮件、做研究，到购物和社交，消费者在网络上的一切行为都以设备间的跨越为基础。我们期待着那些能发挥跨设备框架优势的工具和 App 出现。设备变得无所谓，重点是使用设备的人。任何工具和 App 都一定要考虑到所有设备，这样才能提供更好的内容和服务。因广告技术而生，但注定不止于此数字广告领域最先意识到普及跨设备身份解决方案的重要性。他们建立了智能层面上的数据分析，从桌面、手机网页到手机 app，甚至最近崛起的智能电视和智能手表。这些数据最初用来改善网络数字化营销，并推动了程序化广告市场的发展。如今企业也加入进来，他们可以利用数据层面的资源开发新一代的工具和服务以满足消费者需求。此类服务要满足全球每天 1000 亿的广告需求量，以及 2-3 万亿的线上交易量——从搜索查询和 html 请求，到登陆和下单。跨设备也许是为广告技术应运而生的，但是它注定有更多含义。以下是一些在广告技术之外跨设备身份框架可以适用的例子。即使更换设备，内容也不被打断想象一下，你登陆电脑，在Sears、Crate & Barrel、The Home Depot等电商网站上浏览产品页面，或者开始读一篇CNN、The New YorkTimes上的报道。在你关掉电脑后，你可以拿起你的手机直接跳到产品目录的第八页，或者无缝衔接上你上次没看完的文章。这和Apple 的 Handoff（连续互通）功能很像，但更加极致——它可以跨设备、跨操作系统，甚至在网页和 App 环境下都可以互相衔接。网页上的电商推荐如果你想买一件新 T 恤，在下单之前你可能会浏览好几个电商网站和 App。现在，当你在Macy、Bloomingdale和Nordstrom的电商网站之间流连，网站对于你是谁、你在找什么的认知是有限的，即使是匿名状态下。到每个新站点你都得点到 T 恤类别，然后挑选想要的尺码和颜色。想象一下，如果一个网站在你登陆的那一刻就知道你在找什么，甚至不需要登陆，这是多么轻松顺滑的体验。诈骗侦测和身份管理如今，从在线退房到网银登陆，网站都可以用验证码和两步验证来确认用户的身份。如果美国银行、大通银行、花旗银行，或Visa、 MasterCard等信用卡公司知道你拥有什么设备、你和你的设备定位在哪里，这些网站便可以阻止其他人或 bot 用未知的设备在新地点登录，并且区分 bot 设备和真正的设备。这可能不算一个完整的解决方案，但却是多层次的诈骗侦测项目的一部分。以消费者为重心的各种服务，从电商和网银到客户关系管理（CRM）和商务智能（BI）平台，都可以通过跨设备技术改善体验。就像 90年代推动企业发展的 web 浏览器，和近十年来推动商业发展的移动端一样，下一个十年将由跨设备智能技术激发独特的消费者和企业体验。本文编译自：thenextweb.com Why every enterprise will soon be addicted to cross-device data We’ve seen this building for years – the lines are blurring between mobile and desktop activities for consumers. We’re fast approaching the tipping point where the actual device you’re using – no matter the activity – becomes irrelevant. More than half of smartphone owners with bank accounts use mobile banking, and almost 60 percent of Black Friday’s web traffic came from mobile devices, though it only counted for a third of online purchases. Shifting between mobile and desktop is already a seamless and unquestionable part of our digital presence. Even tasks like banking and shopping, which a few short years ago would have been difficult to imagine existing on mobile, are now dominantly mobile activities. Consumers are becoming device-agnostic. There is extraordinary value in an accurate and scalable cross-device framework for enterprises. From email and research, to purchases and social networking, cross-device is the basis for every action we take as consumers on the Internet. We’ve come to expect tools and apps that take advantage of a cross-device framework. Devices aren’t relevant anymore, people are. Any business building tools and apps should absolutely think across all devices in order to deliver better content and services. Born from ad-tech, destined for much more Players in the digital advertising space were the first to recognize the need for a pervasive cross-device identity solution. These providers created an intelligence layer comprised of data and insights from desktop and mobile web, mobile apps, and even emerging devices like connected TVs and smartwatches. That data was originally used to improve online digital marketing, and fueled the programmatic advertising market. Now, as enterprises enter the game, they can take advantage of that data layer to develop the next generation of tools and services to address consumers. And those services will address not just the 100 billion daily global ad requests, but the two to three trillion daily global internet transactions – everything from search queries and html requests to logins and purchases. Cross-device may have been built for ad-tech, but its implications go far beyond it. Here are a few examples, outside of ad-tech, that a cross-device identity framework can enable. Uninterrupted content, even when switching screens Imagine logging in to your computer and browsing through pages of products on an e-commerce site like Sears, Crate & Barrel or The Home Depot, or starting to read an article on CNN or The New York Times. Now let’s say, in the middle of your session, you have to shut your computer. What if you could pick-up your phone and jump to page eight of the product listings? Or seamlessly finish the article from where you left off? It’s a similar concept to Apple’s Handoff functionality, but on steroids – across devices, operating systems, and even between web and app environments. E-commerce recommendations across the Web If you’re looking to buy a new shirt, you might check multiple e-commerce sites and apps before making a purchase decision. Right now, as you move between the Macy’s, Bloomingdale’s andNordstrom e-commerce properties, there’s a limited sense of who you are and what you’re looking for, even at an anonymous level. On every new site you have to locate the section for shirts, and then select the right sizing and color. Picture the ease and seamlessness of a site that knows what you were looking for the moment you arrive, without ever logging in. Fraud detection and identity management From online check-outs to banking login screens, sites today use tools like captchas and two-step verification to confirm a consumer’s identity. If Bank of America, Chase and Citi, or credit card companies like Visa orMasterCard knew which devices you own, and where you and your devices are located, these sites could block another person or bot from logging in on an unknown device in a new location. Likewise it could separate real devices from bot devices. It’s likely not a complete solution, but part of a multi-layered fraud detection program. A cross-device technology layer can be an unobtrusive addition to everything from consumer-focused experiences like e-commerce and online banking to CRM and business intelligence platforms. Cross-device knowledge is the platform on which these experiences will be built. Like internet browsers fueled enterprises in the late 1990’s, and mobile improved businesses in the late 2000’s, cross-device intelligence will inspire the next generation of unique consumer and enterprise experiences.

数据
2016年03月01日
数据

企业用户的安全“保镖”，阿里聚安全正式发布来源：猎云网（微信：ilieyun）文/赵子潇 DT时代，企业的业务安全遭遇极大的挑战。这些威胁不仅限于攻击、病毒、漏洞、木马、网络钓鱼、间谍软件，还包括内容安全、业务风险等。黑灰产运作日趋成熟，已经形成产业链条，企业如何保证业务的健康发展？ 2016年2月25日，阿里巴巴正式推出企业安全产品——阿里聚安全，面向不同规模的企业和开发者提供符合互联网特点的业务安全产品及解决方案，全面覆盖移动安全、业务风控、内容安全、实人认证等多个维度。大数据和多维度引擎确保移动业务安全基于阿里巴巴多年积累的安全大数据和多维度安全风险分析引擎，阿里聚安全为客户提供风险发现、安全防护和持续监控三大模块的产品及服务。阿里聚安全通过安全扫描和安全评估组件来提供风险发现服务。在防护能力方面，应用加固和安全组件使得阿里聚安全具备应用级和代码级的双重保护能力，形成内外结合的防护体系，能够抵御逆向分析、二次打包和动态调试等攻击，目前该安全组件经历了数个亿级应用和多次“双11”活动的考验。针对上线后的应用，持续监控模块提供了全流程的风险管控服务，以可视化的方式为企业实时监测各类风险。数据风控解决方案让黑灰产远离企业许多互联网业务都是黑灰产眼中的“肥肉”。黑灰产的介入不仅侵犯商业利益，还严重干扰用户的正常使用，而且极有可能拖垮整个业务平台，给企业造成毁灭性灾难。阿里聚安全提供了完整数据风控方案，不仅可以实时识别并阻止恶意行为，而且保证正常用户的行为不被打扰。阿里聚安全业务风控解决方案具有“三高能力”，即高强度风控基础安全保护、高精度业务风险识别和高体验的风险控制。凭借这三大能力，阿里聚安全业务风控解决方案拥有了高对抗性、低打扰率和低成本接入的优势。阿里聚安全业务风控解决方案为企业商业系统的健康发展提供了高质量的保障，在企业和黑灰产之间构筑了一道坚不可摧的铜墙铁壁。内容安全“守护神”净化网络空间去年，北京三里屯不雅视频事件、快播公司涉黄事件、百度贴吧事件在社交平台上传播极广，造成了极为恶劣的社会影响的同时，也引发了企业对“内容安全”的思考。阿里的内容安全产品基于多年的管控经验建立完整的风控和分析体系，将舆情情报沉淀为样本并优化算法，提升了信息安全检测能力。阿里拥有的安全和算法专家团队可支持阿里各业务平台每日上亿的图片检测与分析，可提供完备的内容检测服务，如智能鉴黄、违禁图像识别、图文识别、文本识别等。依托于阿里生态的环境，阿里聚安全进行了精细化的场景管理，并将场景化概念应用于服务的各个环节，将每个场景下的检测做到极致。实人认证——线上线下完全一致为保障用户身份真实有效和持续一致，并建设网络诚信体系，阿里巴巴的网络身份认证从一开始就不断升级。从最初的实名登记，升级为银行打款认证，再到手持身份证认证。现在，淘宝卖家开店认证已全面升级为实人认证。阿里聚安全以实时大数据风险管理为核心，可实时判断每一个用户的认证动机，对不同风险等级的用户采用不同的认证方式，保障正常用户能够方便、快捷的提交资料，而风险用户无法简单的通过盗用他人信息通过认证，确保认证的真实性。同时，阿里聚安全以生物识别、无线安全技术为支撑，保障实人认证的有效性。目前，阿里巴巴人脸识别技术已在实际场景中大规模应用。 “一站式”解决方案助力企业业务阿里聚安全还为企业用户提供了“一站式方案，既有适合大多数企业的通用型解决方案，也有针对细分行业的解决方案。阿里聚安全的通用解决方案完整覆盖了企业业务开发的整个过程。在设计阶段，提供安全流程培训服务；在开发阶段，接入高强度的安全组件；在测试阶段使用自动化的漏洞扫描和兼容性测试；业务上线前，再进行应用加固；上线后，则持续对发布的应用进行仿冒监测、运行环境监测和攻击行为监测。在发现仿冒应用和攻击风险时，阿里聚安全还提供情报服务和应急响应。而对于已经上线的业务，阿里聚安全也提供漏洞扫描和安全评估服务。除了通用解决方案，阿里聚安全还推出了行业解决方案，涵盖电商、医疗、金融以及手游等领域。

数据
2016年02月25日
数据

无处不在的云计算终于多了一个兄弟——雾计算现在正在流行的“云计算”，是把大量数据放到“云”里去计算或存储。这样，就解决了目前电脑或手机存储量不够，或者是运算速度不够快的问题，当然也带来了其他很多好处。这个所谓的“云”的核心，就是装了大量服务器和存储器的“数据中心”。由于目前的半导体芯片和其他配套硬件还很耗电，全球数据中心的用电功率，相当于30个核电站的供电功率，而令人痛心的是其中90%的耗电量都被浪费，因为效率很低。谷歌位于全球数据中心的用电功率就达到3亿瓦特，这一数字超过了3万户美国家庭的用电量。如果说现在用了大量电能来维持的云计算中心，还能给广大用户提供互联网云服务的话，当数据传输量进一步成指数式增长，可能这个云中心会无法再维持下去。这个数据传输，指的是大量无线终端和“云”之间的传输。随着物联网的到来，今后各种家庭电器以及大量传感器，包括嵌入在可穿戴设备里的传感器都会连网，从而产生极其大量的数据。而大量数据的发送和接收，可能造成数据中心和终端之间的I/O(输入输出)瓶颈，传输速率大大下降，甚至造成很大的时延。于是有人想出一个方法，在终端和数据中心之间再加一层，叫网络边缘层，如再加一个带有存储器的小服务器或路由器，把一些并不需要放到“云”的数据在这一层直接处理和存储，可大大减少“云”的压力，提高了效率，也提升了传输速率，减低了时延。这个方法叫做“雾计算”。这个名字还是很有想象力，“云”漂浮在天上，看得见却摸不着，而“雾”就在你眼前，接地气，是个现实的物体。“雾计算”所用的设备，就是小服务器或路由器，是处于大型数据中心与终端用户之间的设备，可以放到小区、工厂、企业、家庭等里面。 “雾计算”的效果与特点最初“雾计算”这个名字还是由美国纽约哥伦比亚大学的斯特尔佛教授(Prof. Stolfo)起的，不过他当时的目的是利用“雾”来阻挡黑客入侵。后来美国思科公司把这个名词接了过去，用于推销产品和网络发展战略。而IBM一直在推动网络“边缘化”，准备把很多“云计算”的工作逐步移到“雾计算”。就是把处于网络中心的“数据中心”里的数据，移到网络的边缘处。 “雾计算”对于企业来说有着明显的积极效果：企业大量的内部数据不用传到“云”里再从“云”里传回来，而是直接通过“雾”来处理，能大大提高企业效率。对于个人来说，如果手机里的软件需要升级，也不必到“云”里去升级，只需在最近的地方(如小区内)通过“雾计算”的设备升级就可以了。雾计算的主要特点是： ★极低时延。这对于目前正在蓬勃发展中的物联网有着十分重要的意义，除此之外，网上游戏、视频传输、增强现实等也都需要极低的时延。 ★辽阔的地理分布。这正好与集中在某个地点的云计算(数据中心)形成强烈的对比。例如，如果需把信息和视频发送到高速移动的汽车时，可以沿着高速公路一路上设置无线接入点。 ★带有大量网络节点的大规模传感器网络，用来监控环境。智能电网本身就是一种带有计算和存储资源的大规模分布式网络，可以作为“雾计算”很好的应用例子。 ★支持高移动性。对于雾计算来说，手机和其他移动设备可以互相之间直接通信，信号不必到云端甚至基站去绕一圈，因此可以支持很高的移动性。 ★支持实时互动。 ★支持多样化的软硬件设备。 ★支持云端在线分析。这里举一个应用“雾计算”的“智能交通系统”的例子。这个系统把交通灯作为网络节点，可以和传感器一起进行互动。传感器可以探测出行人或骑自行车人的出现，测量出正在接近的汽车的距离和车速。通过“雾计算”，这些智能交通灯可以与邻近的智能交通灯进行协调，可以对接近的汽车发出警告，甚至可以改变红绿灯亮的周期，以避免出现交通意外。在智能交通系统的雾计算服务器里的数据，将传到“云”里，再进行全局数据分析。再比如说了很多年的无线传感网络，它的特点是极低的功耗，电池可以5、6年换一次，甚至可以不用电池而使用太阳能或其他能源来供电。这样的网络节点只有很低的带宽及低端处理器，以及小容量的存储器。传感器主要收集温度、湿度、雨量、光照量等环境数据，不需要把这些传到“云”里去，传到“雾”里就可以了。这将是“雾计算”的典型的应用。 “雾计算”与“云计算” “雾计算”提供了当地节点分布的地理位置信息，信息传递的时延非常低，而“云计算”则提供了中心化的全局信息。许多应用既需要“雾”也需要“云”，例如大数据技术里的数据分析，首先通过M2M(机器与机器之间通信)把传感得到的数据进行处理和过滤，然后放到HMI(人机界面)这一层进行文本化及视觉化处理，可以让用户清晰地理解所有的分析过的数据资料。这里“雾计算”起到了一个频繁使用的“数据库”的作用，而“云计算”中心就是一个把文件长期存储的地方了。由于“雾计算”的极低时延，这样的大数据分析可以用手机来完成，真正做到“移动数据分析”。在物联网将成为下一代互联网的大趋势下，“云计算”本质上的一些缺点显得越来越明显，如不能支持高移动性、不支持地理位置信息及高时延等等，而“雾计算”正好能够解决这些问题，同时又可带来大量新的应用和新的服务。这种“雾计算”的节点可以是今天人们正在用的无线路由器、机顶盒之类。在“雾计算”这个概念提出之前，2009年就有人提出过“云盒”(Cloud in a box)以及“小云”(Cloudlet)的想法和产品，用于周边的手机和各种移动设备，这与“雾计算”的想法是一致的。比如增强现实，是在实际看到的现实世界的影像上再叠加一层信息，需要进行实时复杂的视频运算，由于是实时要求，需要极低的时延。有人使用谷歌眼镜再配上“小云”设备，达到了很好的用户体验效果。云计算需要大量带宽，而无线网络带宽有限。用了“雾计算”，可以使所需的带宽量大大降低，原则上可使传输的数据“旁路”，即从互联网边上绕过去，使这些数据尽可能本地化。最有价值的数据仍然可以通过“云”来传输，但是大部分的数据流量可以从这些网络中分流出去，从而大大减轻了云网络的流量负担。智能交通系统、智能电网、智能汽车甚至健康医疗系统等，如果都是本地处理数据，只把最重要的数据传到“云”的话，将变得非常高效，同时也可节省大量成本。但“雾计算”并不与“云计算”形成竞争，而是可以看作后者的延伸。从这个意义上来说，一些公司利用装备了无线通信设备的无人机、热气球给偏远地区提供宽带网络服务，也可以算为一种“雾计算”，而这种“雾计算”还真的很形象：漂浮在用户和云彩之间，有点“雾”的味道。 “雾计算”有很多优点，但涉及到未来大规模部署“雾计算”设备，必然会遇到各种问题，比如网络堵塞、软件架构、安全、隐私以及采用什么商业模式等等，不过这些问题在不久的将来一定能得到解决。 “云计算”、“雾计算”相继出现在计算机技术的字典里。是不是我们接下来还可以期待“雪计算”、“彩虹计算”、“冰雹计算”，甚至“暴风计算”的出现呢?（本文来自BT传媒·《商业价值》12月刊，作者张臣雄，网络首发钛媒体）作者：张臣雄来源：钛媒体链接：http://www.tmtpost.com/1506300.html

数据
2016年02月19日
数据

什么是判断力编者按：本文作者三个字儿，36 氪经授权转载自其个人微信公众号“ 雨打沙滩点点坑 ”（微信号：rain_on_sand）。如果你问我，作为一个男人，最重要的是什么能力？我会说，XING 能力。如果你再问，那么第二重要的呢？我会说，判断力。一开始，看到三表在他的龙门阵里发文《想当判断力仲裁者的曹政》的时候我还是颇为惊讶。三表和曹政都是我喜欢的大 V，而且都是小道消息推荐过的，难道不应该相亲相爱吗？什么情况？读了 Caoz 老师的《关于判断力-兼谈 IT 评论界冥顽不化的愚蠢》，到并没觉得："曹政真当自己是个判断力的仲裁者"。三表的文章一直是以观点守正出奇，而且多是对这个社会不平之事，仗义执言。人家 Caoz 老师就自己的本行业谈谈务虚的东西，按理说，应该入不了三表的选题。但是略微一想，也就释然了：对一个男人来说，没有判断力，几乎等于『你不行』。而如果一个人公开的对大家的判断力指指点点，颇有点挑战大家 XING 能力的意味。因此作为一名正义人士，按捺不住心中的激愤，回撸一篇，给大家出出头，这也是有的。不过，说到判断力这个话题，虽然 Caoz 老师和三表都写了不少字儿，但是读起来还是不过瘾，谈的不够透彻嘛。由于在等飞机，闲来无事，再加上好久没写公众号了，索性就把判断力这个话题谈透。谈我的观点以前，我先摘要一下 Caoz 老师对于判断力的观点：很多人判断力很糟糕，因为他们的信息不完整很多 IT 媒体人士尤其是这样, 比如， keso 总之，数据全面的会比数据不那么全面的人判断得更准确。三表的观点：世面上判断力与洞见本来就是稀缺的，尤其是现在这个写作门槛很低的时代这种仲裁别人『判断力』的方式其实叫『武断』自由表达高于一切三表反驳的也是铿锵有力，但是我总觉得没有说在点儿上，没说透。观点里也夹带着对 Caoz 老师本人的冷嘲热讽，这对于讨论清楚问题显然是没什么太大帮助的。我的『判断力』告诉我，Caoz 老师的这篇文章的主要观点是错误的。当然 Caoz 老师一篇文章中通常容纳了很多观点，比如: 追一下热点，加上媚俗的观点，再通一点话术，想做一个热门大号，好像还真的并不难精英人群从来都不是互联网主流这些观点也都是我不能认同的，但是这显然不是这篇文章关注的重点，这里就不展开来说了，我们还是回到本文的主题: 啥是判断力 ? 说起来其实 Caoz 老师说的所谓的『判断力』实际上是『预测能力』，他原文是: 举个例子，你说，百度是流氓，这是观点，不是判断力；你说，百度因为太流氓，所以贴吧会大量流失用户，这是判断力。然而很可惜，这个判断是错的。判断一个人是不是流氓，显然是用的我们通常意义的『判断力』，否则，难不成是用 XING 能力下的结论？不过还是按照 Caoz 老师的语境，我们在后面就不区分『预测能力』与『判断力』了。那么什么是『判断力』之『预测能力』呢？显然就是在事情刚开始的时候就能猜中结尾的能力: 而 Caoz 老师认为的『判断力』(预测能力)，最重要的就是得有多多的信息。数据越多，做出的预测就会越准确（看来，Caoz 老师做预测，主要依靠的是历史回归分析）。显然，这个观点是错误的，否则，《黑天鹅》的作者也不会巴巴的写了一本书，而且很多人还巴巴的去买，并且生生把这本书买成畅销书了。这个观点同时是很危险的。因为它给你一个『我的预测绝对是正确的』的假象。如果纳西姆·塔勒布看了 Caoz 老师这篇文章，一定会关切的对 Caoz 老师大喊：『危险，从平坦世界醒来吧』（当然，如果他不是个热心肠，也很有可能装没看见）实际上，所谓的『判断』或者『预测』的过程，基本上就是对某一事物应用下面的公式：诚然，如果数据严重不足或者根本就是错的，别说是索罗斯，即使是宙斯，得出的结果一定好不了。 Caoz 老师过于强调数据这个因素当然是不全面的。但我通常都是用最大的善意来揣度别人的内心，比如 Caoz 老师写这个文其实也许是看到了周围一些朋友被门夹了脑袋，内心捉急：就掌握这么点信息就妄下决断，而且还明显是错的，蠢啊。当然，也有另外一种小小的可能，就是毕竟 Caoz 老师一身横练的是运维的功夫。运维人员主要的工作是保证一个系统正常健康的运行。而程序在运维人员的角度看起来，多半是一样的罢。 Apache 和 Nginx 能有啥区别？配置文件格式有点不一样而已，启动的时候，还不是几个进程的 ID，我 kill 它，它还不是一样会趴下？一个系统关键是它生产出来的丰富多彩的数据，这个才是最有价值的。作为一名运维人员，非常在乎数据，难道有什么错吗？虽然这种想法是幼稚的，但是起码我想，这是情理之中至极的事情吧。不过 Caoz 老师可能好久没接触过烂程序了，如果他能回过味儿来，回想起自己曾经接触过的烂程序，或许他自己都不能同意自己的这个观点：『数据是预测能力的关键』读到这里，可能有人会问：『那么到底是数据重要呢？还是程序重要呢？』 ------- 下面是我的观点的分隔线 ------ 其实世界上大多数事物都是『边际递减』的: 无论是判断力，预测能力，或者其他的什么力，只要是遵守公式: 那么无论是『数据』还是『计算』都不是绝对的『最重要的』就是说，如果你想得到一个正确的结果，你的状态是: 那么你当前最重要的问题，显然是在获取数据方面要多投入。如果反过来，你的状态是: 那么你当前最重要的问题，显然是在计算能力方面要多投入。无视当前状态，单单强调无论是数据还是计算能力，都是片面的。当然，如果你问数据和计算都不及格，咋办？废话，当然那个能先搞及格先搞哪个。 -_-! 其实小时候，课本里早就告诉了我们这个道理 --> 《小马过河》: 看，一个人获取的知识，不是看 TA 读了什么，关键是看 TA 读到什么因此，说到判断力，其实最关键的，显然是你要能搞清楚状况。小马要过河，除了知道河有多深，还得知道自己腿有多长。可是不幸的是，不识庐山真面目，只缘身在此山中。认识自己是最难的。世界上有多少人，甚至是伟人，是搞不清楚状况，或者仅仅是自以为自己搞清楚了状况的呢？美帝国主义都是纸老虎，他们是不敢进攻巴格达的我们雅利安人是最优秀的人种我们的人民很幸福他其实还是很爱我的我要是不努力工作，公司就垮了百度是最好的中文搜索引擎 ... 但是这是另外一个话题了。不过正因为很难搞清状况，因此，对于我们做的大多数判断，大家都不敢打 100% 的包票。而，恰恰是因为这个，我们的这个星球才这么有趣，不是吗？

数据
2016年02月18日

《 1 2 3 456 》