• 教训
    Capital One的People Analytics 负责人谈这两年人力资本分析工作的教训 编者注:Capital One 的Guru Sethupathy 是Head of People Strategy & Analytics 。他谈了谈过去两年的教训。跟大家分享!   在过去的两年里,这是一段令人难以置信的旅程,随着我们团队的规模和影响的增长,我们已经学到了一些关于我们进步的重要经验教训。这些包括: 洞察力不足 ; 将洞察力转化为行动至关重要 投资数据质量 ; 没有高质量的数据,我们议程的所有其他方面都毫无意义 投资了解业务 ; 它使您能够提出更好的问题,提出更有针对性的建议,并在人力资源和业务中建立您的可信度和影响力 员工对他们的数据很慷慨 ; 认真思考数据隐私和道德规范并培养护栏。我们还应该奖励员工,帮助他们发展自己的事业,改善经验和福祉 在不使用机器学习的情况下可以提供很多价值。如果您决定使用机器学习,请仔细考虑并放置护栏。如果机器学习出错,它很快就会破坏价值 区分相关性与因果关系很重要。有时前者足够,有时后者是必要的; 我们的工作中有很多令人困惑的因素 讲故事很重要,是推动影响力,行动和影响力的真正差异化因素 没有测量>测量不好 ; 投资改善测量,但也愿意承认并非所有事情都能得到足够的衡量 要客观,清楚地了解客户是谁 ; 它们可以变化,并且具有清晰度将导致更好的设计产品,项目和影响 附录英文: Insights are insufficient; converting insights to action is of utmost importance Invest in data quality; without high quality data, all other aspects of our agenda are meaningless Invest in learning about the business; it enables you to ask better questions, make more targeted recommendations and build your credibility and influence both within HR and the business Associates are generous with their data; think seriously about data privacy and ethics and develop guardrails. We should also reward employees with insights that help them develop their careers as well as improve experience and wellbeing A lot of value can be delivered without using machine learning. If you do decide to use machine learning, do so thoughtfully and place guardrails. If machine learning goes awry, it can quickly destroy value Differentiating correlation from causation is important. Sometimes the former is sufficient, sometimes the latter is necessary; there are a lot of confounding factors in our work Storytelling is important and a real differentiator for driving influence, action and impact No measurement > bad measurement; invest in improving measurement but also be willing to acknowledge that not everything can be measured well enough Be thoughtful and clear about who your customers are; they can vary and having that clarity will lead to better designed products, projects, and impact
    教训
    2019年08月04日
  • 教训
    注意!大数据的九个大教训 【文章作者:Dink】 昨天和今天我参加了俄亥俄州立大学的“大数据未来研讨会”。俄亥俄州正在与IBM公司合作在当地创建一个大数据中心,逐渐成为该领域的一个重要学术力量。本次研讨会汇聚了来自全国各地的专家和一名来自英国的专家,就该领域当前的成就、趋势和话题进行一次卓有成效的探讨。很遗憾我没能参加今天下午的展示会,但大家可以在会议官网和即将出版的《信息社会的法律和政策》杂志(AJournalofLawandPolicyfortheInformationSociety)上了解更多详情。     大数据和开放数据不是一回事,但他们有着密切的联系(正如我在主题发言稿“未来的大数据将会开放到什么程度?”上写到的)。我们正在关注的大数据一些趋势和话题与开放数据也有关系。按照这样的脉络,就出炉了这篇我在去哥伦布的路上学到的《了解大数据的九件事》。在研讨会的官网上可以看到我用黑体标注的人们的名字。     为大数据的激烈反应做好准备。很多演讲者提到了“大数据过分渲染宣传”的话题,认为大数据被讨论得如此热烈,以至于我们现在可以进入一个反应性的循环。MikeNelson对他在公开场合看到的逐渐出现的“垃圾数据”提出了责难,甚至建议我们应该重新命名大数据,它可以有一个“大兄弟”–就像很多人一样。他建议改名为:BFFMUDD,是大(Big)、肥(Fat)、快(Fast)、乱(Messy)、非结构化(Unstructured)、分布式数据(DistributedData)的缩写。     意识到“大数据的狂妄自大”。好几位演讲者引用了一份新报告,报告显示,“Google流感趋势”–大数据预测价值的首批大范例之一–被证明非常不准确。显然,Google可能自作聪明地以一种错误的方式调整了其算法。不管什么样的错误,这都是个教训,表明如果不着眼于更广阔的图景,而只是试图通过碾碎数据来发现真相,通常情况下无法获得预期效果。     数据不能代替判断。数据,尤其大数据是可以帮助人类做出决策的工具,但不能起到代替的作用。RayHarishankar是这样说的:“数据加上分析是信息,信息加上语境可以提供洞察力,洞察力必定能导向正确的行动,正确的行动则带来提升价值的结果”。     相关关系不能强过理论。一些大数据的倡导者认为大数据几乎让理论变得多余:他们说,有了足够的数据,即使没有理论说明其原因,我们也可以发现很多重要和有益的模式和趋势。确实,简单的相关关系在一定程度上就可以驱动精确的预测。但即便是具备预测分析的能力,也并不意味着你就能真正地理解你正在研习的系统是如何运行的。EytanAdar建议我们审视大数据范围从预测性到解释性的所有相关努力,并且更多地关注如何理解我们所看到的东西,而不是仅仅关注可预测未来的模式。     大数据正在-冒着风险–追踪一个“移动” 社会。在全球范围,移动设备都已经成为人类的首选在线连接工具。FarnamJahanian指出到2015年全球移动设备的数量将是人口数量的两倍,所有的设备都可以发送位置信息和其它数据给能够收集这些数据的公司。这将成为未来社会大数据的主要来源之一。但KateCrawford?指出了这里的隐私风险:由于人类移动行为模式的独特性,你可以仅用3-4个手机生成的数据点就能识别一个人。     大数据能帮助–或者损害城市的民主体制。正如HarveyMiller所说,通过手机数据、远程环境感应器、激光生成的航空地图和更多工具来追踪城市活动的能力,可以给我们创造拥有更高代谢功能的超级协调城市。(遗憾的是,我不得不在MichaelBatty关于城市分析的主题演讲之前离开,不过他在个人网站上提供了演讲内容)但是,KateCrawford在这里再次提出了警告。如果我们不小心,城市数据收集就会不对称地帮助富人而伤害穷人。     比如,波士顿的StreetBumpAPP应用通过追踪智能手机的摆动状态来收集坑洼里的数据,用志愿者的数据来反映一条道路的颠簸不平。但大多数智能手机的拥有者都属于生活富裕的人群,以至于最初是在更富有的地区监测和修复坑洼–这是StreetBump目前正在致力于修正的难题。在相反的另一面,“预测监控”正在被用于将警察管制实施于预测将会有高犯罪率的地区,这将导致歧视性的执法。     隐私仍然事关要紧。忘掉那些宣称公众,尤其是年轻人已经放弃隐私的报告吧。我们仍然关心隐私问题,只是不知道该怎么做。这里有两个考虑因素:我们想知道政府机构或数据跟踪公司收集到了哪些关于我们的数据信息,以及如果我们不喜欢,则想让他们停止收集。关于如何解决这些考虑因素还不是很清晰。会上的一些发言者建议采用简单的解决方案:让政府和公司对它们正在收集的数据更公开透明,这是一些人称之为“互相确认的公开”的方法。但是一个长期的透明度倡导者GaryBass说,这个建议的解决方案“不是真实的世界。在过去的30年里,我拼命地斗争让数据变得可获取,而政府和公司则拼命地让数据不可获取……这是一场旷日持久的斗争”。正如其他人所说,这里的风险在于我们可能增强了数据收集者和被收集者之间的力量不对称性。     大数据应当展现数据之美。数据可视化方面的迅速进步正在创造一些美轮美奂的效果。比如,看一看这部“体验自行车人流”的视频,逐渐解析伦敦自行车交通的数据,展示俄亥俄州超级计算机中心最清晰的模式和部分已经完成的可视化作品。类似这样的数据可视化并不仅仅关乎美学,而是与理解息息相关。IBM公司的一位数据可视化专家AngelaShen-Hsieh谈到人们需要使数据更加“适合人类消费”,以及关注从计算机屏幕到人脑的信息传递旅程中的“最后18英寸”。     大数据将(很有可能)产生大价值。抛开所有的警告不管,大数据中有很多社会价值和经济价值可以发掘。麦肯锡几年前一份具有里程碑意义的大数据报告预测它将撬动数万亿美元的经济价值。这项研究的联合作者,微软公司的AngelaByers?今天说到,也许仍需要5-10年时间才能产生这样的价值,部分原因是我们仍然面临一个重要的技能鸿沟:即可获得的数据数量和清楚如何利用这些数据的人的数量之间存在的差距。但是经济价值正在逐步显现,并且以某种令人惊异的方式呈现。JohanBollen和他的团队成员运用Twitter上的大数据情感分析来预测股票市场:他们计算Twitter上的“镇静”情绪来预测道琼斯指数三天后的收盘点位。   文章来源:199it    
    教训
    2014年05月07日