• 王向导
    “AI+招聘”是未来,还是噱头? 作者:仟寻CEO王向导,编辑:徐宁 作者王向导是仟寻MoSeeker创始人兼CEO、长江商学院EMBA、中欧创业营5期、腾讯青腾大学2期学员。在创办仟寻之前曾在百度、IBM、飞利浦等世界500强企业从事人力资源管理及市场营销工作 。“仟寻”是一款基于微信的 SaaS 移动招聘系统,主要功能包括职位的移动端发布、传播和申请,以及基于社交关系的员工绑定和内部推荐。仟寻系统记录企业和用户端所有的发布、传播、申请和入职数据,同时可以与企业现有的 ATS(申请追踪系统或企业招聘系统)系统整合。 以下是正文: 随着AI及相关新技术的高速发展,HR领域也必将是另一个受益行业。目前在招聘领域的技术革新主要集中在以下三个方向: 第一种是对现有人才库的盘活,包括自动更新企业人才库,并基于新职位做库内最佳候选人的推荐。这试图解决的是人才库浪费,就是那些所谓把“人才鱼塘”重新激活的问题。 第二种方向是自动化人才甄选,包括自动化笔试、面试以及基于聊天机器人的甄选工具。这试图解决的是人才甄选的效率问题。 第三种方向是激活被动求职者,包括基于社交网络、UGC内容、ChatBot和匹配算法的综合应用。这试图解决的是影响并转化被动求职者的问题。 下面看一下这三种方向所涉及的新技术和其应用的现状。 一、人才库盘活: 人才库盘活是近年来的一个活跃话题。这个方向上的应用,其最终理想的场景是,当HR向外部发布职位的时候,系统可以自动提示她,企业自有人才库里面已经有这n个候选人,满足以下两个条件: 1)候选学历、技能和经验与JD要求高度匹配 2)候选人在最近于招聘网站更新过简历 如此一来这位HR可以直接从这n个整整齐齐排序的自有候选人中依次查看联络,而不需要再依赖一般来说需要付费的外界渠道。对于职位和候选人数量庞大的大型雇主来说,这个理想场景,如果能够实现,那是非常具有吸引力的。因此不论是在硅谷还是国内,都有一些公司尝试这个方向上的产品研发。但是,如上文所述,这个理想场景需要基于两个前提: 1)基于JD和简历的文本匹配技术是否能够达到有效甄选的水平(比如讲误杀的候选人数量是否比成功匹配的候选人数量多得多) 2)候选人的简历数据作为匹配的主要输入,是否能保持充分地更新度 第一点是说,基于文本(简历和JD)的匹配技术(主要基于是 自然语言处理(NLP)的算法)在充分的数据量(简历和JD)和人工干预(训练集)下,是否能使得系统(机器学习过程)输出近似于人类选择的结果。这种结果的近似度,就是衡量所谓AI的效度。那么这种近似度怎么衡量呢?一种简单的方式,就是针对同一个职位和对同一批简历,同时请系统和本公司的一个HR委员会进行筛选排序,然后对比两者的结果。举例来说,假设总共1000份简历,HR和系统都选择了其中的50份,那么这50份里面有多少是重合的?这个重合度就是机器判断的效果的一个主要衡量。如果重合的有45个,那么就是极为有效,近似自然误差;但是如果重合的只有10个,甚至个别,那么这个系统就基本无效,因为他误杀的简历比他推荐的多得多。 这里的挑战就是,我们不知道基于雇主有限的简历和JD语料,匹配有效性的极限是多少。比如说投递给各个岗位的,合格和不合格的50万份简历,能否构成一个足够有效的语料库?同时,雇主能够承担多大成本的人工标签工作?在现实的条件下,这些有限的语料和人工投入是否能够导出一个有效的AI推荐系统? 这个问题我们询问过Recruit研究院的CEO Alon Halevy教授,也请教过欧美市场最大的求职网站Indeed.com的总裁Chris Hyams,这两家机构拥有世界上最大数量的JD和简历数据,他们一方面对人工智能的在HR领域的应用保佑希望和期待也在践行,另一方便也保留一个成熟而且务实的观点。他们的回答都是有所保留的。他们有提到以下几点: 第一,目前的AI匹配技术仅仅在少数一些职位上达成足够高的可用性,比如说卡车司机。(卡车司机在美国是一个庞大群体,且其能力和要求较容易被模型化。) 第二,他们对AI匹配技术的预期是从1000份简历中剔除800份,而不是选出50份。选出50份的方式,主要还是靠更精细的关键词组合搜索。 第三,即使无限的机器学习过程使得某一家雇主的某一批职位能够逼近有效的机器筛选,这种筛选算法也无法在不经过新的训练过程的情况下,简单地推广到其他职位,更不要说其它雇主(原因之一是,同一个JD,不同的雇主其实要求是不同的,招聘需求有很多文本之外的“潜规则“);所以跨公司的,平台性质的普适匹配算法在可预见的未来是不现实的。 综上,人才和机会的AI匹配显然具有巨大的潜力和价值,但离商业化应用,还有一定距离。 王向导和Indeed.com总裁Chris Hyams以及仟寻联合创始人戴顺在位于美国奥斯汀的Indeed.com总部 除了匹配的效度以外,人才库盘活的第二个前提是候选人在各处的简历是否能够在库中保持更新。原因是显而易见的:不更新的简历不是一个可靠的匹配算法输入源,不能有效反应求职者的当前意愿。 这一点也有实现上的难度。这里的难度倒不在技术上,而在法律法规上。中国候选人更新简历的地方主要是在前程无忧、智联招聘和猎聘等求职网站上。而这些网站并不对外开放其简历数据库,且明确规定了获取其数据的合法方式。这意味着目前市面上所有的所谓“跨平台一键简历检索(Sourcing)”和“企业人才库简历自动更新”由于招聘网站的频繁反爬升级,经常出现各种体验糟糕的“服务故障”,我跟三大招聘网站的高级管理层曾经也有过关于这种生意模式的深入探讨,他们认为这种方法实际上从商业模式的本质上来说是属于“见不得光的生意”,不可持续,对于雇主来说账号的安全也存在很大的风险,因为雇主一旦在第三方的网站上面提供了用户名和密码信息等,是否被明文存贮都是未知的。 举一个实际的例子,这类网站经常会把用户的账号来拿在非工作时间,比如深夜2点开始爬取求职网站的数据库,一旦被扫描侦测到也会对雇主的账号进行封禁,这就引出了另一个话题:从多家使用过该类功能的雇主了解到,老板可能觉得还好,但由于三天两头出现问题,干活的Recruiter(招聘专员)基本不愿意用,导致买了一年的服务往往过了没几天就束之高阁;另一方面这些功能都是基于一个有明显法律瑕疵的数据获取方式,很多公司都要偷偷地避开合规部门的过问和审核。但是,数据获取问题其实还不是最主要的法律问题。 这里有一个更要命的问题,就是我国在个人信息保护方面的立法。这包括即将颁布的《个人信息保护法》,以及今年6月1日刚刚生效的两高《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》。《解释》中明确了: 第一条:刑法第二百五十三条之一规定的“公民个人信息”,是指以电子或者其他方式记录的能够单独或者与其他信息结合识别特定自然人身份或者反映特定自然人活动情况的各种信息,包括姓名、身份证件号码、通信通讯联系方式、住址、账号密码、财产状况、行踪轨迹等。 第三条:未经被收集者同意,将合法收集的公民个人信息向他人提供的,属于刑法第二百五十三条之一规定的“提供公民个人信息”。 第四条:违反国家有关规定,通过购买、收受、交换等方式获取公民个人信息,或者在履行职责、提供服务过程中收集公民个人信息的,属于刑法第二百五十三条之一第三款规定的“以其他方法非法获取公民个人信息”。 简单来讲,公民同意用户协议并将个人隐私信息授权给招聘网站是符合法律的;但是公民并没有授权一家雇主,使用某种软件工具,去采集、保存、分析他储存在招聘网站上的个人隐私数据(包括住址、联系方式、履历等,而且候选人实际上原先可以对指定的公司不显示更新以保护自己的隐私意图)。 简历到底是否属于刑法中定义的“公民个人信息”呢?答案是明确而且肯定的。去年发生过一起案件,智联招聘的两位前员工和他们的一位客户的人事经理(注意,这是一位人事经理!)非正常途径获取智联招聘数据库中的15万条简历信息进行倒买倒卖,智联前员工连同这位人事经理一起被判处3年6个月至1年6个月的有期徒刑。【1】 无独有偶,美国实际上在保护公民隐私的立法上也相当严格,美国招聘行业新秀TalentBin,也因为爬取数据并且出售给客户最终被告上法庭,法院最终作出裁决需要网站对未经授权并使用其信息的候选人进行赔偿。【2】 综上所述,因为职位描述(JD)/简历(CV)匹配技术的不成熟,以及更重要的,法律法规上的红线,“人才鱼塘盘活”目前看来似乎还是一个现实中荆棘遍布的良好愿望,当法规越来越明确,HR在使用这类产品的时候也会越来越谨慎。 王向导和Recruit Institute of Technology CEO Alon Halvey博士、前Google Data Research负责人以及仟寻联合创始人戴顺在位于硅谷山景城的RIT办公室 二、自动化测评: 典型的自动化测评主要包括基于文本的自然语言处理(NLP)和基于人脸识别的视频面试技术。基于NLP的测评又分为两种类型,包括开放性问题的文本回答,以及基于ChatBot(聊天机器人)对话的测评;机器则试图通过其文本回答中的语素分析来建模并且预测候选人的性格特征。而基于人脸识别的视频面试技术,分析视频面试时的语言表达、声调、表情和其他非语言因素,并进行建模且试图预测。这些甄选方式最主要的卖点是效率。即快速从大量面试者中挑选出值得下一轮人工面试的少部分候选人。但是这些测评方式的效果(效度)如何,即这些测评工具的结果是否靠谱,目前还没明确的证据和结论。 有关这个话题,可以先看Google的做法: 在2006年的夏天,Todd Carlisle,一个拥有组织心理学博士学位的Google分析师,设计了一份300题的问卷让每个员工填写。一些问题是封闭性问题:你曾经创造过世界纪录吗?一些则要求员给自己打分:请给自己的工作风格偏好打分,独立工作型(1分)还是团队工作型(5分)。还有一些很琐碎的问题:你养了什么类型的宠物? Google尝试将Google搜索的要求运用到人力资源过程中:它需要一套能在成千上万候选人中过滤筛选的搜索算法——Google的员工录用率约为0.2%,是哈佛大学录取率的1/25——拒绝掉一批顶尖的候选人。但在大量问答题及数据处理后,发现最好的表现预测因素不是G.P.A.,也不是宠物类型,也不是智力问答“钟表的指针一天会重合多少次?”唯一的最佳预测因素是:根本不存在(Absolutely nothing)。【3】 几年前,Google做了一项研究来验证是否在Google的每个招聘人员都特别擅长招聘。为此观察了上千场面试和几百个面试官,包括他们对候选人评分,也包括候选人最后在工作中的表现。最终结论是:这些变量中间没有丝毫联系。总体上来说是随机的,只存在一个例外:有一个面试官的评价是特别准确的,因为他负责一个非常专精的领域,而他本人恰巧是这个领域全球领先的专家。 也就是说,对于招聘过程而言,智力测试(Quiz)完全是浪费时间。一架飞机里能塞满多少高尔夫球?在曼哈顿有多少加油站?完全在浪费时间。这些题目不会帮助预见任何事。它们的功能主要是让面试显得“聪明“。 反而,最靠谱的还是结构化行为面试,在这类面试中有一系列连续的怎样评价候选人的指标,而不是仅让每个面试官自由发挥。 行为面试的作用还在于——你给候选人的不是一个假设性的问题,而是一个实际问题,比如说“告诉我你的一次解决分析性难题的经历“。行为化面试的有趣之处在于当你让别人讲述自身经历时,当你反复询问时,你会得到两方面的信息。一个是你将看到候选人是怎么应对现实世界的处境,另一个你会得到的珍贵的”元信息“(Meta Information)是对候选人来说什么是困难的。【4】 Google曾经因只雇佣30岁以下的候选人而闻名,使用智力测试来识别顶尖编程人才,信赖学术资格证书,尤其青睐有名校背景的候选人。而现在已经不再是这样:因为成绩单没有预测性。 有趣的是在Google公司没有接受过大学教育的员工比例在逐年上升。学术环境是人为的,在此环境中取得成功的人多少经受过相应的训练,他们能适应这种环境并取得成功。实际上,企业需要乐于解决没有明显答案的问题的员工。 回到自动化测评的话题。 如果Google经过一个庞大内部研究最后的结论是,大数在人才甄选上的价值仍旧有限,那么目前市场上的这些层出不穷的“AI黑科技”,比方说基于自然语言处理的甄选方式(比方说,通过判断候选人的写作或是语音回答中的用词和语调是否“正面积极”来判断其个性,继而预测其工作表现)或是基于人脸识别的方式(比如说,分析面部微表情和眼神反应,继而somehow预测其工作表现)是否真的能够以“一招鲜”的方式,完全取代人类判断呢? 三、被动求职者激活: 根据LinkedIn和中华英才的数据,在中国,80%的候选人是被动求职者。也就是说,会主动发起一个求职行为的候选人,只占到所有候选人中的20%。同时,这20%也往往是价值相对较低,职场经历相对较少的人群。 中国的招聘市场每年大约有1000亿人民币的规模。但是所有线上招聘提供商一年的收入加在一起只有50亿,只占到整个市场的5%。另外95%的交易都发生在各种线下渠道。也就是说,20%的被动求职者(会上各种招聘网站的用户)只能贡献5%的市场价值。同时雇主也不断抱怨招聘网站的效果越来越糟糕。 LinkedIn之所以能够以262亿美元的价格被微软收购(几乎十倍于在纽交所上市的中国最大的招聘网站前程无忧),是因为在全球的很多地区,LinkedIn把被动求职者一网打尽。在美国,每三个人中就有一个是LinkedIn的用户,也就是说除了家庭主妇、学生儿童、退休人士以外,几乎所有职场人都可以在LinkedIn上被找到。这使得原本的分散在各猎头公司数据库里的庞大匿名求职者群体变得触手可及。LinkedIn在北美和欧洲给企业带来的是这个价值,即,通过我你能找到几乎所有人。那么这些人来不来你们公司应聘,就是你雇主吸引力的问题了,所以LinkedIn另一个强调的点就是对你的目标群体加强雇主品牌宣贯。 有意思的是,中国由于其国情,有一个国人自己的互联网生态。纵然LinkedIn是少数几家在中国运营的世界十大网站,LinkedIn在中国也不能算是成功的。LinkedIn在中国仍旧主要是外企员工会使用的平台,即便使用,活跃度和LinkedIn在美国也不可同日而语。这里面有很多原因使然,其中几个主要原因或许是: 1)中国人的实用主义民族习惯:相比从小受到《圣经》熏陶,倾向于相信“神造万物,各按其时成为美好”的西方人,中国人不太在意每一样工具被创造出来时候的目的是什么。相比工具主义理念盛行的西方人自动地用Facebook去联络熟人朋友,用Twitter转发新闻,用Instagram拍照上传,WhatsApp进行即时通讯,用LinkedIn管理职场关系;实用主义思维下的中国人倾向于,如果一个工具能解决所有问题,那就都用它得了。因此,中国的社交媒体基本上就是一个词:微信。加LinkedIn没有问题,但是最好加了LinkedIn之后再加一下微信:咱们微信上聊。 2)中国人对陌生人社交的天然不感冒。对于在海外生活过,或是偶尔走出国门瞧瞧的朋友们来说,一个感受就是中国陌生人之间的信任成本非常高。因而在美国,将履历向大众公开,并和陌生人通过LinkedIn建立有效联系,一起出去喝一杯,是一件挺自然的事情;但是在中国,这就比较不寻常,比较不习惯。笔者认为这也是为何LinkedIn在中国没有发展那么迅速的原因之一。在中国,成功的陌生人社交,好像只有荷尔蒙社交。 因此LinkedIn在中国似乎总是处于一个叫好不叫座的情况。LinkedIn据称在中国有千家客户,根据HREC智享会在2016年的调研报告,其中似乎只有10%的客户会检测其使用效果,而剩下的90%,主要是把LinkedIn作为一个新的渠道进行没有明确预期的尝试。 回到主题,因为中国不存在一个连接广大被动求职者群体的平台,(或者说这个平台实际上就是微信:根据企鹅智库的数据报告,平均来说,实际上微信朋友关系中超过60%的每月新增朋友都是泛职场关系;换句话说,你的老朋友和老同学不会每月再增加,增加的一般都是工作相关的关系。微信已经越来越成为一个职业社交工具,而不再是纯粹的熟人社交工具。)导致这个品类在中国实际上是一个空白,也导致雇主不得不仍旧往往依赖于第三方猎头机构才能有效触达大量较为资深的专业人士。 有没有什么办法可以让这些被动求职者聚集到一处,并且不断主动访问呢?这个问题牵涉到社交网络、推荐算法、内容制造、ChatBot技术等一系列技术的综合运用。对被动求职者的触达和激活,意味着技术不再是仅仅去匹配一小部分的主动求职者,而是帮助雇主把视野扩大到全体劳动人民的范围。 相关引用: 智联招聘卖简历案终审 主管获刑三年半 TALENTBIN CANDIDATE PROFILE CLASS ACTION SETTLEMENT “In Head-Hunting, Big Data May Not Be Such a Big Deal,” by Adam Bryant, New York Times, June 19, 2013. “The Science of Smart Hiring,” by Derek Thompson, The Atlantic, April 10, 2016
    王向导
    2017年08月28日