• 黄适文
    集智数据:想用众包的方式帮助企业分析非结构化数据 来源:猎云网(微信:ilieyun)文/郑桂兰   “第一次接触到数据众包的概念,是在四年前刚到美国念书的时候。那时候我是伊利诺伊大学的香槟分校计算机科学的研究生,做的是人工智能相关的研究。研究的过程当中,我发现大量标注的数据是推动人工智能发展的关键。”集智数据创始人黄适文在接受猎云网采访的时候这样说到。   黄适文,一个台湾海归选择在深圳创业,集智数据算是他回国的首秀,美国伊利诺伊大学计算机科学硕士,华盛顿大学计算机科学博士生,曾经发表十多篇关于国际计算机科学的论文。他表示目前数据众包仍以英文为主,市场上没有一个很好的数据众包平台可以标注中文的数据,导致许多国内的研究人员必须使用英文的数据来发展他们的研究。因此黄适文跟研究伙伴决定回到国内创立集智数据,提供一个中文数据的众包标注平台。   目前集智数据的主要业务是为数据处理,为企业提供图像标注、数据采集和舆情分析等服务。集智数据平台分为两个端口,在线用户和发布任务的客户。客户通过API接口自行设计并且发布数据任务,由集智数据把繁杂的数据分割成微任务,推送给在线用户。在线用户可根据自己的时间及技能灵活选择任务,集智数据最后会通过系统把结果反馈给任务发布方,确保满意的结果之后用户才会得到收益。   事实上数据科学早已不是新鲜事物了,不过对数据质量的需求却是这几年才激增起来的。这可不是一阵时尚或旧词新用,而是一场变革。大至总统选举,小至总部设在厨房餐桌的小创业公司的各种决策,已不再是建立于直觉与猜想之上,而是植根于真实可靠的数据。 数据科学发展日新月异,如今各种数据工具已经形成了一个庞大的生态系统。可现实中大部分的非结构化的数据是无法直接使用的,电脑也是无法分析的,比如要概括文字档里包含的情绪、分析图片上的物体、将录音变成逐字稿或者将影片转换成文字稿等,这要使用人工才能得到准确的结果。简单来说,集智数据要做的就是处理一些对于人来说很简单,但是对电脑智能很难的数据。   黄适文向猎云网介绍,由于时空限制,传统劳动力市场呈现雇主与雇员简单的一对一关系。这种雇佣关系难以随时间地点与工作量灵活调节,工作内容的繁杂琐事与复杂的任务也无法分离,阻碍了工作效率的提高。而集智提供的众包平台希望打破以个体为单位的传统劳动力市场格局,开创以“工作任务”为中心的扁平化雇佣关系。   目前国内数据众包平台有数据堂、众客堂、猪八戒等。数据堂在国内做数据众包比较早,主要是为企业定制方案,企业有需求,就会为其定制任务。众客堂是一款App,推广重点是用户可以利用闲事去赚钱。用户使用手机完成任务申请,制作后即可拿到现金报酬,也可以通过支付宝实时提现。任务主要有方言的录音,图像的采集、传一份日程安排等,用户可以快速完成任务。猪八戒的服务交易品类涵盖较多,比如平面设计、动画视频、网站建设、装修设计、文案策划等,形式较多,但用时会较长。集智数据更多的可以说是一个工具,客户自己有需求就可以自己发布任务,更多的是注重客户的体验。   据了解,集智数据将在近期上线,平台会对前100名注册客户提供1000元的额度免费发布数据标注任务。而平台的主要盈利点是计划从用户中抽取20%的佣金,未来会增加相关的增值服务,比如顾问的费用。此外,集智数据在将来也会在微信公众号每周会发布一些有趣的实验,以及一些翻译国外大数据产业的相关报告,或甚至分享一些集智数据自己产品开发的经验与心得。   目前集智数据正在积极寻求天使轮融资。  
    黄适文
    2015年11月04日