二丫美食生活
当前位置:首页 - 科幻 >

百度数据众包,中国人工智能数据质量引领者

2019-04-10来源:高端财经网


2018年12月14日,由百度数据众包主办的“AI之道数聚为赢”沙龙在三亚召开,来自百度内部产品线、行业内领跑企业以及人工智能学术圈的多位代表共同出席,就AI行业基础数据服务的现状及趋势展开了深度讨论。


百度众测数据业务总经理——曾虹云


首先,百度数据众包数据业务总经理曾虹云以“人工+智能,引领数据行业的质量新标准”为主题发表演讲, 他表示目前各地区政府、各个行业都在积极拥抱AI,AI数据需求规模会越来越庞大,使用场景也会更加多样化,同时对数据质量的要求也会越来越严苛,如何能够在单位时间内提高数据的准确度是行业的核心诉求,而百度数据众包在数据质量把控上具备了独一无二的优势。


百度数据众包是从百度内部成长起来的AI数据服务平台,自2011年起一直致力于服务百度内部产品线对人工智能数据的采集和标注需求,累计服务了131条内部产品线,涵盖了计算机视觉、语音识别、自然语言处理、知识图谱等AI主流技术领域。凭借着多年丰富的内部项目经验及百度内部技术能力的支持,百度数据众包可以高质量完成各类项目。


以人像采集为例,百度数据众包在接到客户需求后会制定采集方案并进行小流量测试,将小流量测试结果反馈客户并与客户沟通验收标准,反复磨合确认最终方案后开始正式采集。在采集前百度数据众包会采用百度的人脸识别技术对被采者进行拍照入库去重检测,保证被采者的唯一性。同时百度数据众包对用户隐私的保护也非常严格,要求所有被采者均需签订数据授权协议后才可开始采集,采集结果通过百度微任务APP实时回传后会经过MD5技术检测做一道防止重复提交的技术把控,再由百度的标注基地人员进行多轮比对质检,最终将高质量的数据反馈给合作伙伴。


百度数据众包合作伙伴(部分)


正因为百度数据众包在定制服务、业务规模、数据质量、数据安全这四个维度的强大竞争力使得百度数据众包能够承载和满足AI客户落地应用99%的场景需求。在2018年的成绩单上,百度数据众包年收入2.25亿元,合作伙伴覆盖了以华为、小米、OPPO、ViVO为代表的知名手机品牌,以蔚来汽车、小鹏汽车、Momenta、奔驰为代表的知名汽车厂商,以旷世、爱笔、云从科技为代表的知名AI公司及以腾讯、网易、ebay为代表的大型互联网企业。成功支持了众多合作伙伴的新品上市,并与政府合作建立标注基地解决9000+人就业问题。


“行业数据需求分析及趋势展望” 圆桌讨论


在接下来的圆桌讨论环节中,各AI代表围绕着数据需求、数据精确度的痛点、对未来数据处理平台的展望等要点展开讨论。


天津大学智能与计算学部教授、博士生导师——王文俊


在数据需求上,天津大学智能与计算学部教授、博士生导师王文俊教授表示由于其研究学术方向为智慧城市及公共安全,因此数据需求主要来自政府数据、运营商数据及开源数据。而小米AI实验室高级产品经理张和则从商业领域上论述了目前小米的数据需求,一是小爱同学智能音箱的语音数据,二是基于小米手机拍照功能优化的图像数据。对于公开数据集这一数据来源渠道,其认为公开数据集因数据获取壁垒太低,无法实现算法的差异化。对于竞争激烈的市场环境,需要定制化的数据才能构建技术、产品的差异,所以其更倾向于找百度数据众包平台合作做定制化采集及标注。


百度技术体系技术委员会主席——杨斐


在数据精确度上,各家看法一致,百度技术体系技术委员会主席杨斐认为AI时代是数据驱动的时代,数据质量对算法模型精准度的提升作用非常大,他以自动驾驶举例称,在过去与百度数据众包的合作中,百度数据众包提供的高精准数据对百度无人车算法模型的提升起到了很大的帮助作用。小米的张和也表示小米最看重的还是数据的精确度,“小米以前也采用过其他的众包平台,但因为这些平台无法满足质量要求,因此今年小米将大部分数据预算都投在了百度数据众包上,百度数据众包也不负所托高质量完成了众多项目。”


小米AI实验室高级产品经理——张和


对于未来的数据平台期望,张和从小米手机国际化需求及更新迭代角度出发,希望未来的平台能具备国际化的采集能力,持续提高采集速度,以及支持更加定制化的标注需求。而百度数据众包在全球22个国家的采集能力、私有化的标注平台部署都恰好能满足小米的需求。百度杨斐则希望数据平台可以通过与一些技术手段结合来大幅提高产能,将AI时代的“铁锹”升级为“挖掘机”,从而降低标注的成本。关于自动化标注能力的建设正是百度数据众包平台目前正在大力研发的,未来百度数据众包将通过“自动化机器标注+人工标注”结合的方式进一步提高准确度及降低标注成本。而天津大学的王教授看到了百度与山西政府在标注基地等方面合作,期望百度数据众包也能有机会与天津政府合作,加快人工智能产业在天津的落地。


百度数据众包凭借着完善的流程管理及先进的技术和平台能力,目前已经处于行业领先位置。在未来2年,百度数据众包将继续围绕AI战略,持续提高平台在人工智能数据领域的专业度,致力于做中国人工智能数据质量的引领者,为AI时代添煤加水。


转载文章地址:http://www.jmsldb.com/kehuan/437.html
(本文来自二丫美食生活整合文章:http://www.jmsldb.com)未经允许,不得转载!
标签:
相关推荐
网站简介 联系我们 网站申明 网站地图

版权所有:www.jmsldb.com ©2017 二丫美食生活

二丫美食生活提供的所有内容均是网络转载或网友提供,本站仅提供内容展示服务,不承认任何法律责任。