\u200E
百度助力数据挖掘世界杯KDD Cup 历史性革新
发布日期:2019-08-12T16:00:00.000+0000 浏览量:1143次

8月6日,一年一度的KDD(国际数据挖掘与知识发现)大会召开,这是数据挖掘领域国际最高级别会议,而其旗下赛事KDD Cup 被称为数据挖掘领域的“世界杯”。今年,KDD Cup 在赛制上进行了诸多创新,百度公司赞助并出题的常规机器学习竞赛(Regular ML Track)不仅刷新了参赛人数记录,也首次设置开放研究赛题,中国军团也不负众望,斩获大部分重量级奖项。同时,百度也是赛事的钻石赞助商,助推赛事奖金水涨船高。其创新的赛制与投入,也获得了KDD主席团的致信感谢。

640?wx_fmt=png

KDD Cup 颁奖仪式现场

上千队伍云集,数据挖掘世界杯“神仙打架”

据悉,KDD Cup (国际知识发现和数据挖掘竞赛)由ACM(美国计算机协会)举办,后者是世界上影响力最强的科学性及教育性计算机组织。今年4月,历经重重答辩PK之后,百度脱颖而出,继微软研究院、雅虎等世界顶级科技公司或研究机构,拿下了KDD Cup 2019主赛道常规机器学习竞赛的主办权。

在KDD Cup DAY演讲环节中,赛事组委会成员强调这项赛事已经深刻影响着业内的个体、企业与研究机构。组委会还认为赛事承办方应当让赛事在具有挑战性之余,也将它处于可控范围之内,经过慎重选拔,百度被确立为常规机器学习竞赛的承办方。作为国内外均享有盛誉的人工智能巨头,百度在人工智能、大数据、计算机科学等领域均具备领先地位,并且在AI落地与产业智能化方面成绩卓著,这也是组委会选择百度的重要原因。

大会议程显示,颁奖现场具有主席致辞、颁奖仪式、大会演讲、Spotlight、Panel等一系列完整的闭环议程,反映出KDD Cup 在整个KDD大会中的分量。据统计,今年的KDD Cup 一共获得来自 39 个国家 230 所学术/研究机构一共 2000 多支队伍的注册。

其中,由百度主办的常规机器学习竞赛就吸引了超过1700支队伍的2403位个人开发者。这一数字创造了历史,不仅超过往届官方统计人数的三倍,也超过了KDD Cup 2019其他Track人数的10倍。参赛者既包括了CMU、UIUC、Cornell、清华、北大等国内外顶尖学府的学子,也有来自微软、亚马逊、IBM、阿里巴巴、腾讯等几乎所有国内外一线互联网公司的工程师。

本届KDD Cup 常规赛道冠亚军为蚂蚁金服团队和上海微盟、趋势科技、滴滴出行、北京邮电大学、华南理工大学、京东等单位组成的联合团队;而日本NTT DOCOMO公司团队与东南大学团队斩获了开放赛道的前二名;额外设立的PaddlePaddle特别奖桂冠则花落中科大团队。

640?wx_fmt=other

KDD Cup 百度组委会负责人熊辉教授,介绍赛事整体情况

颁奖现场还公开了本届赛事的一个亮点:在KDD Cup 2019钻石赞助商百度的助力下,常规机器学习竞赛总奖金达到45000美金,这也助推KDD Cup 奖金池刷新了历史记录。现场有学界教授接受采访认为,奖金升级的背后反映出科技产学研赛事日趋走高的热度,以及业界对于AI技术和AI人才的切实需求。

百度引领赛事革新 大会主席致信感谢

与以往“参赛者”的身份不同,今年百度成为了“出题官”。此次KDD Cup 常规机器学习竞赛包括两个任务:“场景感知的多模态出行推荐”和开放命题应用竞赛。“场景感知的多模态出行推荐”源自百度真实业务场景,参赛者需要基于百度提供的海量数据,在考虑城市复杂出行情境下从多种出行方式,如步行、骑车、打车以及它们的组合方案,为用户推荐合适的出行方式。

640?wx_fmt=other

Regular ML 赛题设计

而开放命题应用竞赛允许参赛者利用百度开放的大数据自由命题,探索百度大数据在智能城市领域的应用。该赛道还专门设置了PaddlePaddle特别奖,基于百度大数据和飞桨(PaddlePaddle)平台,获奖队伍提出了一项多模态协同的联合调度研究方案,在时空预测的基础上使用强化学习获得长期的最优调度以及协同调度策略,可进一步提升公共交通资源的使用效率。

据了解,为进一步优化赛事的进程和系统,ACM与百度对本届赛事的组织和评审进行了多项创新。其中,“场景感知的多模态出行推荐”赛道不仅设置了全新的评分方式,还在总决赛启用了点石平台虚拟环境复现评审机制,评委团由百度的科学家和资深工程师组成,进一步确保了评分公正。

KDD Cup 百度组委会负责人、百度研究院商业智能实验室主任熊辉教授表示:“本次比赛首次设置了模型推荐得分、模型效率得分和评委会得分综合打分的制度,综合考虑模型推荐能力、模型效率和模型创新性,避免选手技术方案过度堆叠模型失去可部署性和可解释性。

本届赛事主席团(KDD Cup Chairs)也对开放命题的设置给予了高度评价:“KDD Cup 举办20多年来第一次设置开放研究赛题,使比赛不再局限于预定好的指标,而是允许选手发挥创造性研究新问题,这也反映了从数据和数据科学创新中发现新知识的精神,我们将会继续为未来KDD Cup 的举办方推荐这一赛制。”并特别致信感谢了百度为赛事投入的人力资源以及百度飞桨(PaddlePaddle)为选手提供的免费计算资源,造就了一项成功的赛事。

640?wx_fmt=other

作为数据挖掘顶级会议KDD的重要环节,KDD Cup 2019的成功举办让更多人认识到前沿数据挖掘技术解决实际问题的重要意义,以及AI技术对于人们智能生活场景潜在的推动力。当前,作为智能城市的重要组成部分,百度地图、智能交通等各项产品正在加速落地应用,作为国内人工智能“头雁”企业,百度也在致力于开放更多AI能力,并继续与海内外顶尖学术组织合作,以赛事、培训班、加速器等形式促进产学研融合,为中国AI技术往更垂直、更基础的场景渗透奠定了坚实的基础。

想与更多的深度学习开发者交流,请加入飞桨官方QQ群:432676488