信息抽取旨在将非结构化文本中的信息进行结构化,是自然语言处理的基础技术和重要研究领域,一直受到学术界和工业界广泛关注。传统的信息抽取任务与评测通常针对特定的文本领域和单一的抽取任务,难以评估相关技术与方法在通用场景和任务下的抽取性能。
数据描述
Seen Schema:举办方收集了大量开源数据集供参赛者构建模型,该赛道主要评测现有技术基于标记数据构建模型的能力,数据集列表及下载链接请见赛事报名页;
Unseen Schema:主要来自百度信息抽取的实际案例,举办方仅提供少量的验证数据,用于参赛者进行抽取需求确认和模型验证,该赛道主要评测现有技术面向新的抽取需求的迁移能力。
赛程安排
评测奖励
丰厚奖金:第一名30000人民币、第二名20000人民币、第三名10000人民币、创新奖5000元(共设立两项)。
荣誉证书:获奖团队将由赛事主办方颁发权威获奖证书。
学习交流机会:在赛事群中与参赛者、组织者深入交流;
前沿技术实践:在竞赛平台展开前沿的多任务建模实践;
精美礼品&参赛证明:正式报名参赛并提交最终结果的队伍每位成员将获得千言数据集精美的定制周边一份,并发放参赛证明。
任务交流平台
关注【飞桨PaddlePaddle】公众号
获取更多技术内容~
信息抽取旨在将非结构化文本中的信息进行结构化,是自然语言处理的基础技术和重要研究领域,一直受到学术界和工业界广泛关注。传统的信息抽取任务与评测通常针对特定的文本领域和单一的抽取任务,难以评估相关技术与方法在通用场景和任务下的抽取性能。
数据描述
Seen Schema:举办方收集了大量开源数据集供参赛者构建模型,该赛道主要评测现有技术基于标记数据构建模型的能力,数据集列表及下载链接请见赛事报名页;
Unseen Schema:主要来自百度信息抽取的实际案例,举办方仅提供少量的验证数据,用于参赛者进行抽取需求确认和模型验证,该赛道主要评测现有技术面向新的抽取需求的迁移能力。
赛程安排
评测奖励
丰厚奖金:第一名30000人民币、第二名20000人民币、第三名10000人民币、创新奖5000元(共设立两项)。
荣誉证书:获奖团队将由赛事主办方颁发权威获奖证书。
学习交流机会:在赛事群中与参赛者、组织者深入交流;
前沿技术实践:在竞赛平台展开前沿的多任务建模实践;
精美礼品&参赛证明:正式报名参赛并提交最终结果的队伍每位成员将获得千言数据集精美的定制周边一份,并发放参赛证明。
任务交流平台
关注【飞桨PaddlePaddle】公众号
获取更多技术内容~