\u200E
聚焦可信AI与产业应用,百度联合发起千言计划实现情感分析2.0升级
发布日期:2021-10-21T13:38:52.000+0000 浏览量:73次
数据集是推动自然语言处理技术进步的基石。为应对自然语言处理技术应用中面临的多领域、多场景等诸多挑战,百度联合中国计算机学会、中国中文信息学会,于2020年8月共同发起中文自然语言处理数据共建计划——“千言”, 推进中文信息处理技术的进步。

发布一年多以来,“千言”已针对开放域对话、阅读理解和情感分析等8个任务,汇集了来自11所高校和企业的28个开源数据集。其中,情感分析作为自然语言处理技术的基本任务之一,涵盖了句子级情感分类、评价对象级情感分类、观点抽取三个经典任务数据集,吸引了来自京东、网易、小米、平安、OPPO、新浪等多家知名企业的近300支团队参加打榜。

近日,为了更好地推动情感分析技术在大规模产业化的应用,中文信息学会情感计算专业委员会、美团与百度共同发布千言-情感分析2.0,实现两方面的重大升级。首先,在继续关注模型准确率效果的同时,加强对模型是否“可信”的评估,发布业界首个中文情感可信数据集DuTrust;其次,针对产业化中面临的任务类型、数据模态多样化的难题,提供面向真实应用场景的大规模、高质量、多模态的情感分析数据,发布业界最大规模的中文评论分析数据集ASAP和面向推荐场景的多模态情感标签数据集DuVideoSenti。



“可信AI”的概念在近几年提出,并且逐渐成为全球共识。可信AI,就是保证AI系统的可解释性、鲁棒性和公平性,确保算法可被人信任。在情感分析技术的科学研究和产业落地中,可信情感分析系统需要具备较强的鲁棒性和可解释能力,也就是要求模型针对各种不同表达,既能给出精准的预测结果,还能给出其判断依据,从而保证模型的预测结果更加置信。

作为业界首个中文情感可信数据集,DuTrust基于人工标注的扰动数据和情感证据,全部来源于真实用户评论数据,同时测试模型的鲁棒性和可解释性,全面评估模型的可信能力。

中文情感可信数据集DuTrust数据样例

以上述评论数据为例,DuTrust首先为每个样例对应标注一个扰动样本,并且标注原始样本和扰动样本的情感类别,通过计算模型在原始样例和扰动样例上预测的准确率(Accuracy)作为模型鲁棒性的评估指标。

此外,DuTrust还分别为原始样例以及扰动样例人工标注了情感的判断依据,在可解释性评估时,需要用户同时给出模型的情感判别依据,最终通过计算其与人工标注结果在字粒度上重合度F1值(F1-measure)作为模型可解释性的评估指标。




联合发布业界最大规模的

中文评论分析数据集ASAP [2]


在电商场景下,一般来说情感分析涉及评论得分预估和对象级情感分类两个最基础的任务。两个任务之间天然存在很强的关联性,且在商业应用中也通常一起使用。然而现有的中文公开数据集大都针对两个任务分别构建,未能将两类任务有效联系起来。

此次“千言”与美团联合发布的业界最大规模中文评论分析数据集ASAP,首次实现对评论得分预估和对象级情感分类两个任务的联合标注,数据全部源于真实的电商场景,从数据规模和标注质量上都远超其他数据集。

中文评论分析数据集ASAP数据样例

该数据集针对输入的评论文本,人工标注整体的评论得分(1-5分),以及对应不同评价对象的情感类别(积极、消极、中性三种),并且使用准确率(Accuracy)评估模型的预测效果。




面向推荐场景的多模态

视频情感标签数据集 DuVideoSenti [3]


目前,个性化推荐技术迅猛发展,成为继搜索引擎之后的又一重要的信息获取途径。推荐系统的目的是为用户提供个性化的内容和服务,帮助用户快速高效的获取个性化信息。

在真实的应用场景中,往往存在大量内容题材、质量相同,但却能给用户带来不同视觉冲击和情感感受的资源。针对这类资源,需要构建能够刻画用户不同的视觉和情感感受的完备的标签体系,才能将其更好地应用于推荐系统,提升用户的体验。

    千言面向推荐场景推出多模态情感标签数据集DuVideoSenti,引入视频情感泛标签预测任务,构建了视频情感泛标签体系。该体系由人工定义的“文艺清新”、“时尚炫酷”、“舒适温馨”等11个情感泛标签组成,用以刻画用户浏览视频后的视觉和情感方面的感受。数据集为每个小视频标注了情感泛标签,并且提供了视频的标题、帧图特征用于模型的训练和预测。在测试中使用准确率(Accuracy)用于评估模型的预测效果。本数据集聚焦情感分析技术在个性化推荐场景中的应用,同时有助于推动多模态学习技术的发展。

多模态视频情感标签数据集DuVideoSenti数据样例




举办基于千言-情感分析2.0的评测比赛


为了进一步推动情感分析相关研究,中国中文信息学会情感计算专业委员会与千言开源数据集项目组(www.luge.ai)还联合举办“千言情感分析常规评测比赛”,目前已有来自国内知名企业及高校超1000位选手报名参赛。

据悉,本次比赛就以千言-情感分析2.0为核心,全面评估情感分析模型在多种模态场景下的预测准确率、模型的鲁棒性和可解释性指标。除了有挑战性的赛题,百度飞桨 AI Studio 将为选手提供免费的Tesla V100 GPU算力,千言数据集还将为优胜团队颁发证书,并发放精美的定制礼品。

报名及竞赛详情链接:
https://aistudio.baidu.com/aistudio/competition/detail/50/0/task-definition

未来,希望有更多的情感分析领域科研学者、领域专家参与共建千言-情感分析榜单,共同推动中文情感分析技术的进步,建设世界范围内的中文情感分析影响力。




微信交流群


扫码添加千言助手微信,发送关键词“情感分析”,即可加入交流群。





合作单位


中国中文信息学会情感计算专业委员会
千言数据集
美团公司
百度公司




论文引用


[1] Wang L, Liu H, Peng S, et al. A Sentiment Analysis Dataset for Trustworthiness Evaluation[J]. arXiv preprint arXiv:2108.13140, 2021.
[2] Bu J, Ren L, Zheng S, et al. ASAP: A Chinese Review Dataset Towards Aspect Category Sentiment Analysis and Rating Prediction[J]. arXiv preprint arXiv:2103.06605, 2021.
[3] Tang, H., Liu, H., Xiao, X., & Wu, H. (2021). A Multimodal Sentiment Dataset for Video Recommendation. ArXiv, abs/2109.08333.




长按下方二维码立即

Star

更多信息:

  1. 飞桨官方QQ群:793866180

  2. 飞桨官网网址:

    www.paddlepaddle.org.cn/

  3. 飞桨开源框架项目地址:

    GitHub:

    github.com/PaddlePaddle/Paddle 
    Gitee:

    gitee.com/paddlepaddle/Paddle

  4. 欢迎在飞桨论坛讨论交流~~

    http://discuss.paddlepaddle.org.cn