\u200E
​PaddleHub新增100+优质模型,少量代码快速搭建AI魔镜带你对话未来!
发布日期:2021-12-22T11:58:00.000+0000 浏览量:114次
你是否也曾经幻想能和未来的 自己对话,问问未来的自己过的怎么样,当初的梦想都实现了吗? 现在PaddleHub可以帮你轻松实现,先快速看下效果。

这个项目中用到了PaddleHub中的最新模型,分别用到了 语音识别、图像生成、对话系统、声音克隆、唇纹生成等能力, 通过短短十几行代码实现了和未来的自己进行对话。

那么这么厉害的项目是如何实现的呢?我们先来看下技术拆解。


首先我们要模拟未来自己的样貌,也就是生成人脸变老的图像。我们选择了一个能够获得变老效果的模型styleganv2_editing,这个模型是PaddleGAN贡献的一个高质量人脸生成的模型,可以对年龄、性别、眼距等等十几种人脸属性进行编辑,能力十分强大。


第二步,我们要实现人机对话 ,需要先将一段音频识别成文字,再根据识别出的文字,生成回应的内容。于是我们在PaddleHub的模型库中选择了来源于PaddleSpeech的效果较好的中文语音识别模型u2_conformer_wenetspeech和来源于PaddleNLP的百度自研的基于十亿级别的中文对话数据plato-mini。

接下来,我们要把回应的内容变成拥有自己音色的语音。 这就要用到来源于PaddleSpeech的最新的声音克隆模型ge2e_fastspeech2_pwgan了,我们输入对未来的寄语的音频和刚刚生成的对话文本,即可得到克隆出来的音频。到这步我们就已经实现跟自己对话了。

最后我们需要将语音和图像结合起来,让变老的我们开口说话。 这步我们用到来源于PaddleGAN的wav2lip模型,经过以下两行代码,载入模型和模型预测,即可把我们未来的样貌和对话的语音,合成一个能对的上口型的视频了。

完整项目地址:
https://aistudio.baidu.com/aistudio/projectdetail/3216625

PaddleHub 是飞桨官方推出的 预训练模型应用工具 入门简单,代码简洁,模型丰富,会python就能用,十行代码搞定预测,场景模型丰富实用。 不论是入门,还是想玩出各种花样的应用项目,PaddleHub都非常合适。

 
近期,PaddleHub新增了100多个新模型,支持声音克隆、声音分类和检测、语音合成(TTS)、语音识别(ASR)、机器翻译、同声传译、视频多目标追踪、唇纹生成等等任务,让我们一起来看看PaddleHub的效果如何。
  • 图像领域:212个模型。包括图像分类、人脸检测、口罩检测、车辆检测、关键点检测、人像分割、语言文本识别、图像超分/上色/动漫化等任务模型,实现效果见下图。

  • 文本领域:130个模型。包括中文分词、词性标注、句法分析、AI写诗/对联/情话/藏头诗、情感分析、文本审核、机器翻译、同声传译等,实现效果见下图。


目前,PaddleHub中的模型已经覆盖 5大领域、包含数十种任务、囊括360+模型 ,都是精选效果好又实用的模型,而且所有模型,都可以在10行代码以内完成预测。

新增模型库索引页,360+模型全景概览,分类清晰明了,让你能够迅速找到心仪模型。



十行以内一键预测



文档中的预测代码和API信息整洁清晰,复制即用。




 一行代码实现服务化部署



部署指令简单,教程详细,轻松部署。

 
怎么样,有没有心动?

PaddleHub目前累计star数量已超过7.2K,频频登上Github Trending日榜月榜,used by 570+,还有不少小伙伴频频贡献,也是深受开发者喜爱


画重点: 入门快,代码少,模型多,超实用
同时也项目目前有很多外部开发者参与建设,也欢迎大家一起参与和贡献


如果觉得效果不错,也欢迎给项目点点star加个关注。
 https://github.com/PaddlePaddle/PaddleHub


另外,repo中也贴心的给出了官方微信群,有问题可以添加“飞桨小助手”回复“hub”获得进群链接,技术讨论与答疑更高效。 同时,对PaddleHub感兴趣也希望做出更多有趣事情的同学也可以回复“sig”加入PPSIG Addons-Hub小组。

 
PaddleHub地址:
GitHub: 
https://github.com/PaddlePaddle/PaddleHub
Gitee:
https://gitee.com/paddlepaddle/PaddleHub
官网地址:
https://www.paddlepaddle.org.cn/hub

关注公众号,获取更多技术内容~