十一月 BML 预置模型调参再添新利器,新增文字识别模型,可识别20+语种,支持图片的文字标注, 预置飞桨独家 PP-OCR 模型,支持表单式建模,为开发者提供更便捷的“炼丹”方式。EasyDL 图像分类上线「免训练极速迭代模式」,数据新增无需训练可得新模型,可广泛适用于数据集量大、模型迭代频繁的业务场景,如零售快消行业等。
支持20+语种的文字识别,可广泛处理国际合同、外语教材等多语种场景
功能优势:开发者在图像分类任务下选择快速迭代模式,新增标签/数据时无需再次训练即可更新模型,极大提高开发效率
支持检测并识别合同文件或常用票据中的印章,输出文字内容及印章位置信息,支持圆形章、椭圆形章、方形章等常见印章;多档次数包火热开售,单次调用低至0.008元。
支持13类常见财务票据智能分类及结构化识别,无需提前手动分类,可自动切分识别粘贴在同一张 A4 纸上的多张不同票据;同时可返回发票验真所需的6要素信息,方便快速对接验真服务;多档次数包火热开售,单次调用低至0.03元。
结构化识别出生医学证明的23个关键字段,可用于新生儿身份登记、入学登记、生育险报销等场景;多档规格“次数包”火热开售,单次调用低至0.018元。
结构化识别各类常见版式面单的4个关键字段信息:收/寄件人手机号、运单号、条形码;新增支持各角度旋转面单识别,贴近真实业务拍摄场景;同时专项优化京东、顺丰面单版式识别效果,大幅提升手机号、运单号字段的识别准确率。支持 Android、iOS 操作系统,可集成在手机、PDA 巴枪、驿站高拍仪等设备中,毫秒级响应,节省派送过程中的每一秒。
新增长图识别能力,最长可支持边长8192px,大小在 10M 以内的图片文字识别;支持英文内容按照单词维度输出结果,方便提取单词粒度文本进行业务开发。针对包含弯曲文本、艺术字体、特殊符号等文字内容,以及含多余背景、低像素、非均匀光照等复杂场景下的文本数据专项优化,基于百度自研文字识别算法方案,增强语义理解能力,提高文本特征鲁棒性,大幅提升识别准确率,助力各行各业准确快速提取业务图片中的文本内容。
新增近千条词典内容,覆盖最新公布的“清朗·饭圈乱象整治”专项行动中,所涉及的政治人物敏感词汇、劣迹艺人等,实时降低业务风险。
新增对在离线混合模式下 5G 网络的支持,提升稳定性。
飞桨企业版-零门槛 AI 开发平台 EasyDL
功能优势:相较于此前矩形标注,能够更贴合目标物体的轮廓进行标注。从而获得识别度更准确的模型
对 EasyDL 物体检测任务的超高精度算法进行性能优化,效果显著。以工业质检流水线场景为例,此前流水线一个零件是否存在瑕疵的预测,结果返回时间平均为 3400ms,上线后该时间平均缩短为 1400ms,极大提高了场景应用的落地效率。
飞桨企业版–全功能 AI 开发平台 BML
BML 新增预付费小时包,包含 GPU/CPU 等多种规格训练算力,适用于预置模型调参、Notebook 训练、自定义作业等多种训练方式,速度快、资费低,训练算力最低仅1.2元/小时。
飞桨 PaddlePaddle 开源深度学习平台
移动端超轻量目标检测算法 PP-PicoDet
PP-PicoDet 采用百度自研的超轻量、高精度骨干网络--ESNet,其系列中的 PP-PicoDet-S_320 参数量仅0.99M,精度可达到30.6%mAP,推理速度可达150FPS。
速度在 FP16 下 122FPS 的情况下,精度可达到51.8%AP。对关键点检测人数无上限,针对大尺幅图像中的小目标及多人同时检测等产业场景,精度和速度都有显著优势。
提供跨镜头跟踪、人流/车流计数等系列能力与应用,覆盖人、自行车、小轿车等上十种目标类型,同时覆盖小目标等复杂场景;内置业界领先的跟踪算法 DeepSort、FairMOT,结合百度自研特色 ReID 和明星检测模型,灵活适配多种场景,高精且实时。
小事科技成都有限公司等多家优质服务商在 AI 市场上线并售卖:垃圾分类破袋检测软硬一体方案、巡防上报巡逻巡检任务下派方案、高性价比 DTU、RV1126 雷视一体机通用 AI 视觉组件等软硬件产品。
1. 苏州光创电子科技有限公司- -RV1126雷视一体机通用 AI 视觉组件
关注公众号,获取更多技术内容~
十一月 BML 预置模型调参再添新利器,新增文字识别模型,可识别20+语种,支持图片的文字标注, 预置飞桨独家 PP-OCR 模型,支持表单式建模,为开发者提供更便捷的“炼丹”方式。EasyDL 图像分类上线「免训练极速迭代模式」,数据新增无需训练可得新模型,可广泛适用于数据集量大、模型迭代频繁的业务场景,如零售快消行业等。
支持20+语种的文字识别,可广泛处理国际合同、外语教材等多语种场景
功能优势:开发者在图像分类任务下选择快速迭代模式,新增标签/数据时无需再次训练即可更新模型,极大提高开发效率
支持检测并识别合同文件或常用票据中的印章,输出文字内容及印章位置信息,支持圆形章、椭圆形章、方形章等常见印章;多档次数包火热开售,单次调用低至0.008元。
支持13类常见财务票据智能分类及结构化识别,无需提前手动分类,可自动切分识别粘贴在同一张 A4 纸上的多张不同票据;同时可返回发票验真所需的6要素信息,方便快速对接验真服务;多档次数包火热开售,单次调用低至0.03元。
结构化识别出生医学证明的23个关键字段,可用于新生儿身份登记、入学登记、生育险报销等场景;多档规格“次数包”火热开售,单次调用低至0.018元。
结构化识别各类常见版式面单的4个关键字段信息:收/寄件人手机号、运单号、条形码;新增支持各角度旋转面单识别,贴近真实业务拍摄场景;同时专项优化京东、顺丰面单版式识别效果,大幅提升手机号、运单号字段的识别准确率。支持 Android、iOS 操作系统,可集成在手机、PDA 巴枪、驿站高拍仪等设备中,毫秒级响应,节省派送过程中的每一秒。
新增长图识别能力,最长可支持边长8192px,大小在 10M 以内的图片文字识别;支持英文内容按照单词维度输出结果,方便提取单词粒度文本进行业务开发。针对包含弯曲文本、艺术字体、特殊符号等文字内容,以及含多余背景、低像素、非均匀光照等复杂场景下的文本数据专项优化,基于百度自研文字识别算法方案,增强语义理解能力,提高文本特征鲁棒性,大幅提升识别准确率,助力各行各业准确快速提取业务图片中的文本内容。
新增近千条词典内容,覆盖最新公布的“清朗·饭圈乱象整治”专项行动中,所涉及的政治人物敏感词汇、劣迹艺人等,实时降低业务风险。
新增对在离线混合模式下 5G 网络的支持,提升稳定性。
飞桨企业版-零门槛 AI 开发平台 EasyDL
功能优势:相较于此前矩形标注,能够更贴合目标物体的轮廓进行标注。从而获得识别度更准确的模型
对 EasyDL 物体检测任务的超高精度算法进行性能优化,效果显著。以工业质检流水线场景为例,此前流水线一个零件是否存在瑕疵的预测,结果返回时间平均为 3400ms,上线后该时间平均缩短为 1400ms,极大提高了场景应用的落地效率。
飞桨企业版–全功能 AI 开发平台 BML
BML 新增预付费小时包,包含 GPU/CPU 等多种规格训练算力,适用于预置模型调参、Notebook 训练、自定义作业等多种训练方式,速度快、资费低,训练算力最低仅1.2元/小时。
飞桨 PaddlePaddle 开源深度学习平台
移动端超轻量目标检测算法 PP-PicoDet
PP-PicoDet 采用百度自研的超轻量、高精度骨干网络--ESNet,其系列中的 PP-PicoDet-S_320 参数量仅0.99M,精度可达到30.6%mAP,推理速度可达150FPS。
速度在 FP16 下 122FPS 的情况下,精度可达到51.8%AP。对关键点检测人数无上限,针对大尺幅图像中的小目标及多人同时检测等产业场景,精度和速度都有显著优势。
提供跨镜头跟踪、人流/车流计数等系列能力与应用,覆盖人、自行车、小轿车等上十种目标类型,同时覆盖小目标等复杂场景;内置业界领先的跟踪算法 DeepSort、FairMOT,结合百度自研特色 ReID 和明星检测模型,灵活适配多种场景,高精且实时。
小事科技成都有限公司等多家优质服务商在 AI 市场上线并售卖:垃圾分类破袋检测软硬一体方案、巡防上报巡逻巡检任务下派方案、高性价比 DTU、RV1126 雷视一体机通用 AI 视觉组件等软硬件产品。
1. 苏州光创电子科技有限公司- -RV1126雷视一体机通用 AI 视觉组件
关注公众号,获取更多技术内容~