百度发布PP-OCRv6:千万级参数媲美十亿级VLM,单模型支持50种语言
快链头条 2026-06-12 19:18:57
据动察 Beating 监测,百度飞桨团队发布新一代 OCR 系统 PP-OCRv6,提供 Tiny 1.5M、Small 7.7M 和 Medium 34.5M 三个版本,覆盖边缘设备、浏览器和云端部署场景。相比前代 PP-OCRv5,检测准确率提升 4.6%,识别准确率提升 5.1%,并将中文、英文、日文及 46 种拉丁语系语言整合进同一个统一模型。
PP-OCRv6 对检测与识别网络进行了重新设计,引入统一模块结构和结构重参数化(Structural Reparameterization)技术,在提升精度的同时降低计算开销。在 OpenVINO 优化下,Medium 版本端到端 CPU 推理速度最高提升 5.2 倍。
官方公布的测试结果显示,PP-OCRv6 在多项 OCR 基准上以千万级参数规模取得接近甚至超过部分十亿级视觉语言模型 VLM 的表现。团队还针对手写体、工业元器件标识、数码管、PCB 丝印和 CAD 图纸等场景进行了专项优化。目前相关代码已并入 PaddleOCR 项目并开源。
快链头条登载此文本着传递更多信息的缘由,并不代表赞同其观点或证实其描述。
文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
投资有风险,入市须谨慎。本资讯不作为投资理财建议。
7*24小时快讯
法国 Mistral AI 公司正在就融资进行洽谈,估值约为 200 亿欧元
06-12 21:13(1分钟前)
欧洲头部AI公司Mistral AI正以约200亿欧元估值进行融资谈判
06-12 21:10(4分钟前)
Ethena拟向Securitize代币化AAA CLO基金配置2.5亿美元
06-12 21:05(9分钟前)
观点:参考Coinbase上市后比特币表现,SpaceX上市后美股牛市或迎中期调整
06-12 21:04(10分钟前)
Ethena 拟向 Securitize 代币化 AAA CLO 基金投入 2.5 亿美元扩展 RWA 布局
06-12 21:01(13分钟前)
数据:Hyperliquid 平台鲸鱼当前持仓 40.71 亿美元,多空持仓比为 0.99
06-12 21:00(14分钟前)
Shai-Hulud Hades 新变种攻击 PyPI,利用 Python 到 Bun 跨运行时链窃取凭证
06-12 20:57(17分钟前)
慢雾:Shai-Hulud Hades新变种攻击PyPI,利用Python到Bun跨运行时链窃取凭证
06-12 20:57(17分钟前)
热门资讯
风险提示
根据银保监会等五部门于 2018 年 8月发布《关于防范以「虚拟货币」「区块链」名义进行非法集资的风险提示》的文件, 请广大公众理性看待区块链,不要盲目相信天花乱坠的承诺,树立正确的货币观念和投资理念,切实提高风险意识;对发现的违法犯罪线索,可积极向有关部门举报反映。