性能超群 - 0.9B的 PaddleOCR-VL-1.5发布

PaddleOCR-VL-1.5的发布标志着在光学字符识别领域的一次重大突破。这款轻量级模型仅0.9B的架构，却能在权威榜单OmniDocBench V1.5中取得全球第一的优异成绩，精度高达94.5%，这一成绩不仅超越了Gemini-3-Pro、DeepSeek-OCR等业界领先产品，更展示了PaddleOCR-VL-1.5在性能上的卓越表现。

该模型的改进主要集中在三个方面：首先，针对实际应用中的挑战，如扫描件、屏摄、倾斜、弯曲以及光照不足等五种常见场景进行了强化优化，增强了模型的抗干扰能力。其次，增加了印章识别功能，并提升了文本行定位的精确度，进一步扩展了模型的应用范围。最后，针对长文档的处理进行了优化，支持跨页表格合并和跨页段落拼接，有效解决了长PDF文档解析时碎片化的问题。

对于寻求本地部署或边缘计算解决方案的用户来说，PaddleOCR-VL-1.5的轻量级特性使其成为一个极具吸引力的选择。它不仅提供了高性能的识别能力，还大大降低了资源消耗和部署难度，使得更多场景下的应用成为可能。

性能超群 - 0.9B的 PaddleOCR-VL-1.5发布

评论已关闭