性能超群 - 0.9B的 PaddleOCR-VL-1.5发布
PaddleOCR-VL-1.5的发布标志着在光学字符识别领域的一次重大突破。这款轻量级模型仅0.9B的架构,却能在权威榜单OmniDocBench V1.5中取得全球第一的优异成绩,精度高达94.5%,这一成绩不仅超越了Gemini-3-Pro、DeepSeek-OCR等业界领先产品,更展示了PaddleOCR-VL-1.5在性能上的卓越表现。
该模型的改进主要集中在三个方面:首先,针对实际应用中的挑战,如扫描件、屏摄、倾斜、弯曲以及光照不足等五种常见场景进行了强化优化,增强了模型的抗干扰能力。其次,增加了印章识别功能,并提升了文本行定位的精确度,进一步扩展了模型的应用范围。最后,针对长文档的处理进行了优化,支持跨页表格合并和跨页段落拼接,有效解决了长PDF文档解析时碎片化的问题。
对于寻求本地部署或边缘计算解决方案的用户来说,PaddleOCR-VL-1.5的轻量级特性使其成为一个极具吸引力的选择。它不仅提供了高性能的识别能力,还大大降低了资源消耗和部署难度,使得更多场景下的应用成为可能。
评论已关闭