本次测评主要针对几种AI在处理拍照表格转制式文本的效果进行了对比,包括gemini、GPT、豆包、阶跃和千问。测试结果显示,豆包的表现最为突出,它不仅能够读取图像,还能理解图像内容,通过逻辑推理发现OCR过程中的不合理并自我修正,展现了强大的空间推理能力。相比之下,gemini在人数识别上存在问题,千问在单位名称识别上出现了幻觉,阶跃星辰在文风和数字识别上表现不佳,而chatgpt网页版则在区域名称识别上出现了错误。总体来看,AI在处理此类任务上仍有提升空间,但已显示出巨大的潜力,特别是在提高工作效率和减轻办公人员负担方面。未来,随着技术的进步,AI有望在更多领域发挥重要作用,帮助人们实现更高效、更便捷的工作方式。

标签: none

评论已关闭