提问:怎么评估OCR的性能
网友回答:
厦门云脉推出的H5文档管理系统便是一款基于OCR、图像处理及秒级全文检索等技术的企业级数据管理方案。其核心技术就是OCR,那评价OCR的性能指标又有哪些呢?
评估OCR性能指标通常有这几种:
平均编辑距离:平均编辑距离越小说明识别率越高。平均编辑距离主要衡量整行或整篇文章的指标,可以同时反应识别错,漏识别和多识别的情况
字符识别准确率,即识别对的字符数占总识别出来字符数的比例,可以反应识别错和多识别的情况,但无法反应漏识别的情况
(文本行)识别成功率,即识别对的文本行占总文本行的比例,可以反应实际应用场景的可行性和效果。
文本行定位为的精准率和召回率。主要反应文本行定位的指标,是ocr算法的重要指标
算法inference(推理)的速度:除了识别精度,识别的速度也是非常重要的衡量ocr性能的指标,尤其在移动端和嵌入式平台的推理,决定是否可用的衡量标准。
预训练模型大小:即存放训练模型参数文件的大小,这对移植到移动端或嵌入式台的使用很重要