区块链技术博客
www.b2bchain.cn

怎么让你的App 快速拥有OCR服务求职学习资料

本文介绍了怎么让你的App 快速拥有OCR服务求职学习资料,有助于帮助完成毕业设计以及求职,是一篇很好的资料。

对技术面试,学习经验等有一些体会,在此分享。

探索过程

这是我探索OCR服务的一个过程。一般开发者的思路是搜索引擎找相关的demo。其实很早之前就有所了解。

一般开源的华为的或者谷歌的SDK本地OCR 识别的精度是个问题,因为他是免费的所以精度比较低,并且要自己进一步训练的话是不支持的。

也有一些其他的服务比如tesseract-ocr也是需要训练的精度相对较低。

苹果的vision 框架提取文字貌似支持iOS13.0以上,并且对中文的支持以及识别率是个问题,暂时没尝试。

之前一直关注百度飞浆团队的动态,知道有 paddleocr这个框架。看着貌似不错试了下。

实践

刚开始使用了官方 iOS demo 模型精度不是太好,官方支持不是太好。索性我直接安装文档探索下。

后来干脆直接部署到了Mac本机,跑了起来。识别尚可。其实只是识别身份证号码是不需要大动干戈的。如果是遇到姓名或者地址的话遇到一些生僻字或者形近字的话需要自己训练,通用模型包含的场景比较多,并且字频不一样所以可能造成一些生僻字形近字识别不是太准。如果使用通用模型检测识别的时间也是比较长的,正确的思路应该是在中英文超轻量模型基础上训练。

后来尝试提高下精度,比如遇到生僻字形近字怎么提高识别率。官方说训练一个字可能需要最少200张图片,可想这个需要的数据量之大。尝试了下标注工具,研究后发现标注这项工作是可以外包给外包团队做的。

探索过程

这是我探索OCR服务的一个过程。一般开发者的思路是搜索引擎找相关的demo。其实很早之前就有所了解。

一般开源的华为的或者谷歌的SDK本地OCR 识别的精度是个问题,因为他是免费的所以精度比较低,并且要自己进一步训练的话是不支持的。

也有一些其他的服务比如tesseract-ocr也是需要训练的精度相对较低。

苹果的vision 框架提取文字貌似支持iOS13.0以上,并且对中文的支持以及识别率是个问题,暂时没尝试。

之前一直关注百度飞浆团队的动态,知道有 paddleocr这个框架。看着貌似不错试了下。

实践

刚开始使用了官方 iOS demo 模型精度不是太好,官方支持不是太好。索性我直接安装文档探索下。

后来干脆直接部署到了Mac本机,跑了起来。识别尚可。其实只是识别身份证号码是不需要大动干戈的。如果是遇到姓名或者地址的话遇到一些生僻字或者形近字的话需要自己训练,通用模型包含的场景比较多,并且字频不一样所以可能造成一些生僻字形近字识别不是太准。如果使用通用模型检测识别的时间也是比较长的,正确的思路应该是在中英文超轻量模型基础上训练。

后来尝试提高下精度,比如遇到生僻字形近字怎么提高识别率。官方说训练一个字可能需要最少200张图片,可想这个需要的数据量之大。尝试了下标注工具,研究后发现标注这项工作是可以外包给外包团队做的。

探索过程

这是我探索OCR服务的一个过程。一般开发者的思路是搜索引擎找相关的demo。其实很早之前就有所了解。

一般开源的华为的或者谷歌的SDK本地OCR 识别的精度是个问题,因为他是免费的所以精度比较低,并且要自己进一步训练的话是不支持的。

也有一些其他的服务比如tesseract-ocr也是需要训练的精度相对较低。

苹果的vision 框架提取文字貌似支持iOS13.0以上,并且对中文的支持以及识别率是个问题,暂时没尝试。

之前一直关注百度飞浆团队的动态,知道有 paddleocr这个框架。看着貌似不错试了下。

实践

刚开始使用了官方 iOS demo 模型精度不是太好,官方支持不是太好。索性我直接安装文档探索下。

后来干脆直接部署到了Mac本机,跑了起来。识别尚可。其实只是识别身份证号码是不需要大动干戈的。如果是遇到姓名或者地址的话遇到一些生僻字或者形近字的话需要自己训练,通用模型包含的场景比较多,并且字频不一样所以可能造成一些生僻字形近字识别不是太准。如果使用通用模型检测识别的时间也是比较长的,正确的思路应该是在中英文超轻量模型基础上训练。

后来尝试提高下精度,比如遇到生僻字形近字怎么提高识别率。官方说训练一个字可能需要最少200张图片,可想这个需要的数据量之大。尝试了下标注工具,研究后发现标注这项工作是可以外包给外包团队做的。

部分转自互联网,侵权删除联系

赞(0) 打赏
部分文章转自网络,侵权联系删除b2bchain区块链学习技术社区 » 怎么让你的App 快速拥有OCR服务求职学习资料
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

b2b链

联系我们联系我们