博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
面向Android的Tesseract工具
阅读量:6538 次
发布时间:2019-06-24

本文共 1221 字,大约阅读时间需要 4 分钟。

对于Android中的文字识别不得不了解是HP公司于1985~1995年间开发的商业级OCR(Optical Character Reader, 光学字符阅读器)引擎,并于2005年开放源代码。

面向Android的Tesseract工具

tess- two是Tesseract Tools for Android (tesseract-android-tools) 的一份拷贝,并添加了一些功能。Tesseract Tools for Android是Tesseract OCR和Leptonica图像处理库的Android API与构建文件的集合。github上的网址为:

https://github.com/rmtheis/tess-two

关于tess-two的编译过程,可以参考上述网址,根据我的编译经历,发现执行”android update project –path .”一步是,需要指定–target选项,其参数通过命令”android list targets”获取到id值,再指定,如下(记得连接好你的Android手机)。

root@Leon:/home/work/tess-two# android list targets

Available Android targets:
----------
id: 1 or "android-18"
Name: Android 4.3
Type: Platform
API level: 18
Revision: 1
Skins: WVGA854, WXGA800, WSVGA, WVGA800 (default), WQVGA400, WXGA720, QVGA, WQVGA432, WXGA800-7in, HVGA
ABIs : armeabi-v7a
root@Leon:/home/work/tess-two# android update project --path . --target 1

其中的”1″便是来自id后面的值。之后,便按照tess-two的github上的描述,添加到Eclispe即可。

基于tess-two的Android应用

有了面向Android的Tesseract库tess-two,接下来就是使用Android应用来测试和使用了。github上的android-ocr就是这样的应用:

https://github.com/rmtheis/android-ocr

经过测试,发现算法的运行时间还是比较慢的,一段话的中文,处理时间大约20秒。识别精度也比较有限,在一张照片中文字比较多时,识别精度有所下降,如果文字比较少且比较大,则精度较高。

你也可以登录Github了解最新的源码动态,更多知识请登录

转载于:https://www.cnblogs.com/yuguotianqing/p/3977687.html

你可能感兴趣的文章
三数中值快速排序(长度小于3的数组转插入排序)
查看>>
Two Sum leetcode
查看>>
[20190505]关于latch 一些统计信息.txt
查看>>
网页代码优化小结一
查看>>
MEF Parts Sample
查看>>
使用__slots__限制绑定属性
查看>>
Linux设置:环境变量
查看>>
斯特林数&斯特林反演
查看>>
真正掌握vuex的使用方法(三)
查看>>
java并发编程:进程和线程
查看>>
设计模式----装饰模式!
查看>>
java内存模型3
查看>>
ACM-ICPC 2018 沈阳赛区网络预赛 K Supreme Number(规律)
查看>>
kvm虚拟化
查看>>
python爬虫知识点总结(五)正则表达式
查看>>
20190404——分享
查看>>
轮播图swiper
查看>>
快速定位问题 Request无法获取参数
查看>>
linq 分页
查看>>
A题笔记(8)
查看>>