在路上

 找回密码
 立即注册
在路上 站点首页 学习 查看内容

Java OCR(使用Tess4J)

2017-2-9 13:05| 发布者: zhangjf| 查看: 642| 评论: 0

摘要: 最近突然对手机上的OCR功能比较感兴趣,于是乎研究了一下Java OCR技术,在Google上找到了tesseract-ocr,最后找到了其对应的Java API版本 Tess4J,中间调试过程异常曲折,最后花了半天时间终于把它给调试成功了,跟 ...

最近突然对手机上的OCR功能比较感兴趣,于是乎研究了一下Java OCR技术,在Google上找到了tesseract-ocr,最后找到了其对应的Java API版本 Tess4J,中间调试过程异常曲折,最后花了半天时间终于把它给调试成功了,跟大家分享一下!

一 下载相关的jar包

1.下载Tess4J jar,网址:http://sourceforge.net/projects/tess4j/

2. 如果你使用的JVM 64位的,还需要下载 liblept168.dll、libtesseract302.dll的64位文件,下载地 址:https://github.com/charlesw/tesseract/tree/master/src/lib/TesseractOcr /x64


二 项目整合

先看看最后整合成功的目录结构,开发环境:Win8.1 64位 + Eclipse 4.2 + JDK 7 64位,工程目录结构如下:

Java OCR(使用Tess4J)


src目录下是 Tess4J的源码目录,test目录 是Tess4J官方提供的demo目录,并将 liblept168.dll、libtesseract302.dll,gsdll64.dll(pdf 转换需要用到此文件) 三个文件拷贝到 src根目录下。


三 测试代码

  1. /**
  2. * Test of doOCR method, of class Tesseract1.
  3. */
  4. [url=home.php?mod=space&uid=5447]@test[/url]
  5. public void testDoOCR_File() throws Exception {
  6. System.out.println("doOCR on a PNG image");
  7. File imageFile = new File("eurotext.png");
  8. String expResult = "The (quick) [brown] {fox} jumps!nOver the $43,456.78 <lazy> #90 dog";
  9. String result = instance.doOCR(imageFile);
  10. System.out.println(result);
  11. assertEquals(expResult, result.substring(0, expResult.length()));
  12. }
复制代码

原文地址: http://blog.csdn.net/top_code/article/details/39667299

最新评论

小黑屋|在路上 ( 蜀ICP备15035742号-1 

;

GMT+8, 2025-7-9 20:22

Copyright 2015-2025 djqfx

返回顶部