草庐IT

Tesseract

全部标签

ios - Tesseract OCR 不会忽略黑名单字符

我正在使用TessearctOCR识别图像的字符。但我希望OCR使用忽略数字字符_tesseract->SetVariable("tessedit_char_blacklist","0123456789");通过这种方式,OCR无法识别数字字符,但它会为我提供一些其他字符来代替我不想要的字符。例如:有一张图片的文本为USD12,当我对该图片应用OCR时,它会提供给我USDfl正如我们在上面看到的那样,OCR将12转换为我不想要的fl。我希望OCR忽略12。有什么方法可以得到USD而不是USDfl的结果为此提供任何解决方案。任何帮助都将不胜感激。 最佳答案

IOS OCR tesseract 在为 nil 并使用 ACR 后不释放内存

我花了超过24小时来调试和解决tesseract中的问题,问题是我为多个图像循环下面的函数,每次我跟踪内存,发现每次调用时内存都会增加下划线Tesseract*tesseract=[[Tesseractalloc]initWithLanguage:@"eng+ita"];并且不受下面一行的影响tesseract=nil;下面是调用的完整函数-(void)recognizeImageWithTesseract:(UIImage*)img{UIImage*testb=[imgblackAndWhite];Tesseract*tesseract=[[Tesseractalloc]initWi

ios - 在 iPhone 中使用 Tesseract OCR 从驾驶执照中读取数据

我正在尝试读取美国驾驶执照中的信息。但是我无法从图像中获取正确的文本。我正在尝试读取上面的图像,但我得到了一些奇怪的结果。我得到如下内容:7威斯康星**i_.*4'L._-普通驾照'Q555-5555-2555-0035533I5.4ClassDMXxXEnduslmmlsTPXMXXJ性别rmnBLQEyesBl-U0000.501"0.00.100X限制0n返回MM08484005XE0".00-20-2010简·昆西'*1'3913'ECIJ-SWILEKgSJVEEQIJNSRIEMREKBVAYjilfccgbwm太阳队20年代黑河瀑布w:54015-0000很少有单词是正确

ios - 带 libc++ 的 Tesseract-OCR 3.02

Xcode4.6、iOSSDK6.1、tesseract-ocr3.02由于最新的OpenCV版本是使用libc++构建的,而tesseract-ocr是使用libstdc++构建的,因此它们不能在一个xcode项目中一起使用。所以,我正在尝试使用libc++构建tesseract。使用脚本here(将基础sdk和部署目标更新到6.1),tesseract构建得很好,一旦C++标准库设置为编译器默认值,它就可以在我的xcode项目中工作。然后,根据答案here,我尝试更改脚本以使用libc++构建它.我将CXX更改为指向clang++,并将-stdlib=libc++添加到CXXFLA

iphone - 使用 Tesseract 进行 OCR 会导致 GetUTF8Text 方法出现内存泄漏

我正在使用tesseractOCR读取名片。我有内存泄漏,我无法解决它,我不知道如何解决。在我的代码中...tesseract->Recognize(NULL);char*utf8Text=tesseract->GetUTF8Text();GetUTF8Text()方法导致内存泄漏。这是内存泄漏工具的日志:tesseract::TessBaseAPI::GetUTF8Text()operatornew[](unsignedlong)libstdc++.6.dyliboperatornew(unsignedlong)libstdc++.6.dylibmalloclibsystem_c.d

android - 改进 Tesseract 的阈值结果

我有点被这个问题困住了,我知道有很多关于堆栈溢出的问题,但就我而言。没有给出预期的结果。上下文:我正在使用AndroidOpenCV和Tesseract,所以我可以读取护照中的MRZ区域。当相机启动时,我将输入帧传递给AsyncTask,处理该帧,成功提取MRZ区域,我将提取的MRZ区域传递给函数prepareForOCR(inputImage),该函数将MRZ区域作为灰色Mat并输出我将传递给Tesseract的带有阈值图像的位图。问题:问题是在对图像进行阈值处理时,我使用blockSize=13和C=15的自适应阈值处理,但给出的结果并不总是相同,具体取决于图像的照明和帧的一般条件

android - 提高识别率的图像预处理步骤

我正在为我的项目使用TessBaseAPI制作一个简单的OCRAndroid应用程序。我已经完成了一些图像预处理步骤,例如二值化和图像增强。但他们的结果是50%到60%。如何提高识别率?我包括两个示例图像。http://imageshack.us/photo/my-images/94/1school.jpg/http://imageshack.us/photo/my-images/43/15071917.jpg/ 最佳答案 上述命令的以下添加适用于您的第二张图片:-negate\-deskew40%\+repage\-crop393

android - 苔丝二找不到 libpng.so

我已按照苔丝二号的搭建说明进行操作Github我成功地使用NDK构建了tess-two并导入了库我正在尝试运行在同一存储库中提供的测试应用程序,但每当应用程序启动时,它都会出现以下异常:一旦调用newTessBaseAPI();就会导致该错误。dlopen("/data/app-lib/com.datumdroid.android.ocr.simple-2/liblept.so")failed:Cannotloadlibrary:soinfo_link_image(linker.cpp:1635):couldnotloadlibrary"libpng.so"neededby"lible

android - 如何训练 tesseract 只识别 20 到 30 位数字?

我正在使用tess-two我项目的TesseractAndroid工具。从我所做的研究中,我发现来自here一种限制字符类型但不限制字符范围的方法。我正在使用的Tess-Two库没有tessdata/config文件,那么如何限制tesseract识别的可能字符?如何限制Tesseract识别数字范围(20到30)? 最佳答案 如果您使用的是图像中的数字并且图像清晰,则可以使用以下命令“tesseractimageNameoutputFileName.txt输出基数”但如果图像不清晰,您将需要对其进行处理,否则您将无法获得准确的结果

android - 将 Tesseract 和 Opencv 添加到 Android.mk (Android Studio)

我按照here中的说明进行操作并成功添加OpenCV。但几天来,我一直在尝试将tesseract添加到Android.mk,但未能成功。我有一个使用tesseract的android.cpp,所以我必须在我的Android.mk中包含依赖项。我找到了thispost几乎有确切的问题,他解决了将libtess.so和liblept.so文件导入Android.mk,但没有解释如何做到这一点,所以我查看并发现thispost这显示了如何链接预建库。因此,基于此我尝试了这个Android.mk:LOCAL_PATH:=$(callmy-dir)include$(CLEAR_VARS)LOCA