草庐IT

tesseract4

全部标签

c++ - Tesseract - 更改语言文件位置

我正在制作一个AIR项目,它需要一些OCR功能,所以我决定使用tesseract(现在我尝试让它在Windows上运行)。我的问题是,无法更改语言文件的位置-它总是尝试查看我的Tesseract安装目录(程序文件(x86)\Tesseract-OCR\tessdata\mylang.traineddata)有没有一种方法可以配置Tesseract以在我指定的位置查找此文件?例如在与tesseract.exe相同的文件夹中。我不想(或者可能不能)使用AIR安装程序安装应用程序。我已经用3.0版本和最新的SVN版本试过了。谢谢 最佳答案

c++ - 提高 Tesseract 检测质量

我正在尝试从用消费者相机(包括手机)拍摄的图像中提取不构成有意义单词的字母数字字符(a-z0-9)。这些字符具有相同的大小和字体类型,并且未被格式化。实际处理是在Windows下完成的。下图显示了原始输入:透视处理后,我使用OpenCV应用以下内容:从RGB转换为灰色应用cv::medianBlur去除噪声使用自适应阈值将图像转换为二进制cv::adaptiveThreshold我知道网格的行数和列数。因此,我只是使用此信息提取每个网格单元。完成所有这些步骤后,我得到的图像看起来类似于这些:然后我在每个提取的细胞图像上分别运行tesseract(最新的SVN版本和最新的训练数据)(我尝

C++ - Tesseract 令人失望的性能

我所在的公司正在考虑将其当前的OCR引擎(Nuance的OmniPage)转换为开源替代方案,例如Tesseract。为了获得一些性能基准(执行速度和准确性)来比较两者,我得到了一个非常简单的程序,只是为了了解Tesseract3.2CAPI的性能如何。我的初步观察(其中一些可能不正确,请随时在评论中更正我的解释):准确度很高。它与我们当前的引擎相比非常好。输出格式仅提供已识别的文本,而不是文本在原始图像中的位置的预览。是采用hOCR格式并将其转换为其他更具视觉吸引力的格式的可能性,但我未能在Windows上找到适合商业用途的开源转换器(我找不到来自ExactCODE'shocr2pd

windows - 尽管添加了 PATH,但似乎无法从命令行运行 tesseract

我正在尝试添加tesseract以便能够安装pytesseract。我使用Windows7。我将此路径添加到我的PATH环境变量中C:\ProgramFiles(x86)\Tesseract-OCR\tesseract.exe从命令行运行tesseractDMTX_screenshot.png输出或者正方体我得到了tesseract未被识别为内部或外部命令。这是我环境变量的一部分的复制粘贴:C:\ProgramFiles(x86)\Tesseract-OCR\tesseract.exe;C:\Users\Moondra\Anaconda_related\Anaconda\geckodr

iphone - iOS 应用程序中的 Tesseract 集成错误

在我的iOS应用程序中集成TesseractSDK时出现一些错误。我遵循的程序-1)在xcode中拖动“libtesseract_full.a”2)在xcode中拖动“tessdata”文件夹3)在xcode中拖拽"baseapi.h"现在当我使用Tesseract时-//initthetesseractengine.tess=newTessBaseAPI();tess->SimpleInit([dataPathcStringUsingEncoding:NSUTF8StringEncoding],//Pathtotessdata-noending/."eng",//ISO639-3st

c++ - 为 iOS 编译时 Qt Creator Tesseract 链接器错误

当我尝试构建我的iOS应用程序时,出现以下链接器错误。将C++标准库设置为“libstdc++”可能会修复它,但我不确定如何在QTCreator中执行此操作。Undefinedsymbolsforarchitecturearmv7:"tesseract::TessBaseAPI::End()",referencedfrom:Ocr::~Ocr()inocr.o"tesseract::TessBaseAPI::SetImage(Pixconst*)",referencedfrom:Ocr::recognize(charconst*)inocr.o"tesseract::TessBaseA

ios - 改进 Tesseract OCR 中的预处理步骤以进行实时捕获

我正在使用Tesseract库读取身份证信息。我试过使用一些Googleimages并得到了很好的结果,但是当我转到实时图像时,即从iPhone相机捕获图像时,我没有得到好的结果。我发现了Tesseract建议的一些预处理步骤。1。修复DPI(如果需要)最低300DPI。从iPhone相机实时捕获图像时,如何设置图像的DPI?2。修复文本大小(例如12pt应该没问题)。如何修复iPhone相机创建的大图像的文本大小?3。尝试修复文本行(去歪斜和去扭曲文本)。我读到Tesseract使用Leptonica库应用去扭曲文本。在此预处理阶段文本是否需要去扭曲或去扭曲?4。尝试修复图像的照明(

ios - Xcode 上的 Tesseract 运行错误

我一直在Xcode上测试Tesseract。我按照访问http://lois.di-qual.net/blog/install-and-use-tesseract-on-ios-with-tesseract-ios/中的说明进行操作.但问题是,当我运行程序时,我在控制台上收到以下错误:Erroropeningdatafile/Users/mdriduanulislam/Library/ApplicationSupport/iPhoneSimulator/7.0/Applications/0ABCEAB3-3793-44C9-8914-A99BB6B4EF9F/Documents/tes

ios - 如何让 iOS 上的 tesseract 更快?

我正在为ios上的tesseractocr而苦苦挣扎。一切正常,但速度真的很慢。单行数字的识别时间为2-3秒。我正在阅读视频流。我正在使用tesseract3.01和我的字体的自定义训练文件。这是我的做法:设置tesseract仅查找数字(0-9)缩小、校正和二值化图像使用GetLines找到我想要的行setRectangle只识别我想要的行getUTF8Text获取我的文本有什么建议可以加快这个过程吗? 最佳答案 我切换到tesseract3.02的SVN在交叉编译遇到一些问题后,我为getUTF8Text减少了大约1.2-0.8

ios - Swift 3 - Tesseract 识别任何图像处理的抛出错误

我正在使用Swift3开发一个应用程序,用户可以在其中拍照并使用TesseractOCR识别其中的文本。以下代码块有效。funcprocessPhoto(){iflettesseract=G8Tesseract(language:"eng"){tesseract.delegate=self//thisistheresultingpicturegottenafterrunningthecapturedelegatetesseract.image=stillPicture.image!tesseract.recognize()}}但是,如果我尝试完全操纵图片(stillPicture.im