草庐IT

tesseract

全部标签

c++ - 将 cv::Mat 转换为 tesseract

我正在使用OpenCV提取扫描文档的子图像,并希望使用tesseract在这个子图像上执行OCR。我发现我可以在tesseract中使用两种方法进行文本识别,但到目前为止我还没有找到可行的解决方案。A.)如何将cv::Mat转换为PIX*?(PIX*是leptonica的数据类型)基于下面的vasiles代码,这基本上是我当前的代码:cv::Matimage=cv::imread("c:/image.png");cv::MatsubImage=image(cv::Rect(50,200,300,100));intdepth;if(subImage.depth()==CV_8U)dept

android - 将 tess-two(Tesseract Tools for Android)库集成到 Android 工作室并构建 ndk

我想在androidstudio中导入tess-two库,编译后在ndkbuild中显示错误。我已经尝试过在stackoverflow上给出的解决方案。喜欢,Executionfailedfortask':app:compileDebugNdk'但它并没有解决我的问题。请建议我哪里做错了。它显示以下错误:Error:error:undefinedreferenceto'isnanf'Error:error:undefinedreferenceto'__isinff'Error:error:undefinedreferenceto'isnanf'[arm64-v8a]Install:li

android - 将 tess-two(Tesseract Tools for Android)库集成到 Android 工作室并构建 ndk

我想在androidstudio中导入tess-two库,编译后在ndkbuild中显示错误。我已经尝试过在stackoverflow上给出的解决方案。喜欢,Executionfailedfortask':app:compileDebugNdk'但它并没有解决我的问题。请建议我哪里做错了。它显示以下错误:Error:error:undefinedreferenceto'isnanf'Error:error:undefinedreferenceto'__isinff'Error:error:undefinedreferenceto'isnanf'[arm64-v8a]Install:li

python - 提高多段落扫描的 OCR 性能

我正在开展一个项目,该项目涉及提取以PDF格式存储的文本科学论文。对于大多数论文,使用PDFMiner很容易完成,但一些较旧的论文将其文本存储为大图像。本质上,扫描一张纸,然后该图像文件(通常是PNG或JPEG)构成整个页面。我尝试通过python-tesseract使用Tesseract引擎。绑定(bind),但结果相当令人失望。在深入探讨我对这个库的问题之前,我想提一下,我愿意接受有关OCR库的建议。似乎没有什么原生的python解决方案。Here是我试图提取文本的一张这样的图像(JPEG)。我在上面链接到的python-tesseractgoogle代码页上的示例片段中提供的确切

python - 提高多段落扫描的 OCR 性能

我正在开展一个项目,该项目涉及提取以PDF格式存储的文本科学论文。对于大多数论文,使用PDFMiner很容易完成,但一些较旧的论文将其文本存储为大图像。本质上,扫描一张纸,然后该图像文件(通常是PNG或JPEG)构成整个页面。我尝试通过python-tesseract使用Tesseract引擎。绑定(bind),但结果相当令人失望。在深入探讨我对这个库的问题之前,我想提一下,我愿意接受有关OCR库的建议。似乎没有什么原生的python解决方案。Here是我试图提取文本的一张这样的图像(JPEG)。我在上面链接到的python-tesseractgoogle代码页上的示例片段中提供的确切

python - 删除水平下划线

我试图从数百个包含死刑记录信息的JPG中提取文本;JPG由德克萨斯州刑事司法部(TDCJ)主持。以下是删除了个人身份信息的示例代码段。我已经确定下划线是正确OCR的障碍--如果我进入,截取一个子片段并手动涂白线,通过pytesseract生成OCR非常好。但是有下划线,它非常糟糕。如何才能最好地去除这些水平线?我尝试过的:从OpenCV文档的演练开始:Extracthorizontalandverticallinesbyusingmorphologicaloperations.很快就卡住了,因为我对C++的了解为零。关注RemovingHorizontalLinesinimage-以难

python - 删除水平下划线

我试图从数百个包含死刑记录信息的JPG中提取文本;JPG由德克萨斯州刑事司法部(TDCJ)主持。以下是删除了个人身份信息的示例代码段。我已经确定下划线是正确OCR的障碍--如果我进入,截取一个子片段并手动涂白线,通过pytesseract生成OCR非常好。但是有下划线,它非常糟糕。如何才能最好地去除这些水平线?我尝试过的:从OpenCV文档的演练开始:Extracthorizontalandverticallinesbyusingmorphologicaloperations.很快就卡住了,因为我对C++的了解为零。关注RemovingHorizontalLinesinimage-以难

python - 如何在 Tesseract 和 OpenCV 之间进行选择?

关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题吗?更新问题,以便editingthispost提供事实和引用来回答它.关闭3年前。Improvethisquestion我最近遇到了Tesseract和OpenCV.看起来Tesseract是一个成熟的OCR引擎,OpenCV可以用作创建OCR应用程序/服务的框架。我尝试在我的一些图像上使用Tesseract,它的准确性似乎不错。后来偶然发现一个很简单的tutorial关于使用OpenCV使用Python执行OCR并印象深刻。几分钟后,我完成了系统的训练,它的准确性很好。但是,当然,采用这种方法意味着我需要

python - 如何在 Tesseract 和 OpenCV 之间进行选择?

关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题吗?更新问题,以便editingthispost提供事实和引用来回答它.关闭3年前。Improvethisquestion我最近遇到了Tesseract和OpenCV.看起来Tesseract是一个成熟的OCR引擎,OpenCV可以用作创建OCR应用程序/服务的框架。我尝试在我的一些图像上使用Tesseract,它的准确性似乎不错。后来偶然发现一个很简单的tutorial关于使用OpenCV使用Python执行OCR并印象深刻。几分钟后,我完成了系统的训练,它的准确性很好。但是,当然,采用这种方法意味着我需要

java - 从 java 中使用 Tesseract

我正在尝试在java中构建一个示例应用程序,它将读取图像文件并仅输出从图像中提取的文本。我找到了Tesseract看起来很有希望的项目,然而,它是用c++编写的。为了使用它,我应该简单地将它作为我的java应用程序Runtime.exec(...)的命令行运行吗?还是有更好的解决方案,也许是JAR?此外,这只是一个示例应用程序,从可扩展性的角度来看,将其作为命令行应用程序运行是否会引起关注? 最佳答案 现在tesseract由javacv项目提供,这是一个比使用Tess4J更好的选择,因为只需向您的pom文件添加单个依赖项,然后将自