草庐IT

Tesseract

全部标签

c++ - 如何将位图转换为内存中的 PIX?

Tesseract似乎不能很好地处理位图,它可以处理某些输入但会搞砸其他输入。同时在与之前相同但采用leptonica格式PIX的输入上表现良好。如何将内存中的位图转换为PIX?想到的一个想法是使用leptonica的pixReadMem():00724/*---------------------------------------------------------------------*00725*Readfrommemory*00726*---------------------------------------------------------------------*

python - 如何将 char 指针从 python 传递给 C++ API?

我正在尝试从我的python代码中调用以下C++方法:TESS_APITessResultRenderer*TESS_CALLTessTextRendererCreate(constchar*outputbase){returnnewTessTextRenderer(outputbase);}我对如何将指针传递给方法有困难:遵循正确的方法吗?textRenderer=self.tesseract.TessTextRendererCreate(ctypes.c_char)或者我应该这样做:outputbase=ctypes.c_char*512textRenderer=self.tess

c++ - 如何强制 tesseract 不使用 TESSDATA_PREFIX

我在我的电脑上安装了tesseract,它定义了TESSDATA_PREFIX环境变量。完全卸载tesseract后,我​​尝试以这种方式使用tesseractAPI:if(myOCR->Init("C:/Projects/project/Release/tessdata/","rus")){fprintf(stderr,"Couldnotinitializetesseract.\n");exit(1);}并接收ErroropeningdatafileC:\ProgramFiles(x86)\Tesseract-OCR\tessdata/rus.traineddataPleasemak

c++ - 将 tesseract 编译/捆绑成一个二进制文件

是否可以将tesseract编译成一个二进制文件?我使用以下编译程序,但是如何将tesseract共享库编译成一个二进制文件以便程序100%可移植并且您不需要在当前系统上安装tesseract?不需要将leptonica编译成二进制g++-std=c++11txtocr.cpp-otxtocr-llept-ltesseract 最佳答案 为此您需要使用静态库,在unix系统上它们通常以.a扩展名结尾,而共享库以.so结尾如果您只有tesseract的.so(或mac上的.dylib,windows上的.dll)库,则无法将其编译为单

c++ - 如何检测扫描文档的方向?

我会检测并在必要时更正扫描文档图像的方向。我已经可以对文档进行校正,但是仍然可能会出现文档倒置并且需要旋转180°的情况。使用tesseract的布局分析功能应该可以使用以下代码确定文档的方向:tesseract::TessBaseAPIapi;api.Init(argv[0],"eng");api.SetImage(img);api.SetPageSegMode(tesseract::PSM_AUTO_OSD);tesseract::PageIterator*it=api.AnalyseLayout();tesseract::Orientationorient;tesseract::

c++ - 如何在 Windows 10 上使用 Visual Studio 2015 x64 配置和构建 Tesseract OCR C++

我正在尝试运行VS2015_TesseractTesseractOCR库中的示例。当我尝试打开文件时总是出现以下错误:Couldnotfindapartofthepath目前我在Windows10(64位)上使用VisualStudio2015。请提供有关如何在VisualStudio2015Windows10(64位)上配置TesseractOCRC++库的完整信息。您还可以提供任何引用教程链接。 最佳答案 您必须下载vs2015_Tesseract或者只需在工作目录中运行以下git命令:gitclonehttps://githu

c++ - 如何将图片放大到 300 DPI?

问题的公认答案C++Libraryforimagerecognition:imagescontainingwordstostring建议您:将您的输入图像放大/缩小到300DPI。我该怎么做...我的印象是DPI用于显示器,而不是图像格式。 最佳答案 我认为这里更准确的术语是resampling。您需要足够高的像素分辨率来支持准确的OCR。字体大小(例如points)通常以长度为单位,而不是像素。由于72点=1英寸,对于300dpi(“每英寸像素”)的分辨率,我们需要每点300/72像素。这意味着典型的12号字体的高度(或更准确地说

c++ - 如何将 Tesseract OCR 库集成到 C++ 程序中

我正在尝试使用TesseractOCRLibrary为了创建一个程序来读取电梯楼层号码的图片。我还没有找到任何关于如何将Tesseract库包含到C++文件中的示例。像这样的东西:#include"tesseract.h"我在Ubuntu10.10上使用Tesseractv3.00。 最佳答案 PlatformStatus页面对如何安装它有一些评论。它具有也需要安装的依赖项(leptonica)。Anothersolution也从上面的讨论中链接了其他linux发行版的类似细节。当涉及到与您的程序的链接时,thispost有一些细节

c++ - 语言检测

我正在使用tesseract对于OCR,主要在发票上。但是,tesseract需要在开始处理文件之前指定语言。我以为我要根据预定义的默认语言执行ocr。然后我想使用生成的文本来检查使用的是哪种语言。如果它不是默认语言,我会再次处理它以便从tesseract获得更好的结果。但是我怎样才能实现语言检测算法呢?有我可以使用的C++库吗? 最佳答案 本文“NaturalLanguageIdentificationforOCRApplications”描述了与您的要求类似的识别任务中涉及的技术。

c++ - 如何使 tesseract-ocr 从屏幕上的坐标读取?

我一直在寻找一个示例,说明如何创建一个类/函数来尝试从指定坐标处的屏幕读取文本。使用bitblt捕获屏幕的指定部分并在其上运行tesseract的简单操作。所有这些都在内存中完成,无需将图像文件创建到磁盘。Tesseract似乎有非常糟糕的API,并且需要所有事物的TIF图像,据我所知,如果不深入研究其代码,它甚至无法接受位图内存图像。任何帮助将不胜感激,一个实际的例子将是理想的。 最佳答案 http://i.imgur.com/HaJ2zOI.png继续阅读/查看以下内容,了解如何对内存中的图像使用Tesseract-OCR。#i