草庐IT

windows - 断言失败 - 训练 Tesseract

我正在尝试使用SerakTesseractTrainer训练tesseract:https://code.google.com/p/serak-tesseract-trainer/而且我无法弄清楚为什么在执行TrainTesseract时CMD中会发生以下错误。有帮助吗?Readinga.tr...Fontid=-1/0,classid=1/46onsample0font_id>=0&&font_id 最佳答案 在写你的字体数据之前,把'\n'字符放在文件的开头(只需按回车键)。为我工作。

windows - 如何在 Windows 上训练 Tesseract

我正在尝试训练tesseract以在Windows上工作。这个过程完成得很好,但是当我调用tesseract.exefile.tiffout运行后,文件为空。我不知道这里发生了什么,我在linux下做了同样的过程并且工作得很好。我认为问题可能出在mftraining.exe的生成上。它抛出此消息:Warning:noprotos/configsforainCreateIntTemplates()Warning:noprotos/configsforfinCreateIntTemplates()Warning:noprotos/configsforlinCreateIntTemplate

c++ - 在 64 位 Windows 上编译 Tesseract OCR

我正在尝试将TesseractOCR编译成Windows64位版本的库。我已经下载了源代码并使用VisualStudioExpressC++2010将其编译为32位版本,但由于我通常不是C++程序员,所以我不知道如何转向编译64位版本版本。非常感谢任何帮助。我需要64位版本的原因是我将它用作需要64位JVM的Java项目的一部分。32位版本的Tesseract显然不能在64位JVM中运行,但似乎没有正式的64位Windows版本。 最佳答案 相关的64位DLL由Tesseract.NETwrapper提供项目。您可能想查看其解决方案

windows - 在 Windows 平台中将 Ghostscript 链接到 pypdfocr

通过pip安装安装了pypdfocr和ghostscript。但是,当pypdfocr在命令提示符下运行时:[env27]C:\Users\888537>pypdfocrHotel.pdfERROR:CouldnotfindGhostscriptintheusualplace;pleasespecifyitusingyourconfigfile关于需要做什么来链接这些库请求帮助? 最佳答案 您可以通过其页面上提供的安装程序直接安装Ghostscript-https://ghostscript.com/download/gsdnld.

windows - mftraining 给出警告 : no protos/configs for F in CreateIntTemplates()

编辑:mftraining在标题中为unicharset中的所有字符发出警告(因此不仅是F,还有a、b、c、d等)我如何创建这些原型(prototype)/配置?我正在关注this教程现在解决的上一个问题:-Error:AssertfailedWarning:infile....\classify\trainingsampleset.cpp,line622noprotos/SegmentationFault这是整个命令+输出:-C:\training>mftraining-Ffont_properties-Uunicharset-Oeng.unicharseteng.impact.bo

python - Tesseract OCR、Python 和 Windows XP

大家晚上好我正在尝试使用在这里找到的tesseract(OCR)python包装器,第一个示例:https://code.google.com/p/python-tesseract/wiki/CodeSnippets我在WindowsXP机器上使用Python27。一切都是32位的。我已经安装了本指南中的所有依赖项:http://opencvpython.blogspot.com/2012/05/install-opencv-in-windows-for-python.html我检查了环境变量:TESSDATA_PREFIX=C:\ProgramFiles\Tesseract-OCR\

python - pytesseract OCR python 错误-示例代码

您好,我试着学习如何使用pytesseract(https://pypi.python.org/pypi/pytesseract),所以我运行示例代码:try:importImageexceptImportError:fromPILimportImageimportpytesseractim=Image.open('test.png')print(pytesseract.image_to_string(im))但是我有错误:Traceback(mostrecentcalllast):File"C:/Users/K/PycharmProjects/untitled/zad1.py",li

windows - Tess4J 在 64 位 Windows 中独立工作,但在 Tomcat 7 中失败

尝试使用Tess4J进行OCR,并能够使其在64位Windows上作为独立应用程序运行。我正在使用Eclipse。现在我正在尝试创建相同代码的war并将其部署在Tomcat7中并使用servlet调用api。我收到以下错误。java.util.NoSuchElementExceptionjavax.imageio.spi.FilterIterator.next(ServiceRegistry.java:808)javax.imageio.ImageIO$ImageWriterIterator.next(ImageIO.java:816)javax.imageio.ImageIO$Ima

c# - Windows 7 光学识别 API

我一直在审查Office2007MODIOCR的替代品(OneNote的2010解决方案的质量/结果低于2007:-()。我注意到Windows7在安装optionaltifffilter后包含一个OCR库OCR组件安装到%programfiles%\CommonFiles\microsoftshared\OCR\7.0\xocr3.psp.dll但我没有看到它的任何API?有没有人看到如何最好地在C#中进行接口(interface)?回答:找到解决方案,一旦安装了可选的tiffifilterwin7功能,我就可以使用http://www.codeproject.com/KB/cs/I

c# - Tesseract OCR Library - 学习字体

好吧,我正在使用此OCR的编译.NET版本,可以在@http://www.pixel-technology.com/freeware/tessnet2/找到它。我有它的工作,但是它的目的是翻译车牌,遗憾的是引擎确实没有准确翻译一些字母,例如这是我扫描的图像以确定字符问题结果:12345B7B9UABCDEFGHIJKLMNUPIJRSTUVHXYZ因此以下字符翻译不正确:1、O、Q、W这看起来还不错,但是在我的车牌上,结果不是很好:=H4ODM=LDHIFW假测试=NR4y2k正如您可能会说的那样,我已经尝试了降噪、增加对比度和移除非绝对黑色的像素,但没有真正的改进。显然你可以“学习”