tesseract-doc

使用 Tesseract 的 Android OCR 应用程序

我目前正在开发一个基于OCR(光学字符识别)的android应用程序。我已经下载了“tesseract-android”项目，其中包含用于编译Tesseract、Leptonica和JPEG库的工具，以便在Android上使用。我在WindowsVista操作系统上通过Eclipse进行开发。我还下载了必要的工具(android-ndk；apacheant..)，我已经仔细完成了构建这个项目的所有步骤，并将它作为一个库添加到我的基本应用程序中。我的应用包括打开相机拍照，然后通过tesseractAPI处理这张照片以将其转换为文本。我的问题是:1.这个程序真的不能在Windows操作系统

windows - 将 tesseract 命令行调整为 OCR 价格

我有一些带有价格的小图片，如下所示:但是当我尝试命令时我得到一个空的输出文件:tesseractimage.png输出.txt我应该使用什么特殊命令来对像这样的小图像进行OCR？另外，我能否指定可能的结果仅为美元符号、句点和数字0-9？我已经通过添加到配置文件尝试了“字母”方法，但我没有找到任何关于美元符号或句点是否需要转义的数据。无论如何，我使用上述命令的简单版本得到的响应为零。最佳答案您使用的是哪个版本的tesseract？使用以下命令:tesseractimage.png输出-psm8我得到了这个结果。12705美元请注意

tesseract windows section 句点 ocr

windows - 当我使用带有 CREATE_NO_WINDOW 的 pytesseract 运行 tesseract 时如何隐藏控制台窗口

我正在使用tesseract对屏幕截图执行OCR。我有一个使用tkinter窗口的应用程序，在我的类的初始化中利用self.after在tkinter窗口中执行常量图像抓取和更新标签等值。我已经搜索了好几天，但找不到任何具体示例如何在使用pytesseract调用tesseract的Windows平台上利用CREATE_NO_WINDOW和Python3.6。这与这个问题有关:HowcanIhidetheconsolewindowwhenIruntesseractwithpytesser我只编写了2周的Python程序，不了解如何执行上述问题中的步骤。我打开了pytesseract.p

CREATE_NO_WINDOW pytesseract 39 image tesseract windows python-3.x ocr pytesser

vb.net - 在 VB.Net 中将 Doc 文件转换为 PDF

我有一种情况需要将Doc文件转换为PDF文件。我在vb.net中开发Windows应用程序。如果可能的话，我也不想使用第三方dll。所以谁能给我更多的想法？最佳答案您可以为此使用OfficeInterop。但最好使用一些托管库，如AsposeusingMicrosoft.Office.Interop.Word;usingSystem;usingSystem.Collections.Generic;usingSystem.IO;usingSystem.Linq;usingSystem.Text;...//CreateanewMic

net oMissing ref section vb.net pdf-generation doc windows-applications

windows - 将 .docx 和 .doc 文件批量转换为 .rtf

我在扩展名为.docx和.doc的文件夹中有大量文件，我需要将其转换为rtf，因为我之后将使用的软件可以更好地处理rtf文件。在MacOS终端中，我会这样做:textutil-convertrtf~/Desktop/Files2Convert/*.docxWindows下有没有类似的做法？最佳答案 tl；博士-AdvancedRenamer免费且非凡。我还没有尝试过在Cygwin或命令提示符下在Windows上进行文件转换，但我已经使用AdvancedRenamer很多年了，并且非常高兴。事实上，下一份薪水我想我会购买个人许可证，

windows docx section stackoverflow https cmd ms-word

python - 从 spacy 中的存储模型加载后 doc.vector 不工作

我已经训练了以下模型https://github.com/explosion/spaCy/blob/master/examples/training/train_new_entity_type.py我将它保存到某个目录，然后加载并再次使用它。但是当我尝试访问doc.vector时加载它之后，它抛出以下错误。Traceback(mostrecentcalllast):File"C:/Users/ankita.a.rath/Desktop/my_codes/Rasa_nlu/rasa_nlu-master/train_spacy_ner.py",line248,inmain("en","n

python vector spacy noreferrer https windows rasa-nlu

windows - 断言失败 - 训练 Tesseract

我正在尝试使用SerakTesseractTrainer训练tesseract:https://code.google.com/p/serak-tesseract-trainer/而且我无法弄清楚为什么在执行TrainTesseract时CMD中会发生以下错误。有帮助吗？Readinga.tr...Fontid=-1/0,classid=1/46onsample0font_id>=0&&font_id 最佳答案在写你的字体数据之前，把'\n'字符放在文件的开头(只需按回车键)。为我工作。

Tesseract 训练 section font windows ocr

windows - 如何在 Windows 上训练 Tesseract

我正在尝试训练tesseract以在Windows上工作。这个过程完成得很好，但是当我调用tesseract.exefile.tiffout运行后，文件为空。我不知道这里发生了什么，我在linux下做了同样的过程并且工作得很好。我认为问题可能出在mftraining.exe的生成上。它抛出此消息:Warning:noprotos/configsforainCreateIntTemplates()Warning:noprotos/configsforfinCreateIntTemplates()Warning:noprotos/configsforlinCreateIntTemplate

何在 Tesseract configs section CreateIntTemplates windows ocr

python - 如何在 Python doc 中使用 Windows 文件路径

我喜欢在我的__doc__用法字符串中给我的用户举个例子。以下是与我的问题相关的代码的重要部分。#jmetadata.py'''usage:jmetadata.pyinDirPathoutFilePathexample:jmetadata.py"\\\\Hal\\halfreeagent1\\backups\\videos\\"out.txt'''defforPyWinTests():jmetadata("\\\\Hal\\halfreeagent1\\backups\\videos\\","out.txt")NUM_ARGS=2defmain():args=sys.argv[1:]p

何在 Windows code jmetadata backups python filepath docstring

c++ - 在 64 位 Windows 上编译 Tesseract OCR

我正在尝试将TesseractOCR编译成Windows64位版本的库。我已经下载了源代码并使用VisualStudioExpressC++2010将其编译为32位版本，但由于我通常不是C++程序员，所以我不知道如何转向编译64位版本版本。非常感谢任何帮助。我需要64位版本的原因是我将它用作需要64位JVM的Java项目的一部分。32位版本的Tesseract显然不能在64位JVM中运行，但似乎没有正式的64位Windows版本。最佳答案相关的64位DLL由Tesseract.NETwrapper提供项目。您可能想查看其解决方案

上编 amp section Tesseract C++c++windows visual-studio-2010

1 2 345 6 7