Tesseract-OCR_草庐IT

javascript - 如何将 Tesseract 导入 Angular2 (TypeScript)

我正在尝试将Tesseract导入Angular2(TypeScript)。我可以看到它保存在node_modules文件夹中，但是在使用时从'@types/tesseract.js'导入{Tesseract};它说:[ts]Module'"c:/Users/black/Projects/projectCLI/tess/node_modules/@types/tesseract.js/index"'hasnoexportedmember'Tesseract'.在index.d.ts文件中有一个名为Tesseract的命名空间。是否有其他方法可以导入它，或者我们是否以错误的方式看待它？我

javascript - Node.js 比使用 Tesseract.Js 的浏览器 (Safari) 慢 20 倍

JS的新手和Node.js的新手。在Safari中运行Tesseract.js(文本识别软件:http://tesseract.projectnaptha.com)大约需要10秒，并立即开始输出进度。Node(v6.9.1)(从终端或通过Electron运行)在开始输出到控制台之前将CPU运行到100%4分20秒。然后它大约在同一时间完成。建议采取哪些故障排除步骤？这对Node来说很常见吗？我在日志中看到的唯一区别是Safari“在缓存eng.traineddata中找到”清除和禁用缓存对时间的影响很小。尝试了几个.JPG和.PNG(300-600kb)文件，结果相同-但BMP(3.7

javascript - JavaScript 中现有的 OCR 脚本

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭5年前。Improvethisquestion我有一个CMS增强的想法，可以从图像(例如，扫描的文档)中提取文本信息，并且想知道是否已经有任何东西可以帮助我实现这一目标？基本上，我想知道是否存在用JavaScript编写的现有OCR脚本，可以从图像中提取句子/单词(例如，使用canvas)。我知道有一些脚本可以执行相对较小的任务，例如验证码破解，但我还没有遇到用于提取完整句子的脚本。有这样的东西吗，还是我需要从头

<canvas> 上的 JavaScript 文本识别和 OCR

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭5年前。Improvethisquestion我找到了一个识别手写数学方程式的网络应用程序:http://webdemo.visionobjects.com/equation.html?locale=default我想知道是否有人知道实现此机制的应用程序或教程或开源项目，因为从这个webapp获取它真的很复杂。注意:我只需要在Canvas中绘制的等式在输入文本框中进行翻译即可。

JavaScript OCR API

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭6年前。Improvethisquestion我正在寻找JavaScriptOCRAPI。类似于:发送图片和预期结果类型(例如数字、对象、文本、混合等)并以字符串或JSON形式接收结果。有人知道可以通过JavaScript轻松访问的API/服务吗？编辑:我忘了说，主要用例只是识别数字(如float和double)和价格(例如0.02美元)。我已经找到了一些像abbyy这样的“cloud-ocrAPI”，但是它们很

javascript - 渐进式网络应用程序 OCR SDK (JavaScript)

我们开发了一个使用OCR技术的网络应用程序。我们使用付费的API服务，效果很好。我们的后端/服务器使用基于Ruby/Rails的API，我们的前端/客户端使用VUE.js。现在OCR技术是服务器端的，但我们也想进军离线/PWA(渐进式网络应用程序)市场，目前正在开发我们应用程序的离线版本。由于我们应用程序的OCR部分必须在客户端运行，我们会将OCR技术也转移到客户端，这意味着我们必须使用某种PWA兼容的OCR技术，例如一个JavaScriptSDK我可能已经搜索了整个互联网，但似乎没有真正的解决方案。这一切都归结为两个主要vendor:tesseract/可能是最大的OCR项目(开源)

xml - 如何将外部 OCR 嵌入到现有 PDF 中？

我有一组图像，我在这些图像上运行OCR应用程序。此过程会生成具有字符偏移量的XML文件。然后我使用Acrobat9将图像转换为PDF。现在，我想将XML文件信息作为不可见的文本层添加到PDF中，以实现可搜索的PDF。有没有简单又免费的方法？一些细节:我不想使用Acrobat的OCR功能；OCR过程生成一个XML文件，其中包含如下元素:Thisisasamplelineoftextfromanimage更新:也许可以用不同的方式做我想做的事。假设已经有一个从一组图像生成的PDF文件，并且已经包含OCRed文本。是否可以(也许以编程方式)仅访问每个页面的图像，对其进行处理(例如，将其转换为

使用 Tesseract 的 Android OCR 应用程序

我目前正在开发一个基于OCR(光学字符识别)的android应用程序。我已经下载了“tesseract-android”项目，其中包含用于编译Tesseract、Leptonica和JPEG库的工具，以便在Android上使用。我在WindowsVista操作系统上通过Eclipse进行开发。我还下载了必要的工具(android-ndk；apacheant..)，我已经仔细完成了构建这个项目的所有步骤，并将它作为一个库添加到我的基本应用程序中。我的应用包括打开相机拍照，然后通过tesseractAPI处理这张照片以将其转换为文本。我的问题是:1.这个程序真的不能在Windows操作系统

windows - 将 tesseract 命令行调整为 OCR 价格

我有一些带有价格的小图片，如下所示:但是当我尝试命令时我得到一个空的输出文件:tesseractimage.png输出.txt我应该使用什么特殊命令来对像这样的小图像进行OCR？另外，我能否指定可能的结果仅为美元符号、句点和数字0-9？我已经通过添加到配置文件尝试了“字母”方法，但我没有找到任何关于美元符号或句点是否需要转义的数据。无论如何，我使用上述命令的简单版本得到的响应为零。最佳答案您使用的是哪个版本的tesseract？使用以下命令:tesseractimage.png输出-psm8我得到了这个结果。12705美元请注意

windows - 当我使用带有 CREATE_NO_WINDOW 的 pytesseract 运行 tesseract 时如何隐藏控制台窗口

我正在使用tesseract对屏幕截图执行OCR。我有一个使用tkinter窗口的应用程序，在我的类的初始化中利用self.after在tkinter窗口中执行常量图像抓取和更新标签等值。我已经搜索了好几天，但找不到任何具体示例如何在使用pytesseract调用tesseract的Windows平台上利用CREATE_NO_WINDOW和Python3.6。这与这个问题有关:HowcanIhidetheconsolewindowwhenIruntesseractwithpytesser我只编写了2周的Python程序，不了解如何执行上述问题中的步骤。我打开了pytesseract.p