草庐IT

$Umi-OCR

全部标签

javascript - JavaScript 中现有的 OCR 脚本

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭5年前。Improvethisquestion我有一个CMS增强的想法,可以从图像(例如,扫描的文档)中提取文本信息,并且想知道是否已经有任何东西可以帮助我实现这一目标?基本上,我想知道是否存在用JavaScript编写的现有OCR脚本,可以从图像中提取句子/单词(例如,使用canvas)。我知道有一些脚本可以执行相对较小的任务,例如验证码破解,但我还没有遇到用于提取完整句子的脚本。有这样的东西吗,还是我需要从头

<canvas> 上的 JavaScript 文本识别和 OCR

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭5年前。Improvethisquestion我找到了一个识别手写数学方程式的网络应用程序:http://webdemo.visionobjects.com/equation.html?locale=default我想知道是否有人知道实现此机制的应用程序或教程或开源项目,因为从这个webapp获取它真的很复杂。注意:我只需要在Canvas中绘制的等式在输入文本框中进行翻译即可。

JavaScript OCR API

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭6年前。Improvethisquestion我正在寻找JavaScriptOCRAPI。类似于:发送图片和预期结果类型(例如数字、对象、文本、混合等)并以字符串或JSON形式接收结果。有人知道可以通过JavaScript轻松访问的API/服务吗?编辑:我忘了说,主要用例只是识别数字(如float和double)和价格(例如0.02美元)。我已经找到了一些像abbyy这样的“cloud-ocrAPI”,但是它们很

javascript - 渐进式网络应用程序 OCR SDK (JavaScript)

我们开发了一个使用OCR技术的网络应用程序。我们使用付费的API服务,效果很好。我们的后端/服务器使用基于Ruby/Rails的API,我们的前端/客户端使用VUE.js。现在OCR技术是服务器端的,但我们也想进军离线/PWA(渐进式网络应用程序)市场,目前正在开发我们应用程序的离线版本。由于我们应用程序的OCR部分必须在客户端运行,我们会将OCR技术也转移到客户端,这意味着我们必须使用某种PWA兼容的OCR技术,例如一个JavaScriptSDK我可能已经搜索了整个互联网,但似乎没有真正的解决方案。这一切都归结为两个主要vendor:tesseract/可能是最大的OCR项目(开源)

xml - 如何将外部 OCR 嵌入到现有 PDF 中?

我有一组图像,我在这些图像上运行OCR应用程序。此过程会生成具有字符偏移量的XML文件。然后我使用Acrobat9将图像转换为PDF。现在,我想将XML文件信息作为不可见的文本层添加到PDF中,以实现可搜索的PDF。有没有简单又免费的方法?一些细节:我不想使用Acrobat的OCR功能;OCR过程生成一个XML文件,其中包含如下元素:Thisisasamplelineoftextfromanimage更新:也许可以用不同的方式做我想做的事。假设已经有一个从一组图像生成的PDF文件,并且已经包含OCRed文本。是否可以(也许以编程方式)仅访问每个页面的图像,对其进行处理(例如,将其转换为

使用 Tesseract 的 Android OCR 应用程序

我目前正在开发一个基于OCR(光学字符识别)的android应用程序。我已经下载了“tesseract-android”项目,其中包含用于编译Tesseract、Leptonica和JPEG库的工具,以便在Android上使用。我在WindowsVista操作系统上通过Eclipse进行开发。我还下载了必要的工具(android-ndk;apacheant..),我已经仔细完成了构建这个项目的所有步骤,并将它作为一个库添加到我的基本应用程序中。我的应用包括打开相机拍照,然后通过tesseractAPI处理这张照片以将其转换为文本。我的问题是:1.这个程序真的不能在Windows操作系统

windows - 将 tesseract 命令行调整为 OCR 价格

我有一些带有价格的小图片,如下所示:但是当我尝试命令时我得到一个空的输出文件:tesseractimage.png输出.txt我应该使用什么特殊命令来对像这样的小图像进行OCR?另外,我能否指定可能的结果仅为美元符号、句点和数字0-9?我已经通过添加到配置文件尝试了“字母”方法,但我没有找到任何关于美元符号或句点是否需要转义的数据。无论如何,我使用上述命令的简单版本得到的响应为零。 最佳答案 您使用的是哪个版本的tesseract?使用以下命令:tesseractimage.png输出-psm8我得到了这个结果。12705美元请注意

c++ - 在 64 位 Windows 上编译 Tesseract OCR

我正在尝试将TesseractOCR编译成Windows64位版本的库。我已经下载了源代码并使用VisualStudioExpressC++2010将其编译为32位版本,但由于我通常不是C++程序员,所以我不知道如何转向编译64位版本版本。非常感谢任何帮助。我需要64位版本的原因是我将它用作需要64位JVM的Java项目的一部分。32位版本的Tesseract显然不能在64位JVM中运行,但似乎没有正式的64位Windows版本。 最佳答案 相关的64位DLL由Tesseract.NETwrapper提供项目。您可能想查看其解决方案

python - Tesseract OCR、Python 和 Windows XP

大家晚上好我正在尝试使用在这里找到的tesseract(OCR)python包装器,第一个示例:https://code.google.com/p/python-tesseract/wiki/CodeSnippets我在WindowsXP机器上使用Python27。一切都是32位的。我已经安装了本指南中的所有依赖项:http://opencvpython.blogspot.com/2012/05/install-opencv-in-windows-for-python.html我检查了环境变量:TESSDATA_PREFIX=C:\ProgramFiles\Tesseract-OCR\

python - pytesseract OCR python 错误-示例代码

您好,我试着学习如何使用pytesseract(https://pypi.python.org/pypi/pytesseract),所以我运行示例代码:try:importImageexceptImportError:fromPILimportImageimportpytesseractim=Image.open('test.png')print(pytesseract.image_to_string(im))但是我有错误:Traceback(mostrecentcalllast):File"C:/Users/K/PycharmProjects/untitled/zad1.py",li