tesseract-ocr

android - 创建针对 OCR 优化/适用的相机 Activity

我正在尝试创建一个相机Activity来拍摄要进行OCR的照片。这是我希望完成的:相机预览中间的一个可调整大小的框，用于指示哪个特定区域将创建为位图并由OCR引擎处理。连续自动对焦(完成)顺便说一句，我正在使用tesseract。如果有人愿意向我指出一些引用/示例/教程，那就太好了。最佳答案这里有一个取景器矩形:https://github.com/rmtheis/android-ocr/blob/master/android/src/edu/sfsu/cs/orange/ocr/CaptureActivity.java

android - 谷歌云端硬盘 OCR Android

我已经下载了适用于Android的GoogleDriveSDK，API没有很好的文档记录，所以我无法得出结论，如果我想做的事情是可能的。我想用相机捕捉图像并将其转换为黑白pdf，然后对其执行OCR以获取我需要的字段作为字符串。我是否需要为此发送服务器请求，或者我可以仅使用Driveapi在客户端执行此操作？示例代码会有所帮助。最佳答案 Google的文档没有具体说明当您请求OCR时上传的文件会发生什么，具体来说，他们没有告诉您是否有响应字符串。但是，一些小实验表明，获取OCR数据的唯一方法是在OCR完成后查找文档并抓取文本。您将在

android section https OCR google-drive-api

android - 使用 Tesseract 的 OCR Android 应用程序

我正在尝试使用Tesseract在Android上构建OCR应用程序，但是当我保存图片时应用程序崩溃了。我已经使用教程SimpleAndroidPhotoCapture构建了照片捕获以及带有指南的OCR功能MakingaSimpleOCRAndroidAppusingTesseract。这是我正在使用的代码:packagecom.mmm.pitter;importjava.io.File;importjava.io.IOException;importcom.mmm.pitter.R;importcom.googlecode.tesseract.android.*;importcom.

Tesseract android AndroidRuntime 29787 ocr

Android OCR 应用程序 : Tesseract dictionary

我正在开发一个Android应用程序，它可以拍摄照片并将其翻译成文本。我在Windows上使用tesseract3。我已经设法使大部分翻译工作正常(在进行重新缩放、二值化、增强后)，但某些字符仍未按应有的方式翻译(ri->m、le->Ie等)。为了纠正这个问题，我正在考虑强制tesseract查看我的语言词典(在我的例子中是法语)并使用最可能的词进行翻译。当我打开法语词典时，我很惊讶地看到了每一个英语单词。有没有办法强制tesseract在适当的语言中找到最可能的词？此外，我没有在网上找到很多android代码示例，而且我不确定我是否在进行最有效的图像预处理。这就是我目前正在做的事情，

dictionary Tesseract 单词 section photo android ocr

android - 如何在 Eclipse 中为 Android 开发配置 Tesseract？

我从6个月开始就在Android上工作。所以我对Android开发有了基本的了解。现在我想使用Tesseract开发一个OCRAndroid应用程序。为此，我已经从Tesseract下载了android-ndk-r6b、tess-two、适用于Windows的Cygwin，并在Eclipse中安装了C/C++开发人员。我点击了这两个链接:1.http://www.itwizard.ro/interfacing-cc-libraries-via-jni-example-tesseract-163.html2.http://gaut.am/making-an-ocr-android-app

何在 Tesseract code section Android eclipse cygwin android-ndk

android - 无法使用 language=eng 初始化 Tesseract API

我正在开发一款需要OCR的Android应用。我决定使用Tesseract作为API，但我不断收到此错误:E/Tesseract(native):CouldnotinitializeTesseractAPIwithlanguage=eng!我已经将文件"eng.traineddata"复制到该位置。我正在使用AndroidStudio2.1.2(SDK23)使用API22AndroidLollipop5.1.1在设备上进行测试(阅读Marshmallow上的权限问题)这是我使用的代码:publicvoidreads(Viewview){TextViewtextView=(TextVie

Tesseract language imageBitmap ExifInterface section android ocr tess-two

android - 无法识别 Tesseract 中的数字 - android

我希望有人能告诉我为什么我的Tesseract无法识别一些带有数字的图像，如果有什么我可以做的。一切都在根据测试工作，因为它只是我需要的数字，我想我可以用英语模式来管理，直到我不得不从7段显示器开始。虽然我在附加图像上遇到了很多麻烦，但我想知道我是否应该开始研究我自己的识别算法，或者我是否可以为Tesseract做我自己的数据集然后它会起作用，有没有人知道Tesseract的局限性在哪里吗？尝试过的事情:试图将psm设置为one_line、one_word、one_char(并切碎图片)。使用one_line和one_word没有显着变化。使用one_char它确实识别得更好一些，但有

android Tesseract section foobar ocr

java - Android OCR 超正方体 : using data from Pixa objects to display bounding boxes

我目前正在android上玩OCR。因此，我编写了一个带有相机预览的小应用程序，现在我正在从我的onPreviewFrame方法中提供tessearact工具(tess-two)图像。现在我想在我的相机预览中显示来自OCR的边界矩形。TessBaseAPI提供返回字符/单词边界框的方法。返回对象的类型是Pixa，与tess-two提供的leptonica库一样。所以我的问题是:如何从TessBaseAPI的getCharacters()或getWords()返回的Pixa对象中获取可用于在相机预览上绘制边界框的可用坐标？GetCharacters()andgetWords()inthe

正方体 bounding section tess-two android java ocr preview tesseract

android - Tesseract 自定义词典

我目前正在开发一个使用TesseractOCR的安卓项目。我希望通过添加字典来微调提供给用户的结果。根据tesseractOCRwiki，最好的办法是Replacetessdata/eng.user-wordswithyourownwordlist,inthesameformat-UTF8text,onewordperline.但是tessdata文件夹中没有eng.user-words文件，我假设如果我只是用我的字典制作一个文本文件，它永远不会被使用......有没有人有过类似的经历，知道该怎么办？最佳答案如果您使用的是tes

自定词典 code section word-dawg android dictionary ocr tesseract

c++ - OpenCV 高斯模糊破坏了 Tesseract？

问题:大约一周前，为了进一步提高Tesseract的准确性，我添加了Guassian模糊/OTSU二值化组合，它产生了漂亮的二值图像，如附件所示。我在openCV中执行此操作，因此我传递给Tesseract的图像已经是二进制图像(如所附图像)。当Tesseract对图像(即使是下面发布的图像)进行预处理时，图像会损坏，因此不会产生任何有意义的输出。请参阅示例输入下方的图像，了解Tesseract对图像所做的操作。问题的根源是高斯模糊。如果我删除它，tesseract输出的Thresholdedimage不会出现乱码，但它也不像我附加的二进制图像那样干净和可读。我可以禁止Tesserac

amp Tesseract section image c++

29 30 313233 34 35