我正在尝试创建一个相机Activity来拍摄要进行OCR的照片。这是我希望完成的:相机预览中间的一个可调整大小的框,用于指示哪个特定区域将创建为位图并由OCR引擎处理。连续自动对焦(完成)顺便说一句,我正在使用tesseract。如果有人愿意向我指出一些引用/示例/教程,那就太好了。 最佳答案 这里有一个取景器矩形:https://github.com/rmtheis/android-ocr/blob/master/android/src/edu/sfsu/cs/orange/ocr/CaptureActivity.java
我已经下载了适用于Android的GoogleDriveSDK,API没有很好的文档记录,所以我无法得出结论,如果我想做的事情是可能的。我想用相机捕捉图像并将其转换为黑白pdf,然后对其执行OCR以获取我需要的字段作为字符串。我是否需要为此发送服务器请求,或者我可以仅使用Driveapi在客户端执行此操作?示例代码会有所帮助。 最佳答案 Google的文档没有具体说明当您请求OCR时上传的文件会发生什么,具体来说,他们没有告诉您是否有响应字符串。但是,一些小实验表明,获取OCR数据的唯一方法是在OCR完成后查找文档并抓取文本。您将在
我正在尝试使用Tesseract在Android上构建OCR应用程序,但是当我保存图片时应用程序崩溃了。我已经使用教程SimpleAndroidPhotoCapture构建了照片捕获以及带有指南的OCR功能MakingaSimpleOCRAndroidAppusingTesseract。这是我正在使用的代码:packagecom.mmm.pitter;importjava.io.File;importjava.io.IOException;importcom.mmm.pitter.R;importcom.googlecode.tesseract.android.*;importcom.
我正在开发一个Android应用程序,它可以拍摄照片并将其翻译成文本。我在Windows上使用tesseract3。我已经设法使大部分翻译工作正常(在进行重新缩放、二值化、增强后),但某些字符仍未按应有的方式翻译(ri->m、le->Ie等)。为了纠正这个问题,我正在考虑强制tesseract查看我的语言词典(在我的例子中是法语)并使用最可能的词进行翻译。当我打开法语词典时,我很惊讶地看到了每一个英语单词。有没有办法强制tesseract在适当的语言中找到最可能的词?此外,我没有在网上找到很多android代码示例,而且我不确定我是否在进行最有效的图像预处理。这就是我目前正在做的事情,
我从6个月开始就在Android上工作。所以我对Android开发有了基本的了解。现在我想使用Tesseract开发一个OCRAndroid应用程序。为此,我已经从Tesseract下载了android-ndk-r6b、tess-two、适用于Windows的Cygwin,并在Eclipse中安装了C/C++开发人员。我点击了这两个链接:1.http://www.itwizard.ro/interfacing-cc-libraries-via-jni-example-tesseract-163.html2.http://gaut.am/making-an-ocr-android-app
我正在开发一款需要OCR的Android应用。我决定使用Tesseract作为API,但我不断收到此错误:E/Tesseract(native):CouldnotinitializeTesseractAPIwithlanguage=eng!我已经将文件"eng.traineddata"复制到该位置。我正在使用AndroidStudio2.1.2(SDK23)使用API22AndroidLollipop5.1.1在设备上进行测试(阅读Marshmallow上的权限问题)这是我使用的代码:publicvoidreads(Viewview){TextViewtextView=(TextVie
我希望有人能告诉我为什么我的Tesseract无法识别一些带有数字的图像,如果有什么我可以做的。一切都在根据测试工作,因为它只是我需要的数字,我想我可以用英语模式来管理,直到我不得不从7段显示器开始。虽然我在附加图像上遇到了很多麻烦,但我想知道我是否应该开始研究我自己的识别算法,或者我是否可以为Tesseract做我自己的数据集然后它会起作用,有没有人知道Tesseract的局限性在哪里吗?尝试过的事情:试图将psm设置为one_line、one_word、one_char(并切碎图片)。使用one_line和one_word没有显着变化。使用one_char它确实识别得更好一些,但有
我目前正在android上玩OCR。因此,我编写了一个带有相机预览的小应用程序,现在我正在从我的onPreviewFrame方法中提供tessearact工具(tess-two)图像。现在我想在我的相机预览中显示来自OCR的边界矩形。TessBaseAPI提供返回字符/单词边界框的方法。返回对象的类型是Pixa,与tess-two提供的leptonica库一样。所以我的问题是:如何从TessBaseAPI的getCharacters()或getWords()返回的Pixa对象中获取可用于在相机预览上绘制边界框的可用坐标?GetCharacters()andgetWords()inthe
我目前正在开发一个使用TesseractOCR的安卓项目。我希望通过添加字典来微调提供给用户的结果。根据tesseractOCRwiki,最好的办法是Replacetessdata/eng.user-wordswithyourownwordlist,inthesameformat-UTF8text,onewordperline.但是tessdata文件夹中没有eng.user-words文件,我假设如果我只是用我的字典制作一个文本文件,它永远不会被使用......有没有人有过类似的经历,知道该怎么办? 最佳答案 如果您使用的是tes
问题:大约一周前,为了进一步提高Tesseract的准确性,我添加了Guassian模糊/OTSU二值化组合,它产生了漂亮的二值图像,如附件所示。我在openCV中执行此操作,因此我传递给Tesseract的图像已经是二进制图像(如所附图像)。当Tesseract对图像(即使是下面发布的图像)进行预处理时,图像会损坏,因此不会产生任何有意义的输出。请参阅示例输入下方的图像,了解Tesseract对图像所做的操作。问题的根源是高斯模糊。如果我删除它,tesseract输出的Thresholdedimage不会出现乱码,但它也不像我附加的二进制图像那样干净和可读。我可以禁止Tesserac