我是一名学生,正在参与一个学校项目,目的是创建一个名片扫描仪,从图像中提取文本,并根据姓名、电话号码等相应地将其显示到相应的文本框中。过去几周我一直在谷歌上搜索,并在网上找到了很多很好的例子。目前,我正在尝试从我在网上找到的名为“AndrOCR”的应用程序中实现源代码。但是,我在代码中遇到了一些错误,我不知道如何在Ecilpse(juno)中解决。我已经从rmtheis中实现了tess-two,并且能够运行其他一些OCR源代码。但是,对于“AndrOCR”我无法解决。错误代码如下:publicvoidonDialogSingleChoice(intdialog_id,intitem){
所以最终我会尝试将我希望谷歌上传到OCR的图像上传。然后我希望能够将OCR的结果返回到我的Android应用程序。我的图片已正确上传。我可以遍历我的谷歌驱动器中的所有文件,我看到有可用的导出链接,其中之一是“text/plain”。如果我在浏览器中使用其中一个url,它会下载文本。这是我应该尝试访问它的方式吗?我尝试使用通过对插入方法返回的文件调用getExportLinks方法获得的urlFilefile=drive.files().insert(body,mediaContent).setOcr(true).execute();StringimageAsTextUrl=getExp
我是一名学生,目前在AndroidStudio1.5上为android开发OCR功能。我在网上找到了很多很好的例子,并一直在尝试在AndroidStudio上实现它。我已经配置了NDK构建,应用程序能够在Eclipse(juno)和AndroidStudio上运行。我的代码可以在这里找到:https://github.com/TheWall89/AndrOCR但是在AndroidStudio上,每当我到达应用程序的OCR功能时,应用程序就会崩溃。我已经在线研究并在我的代码中实现了Crashlytics,以找出崩溃的原因。以下是Crashlytics中显示的输出:FatalExcepti
我目前正在使用OCR开发Android应用程序,我已经到了调用BaseAPI.init()方法的地步。我不断收到错误消息,指出该目录必须包含tessdata作为子文件夹。我已检查文件目录是否包含其中包含trainingdata文件的文件夹,并确保我指向正确的目录。我真的很想解决这个问题。我指向的目录是/mnt/sdcard/Image2Text/。我已确保tessdata是一个子文件夹,其中包含必要的语言文件。代码如下:publicstaticfinalStringDATA_PATH=Environment.getExternalStorageDirectory().toString(
我正在尝试开发一个AndroidOCR应用程序(供家庭使用)。我有在应用程序中使用AspriseOCR的想法,但我打算使用Linux版本而不是Windows版本。问题是,我不知道如何处理本地库。它们的扩展名为.SH我在Eclipse中开发。 最佳答案 Google最近发布了一个OCRAPI,因此您可能想使用它:https://developers.google.com/vision/text-overview只需将以下行添加到您的依赖项中:compile'com.google.android.gms:play-services-vi
我正在尝试创建一个相机Activity来拍摄要进行OCR的照片。这是我希望完成的:相机预览中间的一个可调整大小的框,用于指示哪个特定区域将创建为位图并由OCR引擎处理。连续自动对焦(完成)顺便说一句,我正在使用tesseract。如果有人愿意向我指出一些引用/示例/教程,那就太好了。 最佳答案 这里有一个取景器矩形:https://github.com/rmtheis/android-ocr/blob/master/android/src/edu/sfsu/cs/orange/ocr/CaptureActivity.java
我已经下载了适用于Android的GoogleDriveSDK,API没有很好的文档记录,所以我无法得出结论,如果我想做的事情是可能的。我想用相机捕捉图像并将其转换为黑白pdf,然后对其执行OCR以获取我需要的字段作为字符串。我是否需要为此发送服务器请求,或者我可以仅使用Driveapi在客户端执行此操作?示例代码会有所帮助。 最佳答案 Google的文档没有具体说明当您请求OCR时上传的文件会发生什么,具体来说,他们没有告诉您是否有响应字符串。但是,一些小实验表明,获取OCR数据的唯一方法是在OCR完成后查找文档并抓取文本。您将在
我正在尝试使用Tesseract在Android上构建OCR应用程序,但是当我保存图片时应用程序崩溃了。我已经使用教程SimpleAndroidPhotoCapture构建了照片捕获以及带有指南的OCR功能MakingaSimpleOCRAndroidAppusingTesseract。这是我正在使用的代码:packagecom.mmm.pitter;importjava.io.File;importjava.io.IOException;importcom.mmm.pitter.R;importcom.googlecode.tesseract.android.*;importcom.
我正在开发一个Android应用程序,它可以拍摄照片并将其翻译成文本。我在Windows上使用tesseract3。我已经设法使大部分翻译工作正常(在进行重新缩放、二值化、增强后),但某些字符仍未按应有的方式翻译(ri->m、le->Ie等)。为了纠正这个问题,我正在考虑强制tesseract查看我的语言词典(在我的例子中是法语)并使用最可能的词进行翻译。当我打开法语词典时,我很惊讶地看到了每一个英语单词。有没有办法强制tesseract在适当的语言中找到最可能的词?此外,我没有在网上找到很多android代码示例,而且我不确定我是否在进行最有效的图像预处理。这就是我目前正在做的事情,
我目前正在android上玩OCR。因此,我编写了一个带有相机预览的小应用程序,现在我正在从我的onPreviewFrame方法中提供tessearact工具(tess-two)图像。现在我想在我的相机预览中显示来自OCR的边界矩形。TessBaseAPI提供返回字符/单词边界框的方法。返回对象的类型是Pixa,与tess-two提供的leptonica库一样。所以我的问题是:如何从TessBaseAPI的getCharacters()或getWords()返回的Pixa对象中获取可用于在相机预览上绘制边界框的可用坐标?GetCharacters()andgetWords()inthe