草庐IT

tesseract-doc

全部标签

android - 无法使用 language=eng 初始化 Tesseract API

我正在开发一款需要OCR的Android应用。我决定使用Tesseract作为API,但我不断收到此错误:E/Tesseract(native):CouldnotinitializeTesseractAPIwithlanguage=eng!我已经将文件"eng.traineddata"复制到该位置。我正在使用AndroidStudio2.1.2(SDK23)使用API22AndroidLollipop5.1.1在设备上进行测试(阅读Marshmallow上的权限问题)这是我使用的代码:publicvoidreads(Viewview){TextViewtextView=(TextVie

android - 在 android 的 google docs webview 中删除登录按钮

我在android的WebView中使用googledocs显示PDF文件。如何删除或隐藏“登录”按钮?我在下面附上了截图。提前致谢。webview=(WebView)findViewById(R.id.webView1);webview.getSettings().setJavaScriptEnabled(true);webview.loadUrl("https://docs.google.com/viewer?url=http://www.ex.com/terms.pdf");webview.setWebViewClient(newWebViewClient(){@Override

android - 如何在 android 中读取 .doc、.docx、.xls 文件

这个问题在这里已经有了答案:ConvertWorddoctoHTMLprogrammaticallyinJava(11个答案)关闭9年前。我正在尝试在android中显示PDF和.DOC文件。我能够显示PDF文件,但我无法显示.DOC、.DOCX、.PPT和.xls文件。在WORD-EXTRACTOR的帮助下,我们可以获取doc文件的文本,但问题是它只提供文本而不是.doc文件中的图像。我搜索将doc文件转换为PDF文件但没有成功。是否可以在设备上将.doc文件转换为PDF?如果我们想在android设备中显示.doc或.docx文档,那么哪个库对这样做有用?有什么建议吗?

android - 无法识别 Tesseract 中的数字 - android

我希望有人能告诉我为什么我的Tesseract无法识别一些带有数字的图像,如果有什么我可以做的。一切都在根据测试工作,因为它只是我需要的数字,我想我可以用英语模式来管理,直到我不得不从7段显示器开始。虽然我在附加图像上遇到了很多麻烦,但我想知道我是否应该开始研究我自己的识别算法,或者我是否可以为Tesseract做我自己的数据集然后它会起作用,有没有人知道Tesseract的局限性在哪里吗?尝试过的事情:试图将psm设置为one_line、one_word、one_char(并切碎图片)。使用one_line和one_word没有显着变化。使用one_char它确实识别得更好一些,但有

android - 在应用程序中创建 PDF/Word (Doc) 文件

是否有明确的方法可以在应用程序中创建PDF或MSWordDoc文件并立即通过电子邮件发送(也可能存储)。我已经尝试了很长一段时间,并找到了JAVA库:apwlibrary和iText。但是他们都没有提供任何类型的教程。谁能指出我正确的方向?编辑:想想看,是否可以使用在线PDF生成器,首先将数据发送到服务,然后检索结果并将其保存在手机上? 最佳答案 我会推荐apachefophttp://xmlgraphics.apache.org/fop/您可以使用标准FOP生成pdf。 关于andro

android - Tesseract 自定义词典

我目前正在开发一个使用TesseractOCR的安卓项目。我希望通过添加字典来微调提供给用户的结果。根据tesseractOCRwiki,最好的办法是Replacetessdata/eng.user-wordswithyourownwordlist,inthesameformat-UTF8text,onewordperline.但是tessdata文件夹中没有eng.user-words文件,我假设如果我只是用我的字典制作一个文本文件,它永远不会被使用......有没有人有过类似的经历,知道该怎么办? 最佳答案 如果您使用的是tes

android - 如何在 Eclipse 中为 android 的 google drive api 设置 Java Doc

我在eclipse中使用适用于android的googledriveapi,我如何链接文档以便当我将鼠标悬停在某处时,我可以查看它的java文档。 最佳答案 假设您使用的是Android开发工具(ADT),请参阅https://stackoverflow.com/a/11579339/1369991关于如何去做。请注意,libs文件夹的内容将与您的应用程序bundle在一起。因此,您真的应该将源代码和JavadocJAR放在另一个文件夹中,甚至将它们放在您的工作区之外。该答案中描述的所有内容也适用于外部JAR——在Windows上,

Android 如何打开一个.doc 扩展名的文件?

有什么方法可以打开.doc扩展文件吗? 最佳答案 与iOS不同,Android本身不支持渲染.doc或.ppt文件。您正在寻找允许您的应用重复使用其他应用的Activity来显示这些文档类型的公共(public)Intent。但这仅适用于安装了支持此Intent的应用程序的手机。http://developer.android.com/guide/topics/intents/intents-filters.html或者如果你已经安装了一些应用程序然后使用这个Intent://Uriuri=Uri.parse("file://"+f

c++ - OpenCV 高斯模糊破坏了 Tesseract?

问题:大约一周前,为了进一步提高Tesseract的准确性,我添加了Guassian模糊/OTSU二值化组合,它产生了漂亮的二值图像,如附件所示。我在openCV中执行此操作,因此我传递给Tesseract的图像已经是二进制图像(如所附图像)。当Tesseract对图像(即使是下面发布的图像)进行预处理时,图像会损坏,因此不会产生任何有意义的输出。请参阅示例输入下方的图像,了解Tesseract对图像所做的操作。问题的根源是高斯模糊。如果我删除它,tesseract输出的Thresholdedimage不会出现乱码,但它也不像我附加的二进制图像那样干净和可读。我可以禁止Tesserac

c++ - Tesseract 或任何其他 OCR 库

我正在寻找有关如何在C++中使用(和训练?)Tesseract的解释/API文档/示例,在googleTesseract页面上没有任何有用的信息,但尚未在网上找到一些东西。任何有用的资源和经验都将非常受欢迎,因为我不知道如何开始。附言:我愿意听取关于其他方面的建议图书馆。仅免费库 最佳答案 我对Tesseract有一些经验...一个简单的“训练tesseract”谷歌显示了这个页面:http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract您必须在其中选择要训练的tes