草庐IT

tesseract-ocr

全部标签

hadoop - OCR/Parquet文件的存储策略

假设我的HDFSblock大小等于256Mb,并且我需要在OCR/Parquet文件上存储20Gb的数据,将所有数据存储在一个OCR/Parquet文件上是否更好,还是最好将它存储在许多256Mb(HDFSblock大小)的ORC/Parquet文件中?提前致谢。 最佳答案 Mappers和Reducers负责处理您的核心数据处理需求。资源管理器负责根据您提供的输入和输入类型识别特定作业中涉及的数据,并尝试将其划分为多个任务并管理这些作业的执行。但是,您需要确保您提供的数据经过优化并平均分配,以便资源管理器可以将它们分配给映射器。注

OCR 文字检测(Differentiable Binarization --- DB)

百度飞桨(PaddlePaddle)-PaddleOCR文字识别简单使用图像二值化图像二值化(ImageBinarization),指将图像上的像素点灰度值设为0或255,将整个图像呈现出明显的黑白效果过程,二值图像每个像素只有两种取值:要么纯黑,要么纯白图像二值化,有利于图像的进一步处理,使图像变得简单,数据量减少(256位的灰度图,共有256级,变成黑白图像后,只有2级),能凸显出感兴趣的目标轮廓,然后进行二值图像的处理与分析阈值法是指选取一个数字,大于它就视为全白,小于它就视为全黑,0代表全黑,255代表全白所有灰度大于或等于阀值的像素,被判定为属于特定物体,其灰度值为255表示,否则这

php - 如何在 PHP 中使用 Tesseract OCR?

我在Windows上使用XAMPP。我想在PHP中使用TesseractOCR我的tesseract安装在C:/ProgramFiles/TesseractOCR/XAMPP安装在C:/xampp/我正在使用这段代码在我的PHP中执行Tesseractexec("tesseracttest.pngtest.txt");但它不工作...... 最佳答案 你的exec函数应该是exec("tesseract.exetest.pngtest.txt");您缺少tesseract上的.exe扩展名。我刚刚犯了同样的错误!此外,您的tesse

java - 如何使用 openCV 或 OCR tesseract 从图像中提取文本?

这个问题在这里已经有了答案:关闭10年前。PossibleDuplicate:androidOCR?我目前正在做一个基于Android手机图像捕获的文本识别项目。我想问一下如何从图片中提取文字?有没有openCV或者OCRtesseract的提取教程?

android - tesseract-android-tools 以外的 ocr 库

我已经创建了一个基于ocr的android应用程序。除了tesseract之外还有其他可用的库吗?因为它已从code.google.com中弃用。Asprise似乎不是一个独立于平台的OCR。我已经尝试过RonCemer的JavaOCR库,但它们针对每种字符和喜欢的格式进行了训练。我没有选择离开这部分。请帮助找到一个与tesseract具有相似性能的合适的库。您提供的任何反馈都将受到重视。提前致谢 最佳答案 你可能想看看https://github.com/rmtheis/tess-two.tess-two是TesseractAnd

android - Windows 中的 Tesseract OCR Android

我已经阅读了所有关于它的问题论坛和博客,但我仍然有一个问题。首先,我勾选了tess-two作为库,我的项目也使用tess-two作为库。我下载了Android-NDK,并从我的项目属性中单击了Builders,然后单击了new->Program,然后我选择了ndk的ndk-build文件。顺便说一句,我的项目是GautamGupta的项目。他给了项目。链接:https://github.com/GautamGupta/Simple-Android-OCR.当我在手机中运行该项目时,应用程序会启动并拍摄照片,但是当我按下保存时,应用程序会出现以下错误。http://t1307.hizli

android - tesseract ANDROID 中的黑名单和白名单

我正在开发一个android应用程序,通过手机的相机或从图库中为卡拍照来为手机充值。我为此目的使用tesseract库来使用黑名单和白名单只获取数字。它不按预期工作我用的图片只有这两行:密码41722757649786开始充值Activity前的结果是:71820041722757649786我只想识别没有字母且不使用裁剪器的数字..publicvoidinitTess(){if(mBaseApi!=null)mBaseApi.end();mBaseApi=newTessBaseAPI();mBaseApi.setDebug(false);mBaseApi.setPageSegMode

android - 由于 Linux 中的 "Could not delete '/tesseract-android-tools/bin/classes/com',项目未构建

执行此链接中的这些步骤后:http://rmtheis.wordpress.com/2011/08/06/using-tesseract-tools-for-android-to-create-a-basic-ocr-app/将“Tesseract-android-tools”作为库添加到eclipse中,发现这个错误:由于“无法删除‘/tesseract-android-tools/bin/classes/com’”,该项目未构建。修复问题,然后尝试刷新此项目并构建它,因为它可能不一致。我无法解决这个错误,无法在我的应用程序中使用该库。如果有人知道该错误,请尽快回复。

android - 如何通过 Tesseract 在 Android 上使用多语言支持?

我正在尝试使用TesseractTessbaseApi并且我想使用两种语言以便我可以一起识别例如英语和希腊语字符。我发现Tesseract3.02支持多语言识别(MergingtwoOCRtraineddata)。但是我如何在Android中使用它呢? 最佳答案 可以通过init方法设置:baseApi.init(dataPath,"eng+ell"); 关于android-如何通过Tesseract在Android上使用多语言支持?,我们在StackOverflow上找到一个类似的问题

Android OCR 使用 tess-two 的一个分支 tesseract

在正在进行的项目中使用OCR作为模块。在深入研究了一个星期之后,我认为我应该在eclipse上运行一个测试应用程序,看看它的工作原理有多准确。我发现tess-two是tesseract的一个分支,作为对我的OCR的支持。我从以下位置下载了苔丝二:https://github.com/rmtheis/tess-two/downloads我已经准备好将tess-two导入到我的eclipse中。我确实将我的eclipse设置为处理和构建涉及native代码的项目。在解决1或2个构建路径错误后,我确实成功构建了tess-two。完成!然后我找到了一个使用相同tess-two的简单OCR应用程