草庐IT

tesseract

全部标签

android - android中最好的OCR(光学字符识别)示例

已结束。此问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是无关紧要的,因为它们往往会吸引固执己见的答案和垃圾邮件。相反,describetheproblem以及到目前为止为解决这个问题所做的工作。关闭9年前。Improvethisquestion我想要一个在android中运行OCR的示例,我做了一些研究并找到了一个在android中实现OCR的示例。https://github.com/rmtheis/tess-two其中有三个项目文件...两只眼睛苔丝二tess-two

android - android中最好的OCR(光学字符识别)示例

已结束。此问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是无关紧要的,因为它们往往会吸引固执己见的答案和垃圾邮件。相反,describetheproblem以及到目前为止为解决这个问题所做的工作。关闭9年前。Improvethisquestion我想要一个在android中运行OCR的示例,我做了一些研究并找到了一个在android中实现OCR的示例。https://github.com/rmtheis/tess-two其中有三个项目文件...两只眼睛苔丝二tess-two

java - Android:如何提高 tesseract ocr 检索到的图像中的数字?

我制作了一个简单的应用程序,可以读取图像并将数字图像检索为带有android的文本。但问题是准确率只有60%左右,而且还会出现一些不需要的噪音。我确实认为准确率不可能达到100%,但是,我相信一定有办法改进它。但是,由于我是业余爱好者,所以我觉得很难。我在谷歌周围搜索过,但无法获得可靠的信息。我想从如下图所示的东方幸运票中读取数字596、00和012345。 最佳答案 Tesseract-ocr最适合满足以下条件的字符图像:输入图像至少要有300dpi输入图像应该是黑白的输入图像中应该有最小的噪声(即文本应该与背景清楚地区分)文本行

java - Tesseract - 错误 net.sourceforge.tess4j.Tesseract - 空

创建了一个使用Tesseract的java应用程序,以便将给定的图像或pdf转换为字符串格式,当它在我的机器上作为使用junit的单元测试运行时它运行得很好但是当运行完整的系统时它是一个restFulAPI由接收图像并运行Tesseract的tomcat运行,它给我以下错误:23:22:36.511[http-nio-9999-exec-3]ERRORnet.sourceforge.tess4j.Tesseract-nulljava.lang.NullPointerException:nullatnet.sourceforge.tess4j.util.PdfUtilities.conv

java - 在进行字符识别(tesseract)之前使用 OpenCV 进行图像预处理

我正在尝试开发用于车牌识别的简单PC应用程序(Java+OpenCV+Tess4j)。图像不是很好(进一步它们会很好)。我想为tesseract预处理图像,但我卡在车牌检测(矩形检测)上。我的步骤:1)源图片Matimg=newMat();img=Imgcodecs.imread("sample_photo.jpg");Imgcodecs.imwrite("preprocess/True_Image.png",img);2)灰度MatimgGray=newMat();Imgproc.cvtColor(img,imgGray,Imgproc.COLOR_BGR2GRAY);Imgcode

java - 获取错误 : "bad read of inttemp!" when training a new font in Tesseract 2

我正在尝试针对可在我的Android应用程序中使用的新字体训练Tesseract。我只需要训练数字,所以我创建了一个训练图像、box文件和unicharset文件。我关注了thetraininginstructions,但是当我尝试运行tesseract时,它说,badreadofinttemp!。我做错了什么?我如何诊断此错误? 最佳答案 http://code.google.com/p/tesseract-ocr/issues/detail?id=155事实证明,tesseract仍在返回到“C:\ProgramFiles\Te

python - Python 中 Tesseract OCR 的 UnicodeDecodeError

我正在尝试使用Python中的TesseractOCR从图像文件中提取文本,但我遇到了一个错误,我可以弄清楚如何处理它。我所有的环境都很好,因为我在python中使用ocr测试了一些示例图像!这是代码fromPILimportImageimportpytesseractstrs=pytesseract.image_to_string(Image.open('binarized_image.png'))print(strs)以下是我从eclipse控制台得到的错误strs=pytesseract.image_to_string(Image.open('binarized_body.png

python - Pytesseract : "TesseractNotFound Error: tesseract is not installed or it' s not in your path", 我该如何解决这个问题?

我正在尝试在python中运行一个基本且非常简单的代码。fromPILimportImageimportpytesseractim=Image.open("sample1.jpg")text=pytesseract.image_to_string(im,lang='eng')print(text)这就是它的样子,我实际上已经通过安装程序安装了tesseractforwindows。我是Python的新手,我不确定如何继续?此处的任何指导都会非常有帮助。我试过重新启动我的Spyder应用程序但无济于事。 最佳答案 我看到步骤分散在不同

python - tesseract 的 OCR 结果高度不一致

这是原始屏幕截图,我将图像裁剪成4部分并尽可能清除图像的背景,但tesseract仅检测此处的最后一列并忽略其余部分。tesseract的输出显示为存在我在处理结果时删除的空格Femme—Fatale.DaRkLoRdEIaaChineseN1gg4Noob_Diablo_tesseract的输出显示为存在我在处理结果时删除的空格Kicked.NosNoelChikiZDDeath_Eag|e_42Chai—.3579101714829623O7101221422799220513678821271986307564048841540406O8080我只是转储的输出result=`py

Python Tesseract 无法识别此字体

我有这张图片:我想使用python将其读取为字符串,我认为这并不难。我遇到了tesseract,然后是使用tesseract的python脚本包装器。所以我开始阅读图像,在我尝试阅读这幅图像之前效果很好。我是否必须训练它来阅读特定的字体?关于特定字体是什么的任何想法?或者是否有更好的ocr引擎我可以与python一起使用来完成这项工作。编辑:也许我可以围绕数字制作某种矢量,然后以更大的尺寸重新绘制它们?图像越大,tesseractocr似乎越能读取它们(毫不奇怪,哈哈)。 最佳答案 只需为10位数字和一个“.”训练引擎.应该这样做。