我制作了一个简单的应用程序,可以读取图像并将数字图像检索为带有android的文本。但问题是准确率只有60%左右,而且还会出现一些不需要的噪音。我确实认为准确率不可能达到100%,但是,我相信一定有办法改进它。但是,由于我是业余爱好者,所以我觉得很难。我在谷歌周围搜索过,但无法获得可靠的信息。我想从如下图所示的东方幸运票中读取数字596、00和012345。 最佳答案 Tesseract-ocr最适合满足以下条件的字符图像:输入图像至少要有300dpi输入图像应该是黑白的输入图像中应该有最小的噪声(即文本应该与背景清楚地区分)文本行
创建了一个使用Tesseract的java应用程序,以便将给定的图像或pdf转换为字符串格式,当它在我的机器上作为使用junit的单元测试运行时它运行得很好但是当运行完整的系统时它是一个restFulAPI由接收图像并运行Tesseract的tomcat运行,它给我以下错误:23:22:36.511[http-nio-9999-exec-3]ERRORnet.sourceforge.tess4j.Tesseract-nulljava.lang.NullPointerException:nullatnet.sourceforge.tess4j.util.PdfUtilities.conv
我正在尝试开发用于车牌识别的简单PC应用程序(Java+OpenCV+Tess4j)。图像不是很好(进一步它们会很好)。我想为tesseract预处理图像,但我卡在车牌检测(矩形检测)上。我的步骤:1)源图片Matimg=newMat();img=Imgcodecs.imread("sample_photo.jpg");Imgcodecs.imwrite("preprocess/True_Image.png",img);2)灰度MatimgGray=newMat();Imgproc.cvtColor(img,imgGray,Imgproc.COLOR_BGR2GRAY);Imgcode
我正在尝试针对可在我的Android应用程序中使用的新字体训练Tesseract。我只需要训练数字,所以我创建了一个训练图像、box文件和unicharset文件。我关注了thetraininginstructions,但是当我尝试运行tesseract时,它说,badreadofinttemp!。我做错了什么?我如何诊断此错误? 最佳答案 http://code.google.com/p/tesseract-ocr/issues/detail?id=155事实证明,tesseract仍在返回到“C:\ProgramFiles\Te
我正在尝试使用Python中的TesseractOCR从图像文件中提取文本,但我遇到了一个错误,我可以弄清楚如何处理它。我所有的环境都很好,因为我在python中使用ocr测试了一些示例图像!这是代码fromPILimportImageimportpytesseractstrs=pytesseract.image_to_string(Image.open('binarized_image.png'))print(strs)以下是我从eclipse控制台得到的错误strs=pytesseract.image_to_string(Image.open('binarized_body.png
我正在尝试在python中运行一个基本且非常简单的代码。fromPILimportImageimportpytesseractim=Image.open("sample1.jpg")text=pytesseract.image_to_string(im,lang='eng')print(text)这就是它的样子,我实际上已经通过安装程序安装了tesseractforwindows。我是Python的新手,我不确定如何继续?此处的任何指导都会非常有帮助。我试过重新启动我的Spyder应用程序但无济于事。 最佳答案 我看到步骤分散在不同
这是原始屏幕截图,我将图像裁剪成4部分并尽可能清除图像的背景,但tesseract仅检测此处的最后一列并忽略其余部分。tesseract的输出显示为存在我在处理结果时删除的空格Femme—Fatale.DaRkLoRdEIaaChineseN1gg4Noob_Diablo_tesseract的输出显示为存在我在处理结果时删除的空格Kicked.NosNoelChikiZDDeath_Eag|e_42Chai—.3579101714829623O7101221422799220513678821271986307564048841540406O8080我只是转储的输出result=`py
我有这张图片:我想使用python将其读取为字符串,我认为这并不难。我遇到了tesseract,然后是使用tesseract的python脚本包装器。所以我开始阅读图像,在我尝试阅读这幅图像之前效果很好。我是否必须训练它来阅读特定的字体?关于特定字体是什么的任何想法?或者是否有更好的ocr引擎我可以与python一起使用来完成这项工作。编辑:也许我可以围绕数字制作某种矢量,然后以更大的尺寸重新绘制它们?图像越大,tesseractocr似乎越能读取它们(毫不奇怪,哈哈)。 最佳答案 只需为10位数字和一个“.”训练引擎.应该这样做。
我正在使用带有python-tesseract的tesseractOCR。在tesseractFAQ中,关于数字,我们有:UseTessBaseAPI::SetVariable("tessedit_char_whitelist","0123456789");BEFOREcallinganInitfunctionorputthisinatextfilecalledtessdata/configs/digits:tessedit_char_whitelist0123456789andthenyourcommandlinebecomes:tesseractimage.tifoutputbas
据我所知,Tesseract3.x带有6种英文(如果我错了请纠正我)字体。我需要为更多5种字体训练Tesseract。我只需要大写字母和数字(没有特殊字符或符号)。我遵循了各种流程,例如:AddingNewFontstoTesseract3OCREngine还使用工具来自动化流程,例如SerakTesseractTrainerforTesseract3.02为了生成盒子文件,我使用了QTBoxEditor使用上述工具后,我得到了eng.traineddata文件。所有教程都告诉我将这个eng.traineddata文件添加到Tesseract-OCR\tessdata文件夹,但这样做会