草庐IT

tesseract-ocr

全部标签

java - OCR算法改进

我正在创建基于Java的OCR。我的目标是从视频文件中提取文本(后处理)。要找到完全在Java上运行的免费开源OCR,这是一项艰巨的搜索工作。我发现Tess4J是唯一受欢迎的选择,但考虑到对native接口(interface)的需求,我不知何故倾向于从头开发算法。我需要创建一个可靠的OCR,以合理的准确度正确识别英文字母(仅计算机化字体,而不是手写文本),前提是文本在视频帧中的区域是预定义的。我们也可以假设文本的颜色是给定的。到目前为止我做了什么:(所有图像处理都使用openCV的Java绑定(bind)完成)我使用以下方法提取了用​​于训练我的分类器的特征:一个。将字符图像下采样到

python - 如何使用 OCR 从低分辨率图像中获得更好/准确的结果

我使用pytesseract在python中编写了一个脚本,以将文本嵌入到图像中。当我运行我的脚本时,抓取工具的工作很奇怪,这意味着我得到的结果文本与图像中的完全不同。我试过的脚本:importrequests,io,pytesseractfromPILimportImageresponse=requests.get('http://skoleadresser.no/4DCGI/WC_Pedlex_Adresse/864928.jpg')img=Image.open(io.BytesIO(response.content))imagetext=pytesseract.image_to_

python - Python 中 Tesseract OCR 的 UnicodeDecodeError

我正在尝试使用Python中的TesseractOCR从图像文件中提取文本,但我遇到了一个错误,我可以弄清楚如何处理它。我所有的环境都很好,因为我在python中使用ocr测试了一些示例图像!这是代码fromPILimportImageimportpytesseractstrs=pytesseract.image_to_string(Image.open('binarized_image.png'))print(strs)以下是我从eclipse控制台得到的错误strs=pytesseract.image_to_string(Image.open('binarized_body.png

python - Google Vision OCR 坐标值不完整

我有一个脚本可以遍历不同形式的图像。在解析GoogleVision文本检测响应时,我使用每个文本项的“boundingPoly”中的XY坐标来专门查找表单不同部分的数据。我遇到的问题是某些响应仅返回X坐标。示例:{u'description':u'sometext',u'boundingPoly':{u'vertices':[{u'x':5595},{u'x':5717},{u'y':122,u'x':5717},{u'y':122,u'x':5595}我已经设置了一个try/except(使用python2.7)来捕获这个问题,但它总是同一个问题:KeyError:'y'。我正在遍历

python - 使用什么库从图像中提取文本 (OCR)?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是偏离主题的,因为它们往往会吸引自以为是的答案和垃圾邮件。相反,describetheproblem以及迄今为止为解决该问题所做的工作。关闭9年前。Improvethisquestion我需要识别图像中的文本(OCR)。我可以在Python中使用什么库从图像中提取文本?

python - Pytesseract : "TesseractNotFound Error: tesseract is not installed or it' s not in your path", 我该如何解决这个问题?

我正在尝试在python中运行一个基本且非常简单的代码。fromPILimportImageimportpytesseractim=Image.open("sample1.jpg")text=pytesseract.image_to_string(im,lang='eng')print(text)这就是它的样子,我实际上已经通过安装程序安装了tesseractforwindows。我是Python的新手,我不确定如何继续?此处的任何指导都会非常有帮助。我试过重新启动我的Spyder应用程序但无济于事。 最佳答案 我看到步骤分散在不同

python - tesseract 的 OCR 结果高度不一致

这是原始屏幕截图,我将图像裁剪成4部分并尽可能清除图像的背景,但tesseract仅检测此处的最后一列并忽略其余部分。tesseract的输出显示为存在我在处理结果时删除的空格Femme—Fatale.DaRkLoRdEIaaChineseN1gg4Noob_Diablo_tesseract的输出显示为存在我在处理结果时删除的空格Kicked.NosNoelChikiZDDeath_Eag|e_42Chai—.3579101714829623O7101221422799220513678821271986307564048841540406O8080我只是转储的输出result=`py

python - 屏幕截图中低分辨率文本的 OCR

我正在编写一个OCR应用程序来从屏幕截图图像中读取字符。目前,我只关注数字。我的方法部分基于这篇博文:http://blog.damiles.com/2008/11/basic-ocr-in-opencv/.我可以使用一些巧妙的阈值来成功提取每个单独的字符。事情变得有点棘手的地方是匹配角色。即使使用固定的字体和大小,背景颜色和字距调整等一些变量也会导致相同的数字以略微不同的形状出现。例如,下图被分割成3个部分:Top:我从截图中成功提取的目标数字中间:模板:我训练集中的一个数字底部:顶部和中间图像之间的误差(绝对差值)部分已经全部缩放(两条绿色水平线之间的距离代表一个像素)。您可以看到

Python Tesseract 无法识别此字体

我有这张图片:我想使用python将其读取为字符串,我认为这并不难。我遇到了tesseract,然后是使用tesseract的python脚本包装器。所以我开始阅读图像,在我尝试阅读这幅图像之前效果很好。我是否必须训练它来阅读特定的字体?关于特定字体是什么的任何想法?或者是否有更好的ocr引擎我可以与python一起使用来完成这项工作。编辑:也许我可以围绕数字制作某种矢量,然后以更大的尺寸重新绘制它们?图像越大,tesseractocr似乎越能读取它们(毫不奇怪,哈哈)。 最佳答案 只需为10位数字和一个“.”训练引擎.应该这样做。

python - OCR 扑克牌

关闭。这个问题需要更多focused.它目前不接受答案。想改进这个问题吗?更新问题,使其只关注一个问题editingthispost.关闭3年前。Improvethisquestion我决定做一个有趣的项目,我想将扑克牌的图像作为输入并返回其等级和花色。我想我只需要看左上角,因为那里有所有信息。它应该是稳健的-如果我有一张方片A的大图像,我应该能够将它缩放到20%到200%的任何地方,并且仍然能得到正确的答案。第一个问题-是否有任何已经编写的内容可以做到这一点?如果是这样,我会找到OCR的其他东西,这样我就不会重复工作。其次-执行此操作的最佳方法是什么?神经网络?手工编码的东西?任何人