草庐IT

python - Google Vision OCR 坐标值不完整

我有一个脚本可以遍历不同形式的图像。在解析GoogleVision文本检测响应时,我使用每个文本项的“boundingPoly”中的XY坐标来专门查找表单不同部分的数据。我遇到的问题是某些响应仅返回X坐标。示例:{u'description':u'sometext',u'boundingPoly':{u'vertices':[{u'x':5595},{u'x':5717},{u'y':122,u'x':5717},{u'y':122,u'x':5595}我已经设置了一个try/except(使用python2.7)来捕获这个问题,但它总是同一个问题:KeyError:'y'。我正在遍历

python - 使用什么库从图像中提取文本 (OCR)?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是偏离主题的,因为它们往往会吸引自以为是的答案和垃圾邮件。相反,describetheproblem以及迄今为止为解决该问题所做的工作。关闭9年前。Improvethisquestion我需要识别图像中的文本(OCR)。我可以在Python中使用什么库从图像中提取文本?

python - tesseract 的 OCR 结果高度不一致

这是原始屏幕截图,我将图像裁剪成4部分并尽可能清除图像的背景,但tesseract仅检测此处的最后一列并忽略其余部分。tesseract的输出显示为存在我在处理结果时删除的空格Femme—Fatale.DaRkLoRdEIaaChineseN1gg4Noob_Diablo_tesseract的输出显示为存在我在处理结果时删除的空格Kicked.NosNoelChikiZDDeath_Eag|e_42Chai—.3579101714829623O7101221422799220513678821271986307564048841540406O8080我只是转储的输出result=`py

python - 屏幕截图中低分辨率文本的 OCR

我正在编写一个OCR应用程序来从屏幕截图图像中读取字符。目前,我只关注数字。我的方法部分基于这篇博文:http://blog.damiles.com/2008/11/basic-ocr-in-opencv/.我可以使用一些巧妙的阈值来成功提取每个单独的字符。事情变得有点棘手的地方是匹配角色。即使使用固定的字体和大小,背景颜色和字距调整等一些变量也会导致相同的数字以略微不同的形状出现。例如,下图被分割成3个部分:Top:我从截图中成功提取的目标数字中间:模板:我训练集中的一个数字底部:顶部和中间图像之间的误差(绝对差值)部分已经全部缩放(两条绿色水平线之间的距离代表一个像素)。您可以看到

python - OCR 扑克牌

关闭。这个问题需要更多focused.它目前不接受答案。想改进这个问题吗?更新问题,使其只关注一个问题editingthispost.关闭3年前。Improvethisquestion我决定做一个有趣的项目,我想将扑克牌的图像作为输入并返回其等级和花色。我想我只需要看左上角,因为那里有所有信息。它应该是稳健的-如果我有一张方片A的大图像,我应该能够将它缩放到20%到200%的任何地方,并且仍然能得到正确的答案。第一个问题-是否有任何已经编写的内容可以做到这一点?如果是这样,我会找到OCR的其他东西,这样我就不会重复工作。其次-执行此操作的最佳方法是什么?神经网络?手工编码的东西?任何人

OCR识别身份证及营业执照图片(Java版)

本文基于百度智能云平台提供的OCR识别技术,对身份证图片及营业执照图片识别处理。可以说是全网最详尽可用的教程,希望慢慢食用!准备工作1.百度智能云官网:百度AI开放平台-全球领先的人工智能服务平台需注册账号,申请开通应程序,目的是为了得到APIkey(注册应用获取)和SecretKey(注册应用获取)2.百度智能云JavaSDK:GitHub-Baidu-AIP/java-sdk:百度AI开放平台JavaSDK用到里面获取accessToken的接口方法(已可以自己写)一些用到的SDKcom.baidu.aipjava-sdk4.8.0commons-iocommons-io2.6com.al

OCR识别身份证及营业执照图片(Java版)

本文基于百度智能云平台提供的OCR识别技术,对身份证图片及营业执照图片识别处理。可以说是全网最详尽可用的教程,希望慢慢食用!准备工作1.百度智能云官网:百度AI开放平台-全球领先的人工智能服务平台需注册账号,申请开通应程序,目的是为了得到APIkey(注册应用获取)和SecretKey(注册应用获取)2.百度智能云JavaSDK:GitHub-Baidu-AIP/java-sdk:百度AI开放平台JavaSDK用到里面获取accessToken的接口方法(已可以自己写)一些用到的SDKcom.baidu.aipjava-sdk4.8.0commons-iocommons-io2.6com.al

Python OCR库或手写字符识别引擎

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭4年前。Improvethisquestion能否推荐一些用于OCR和手写字符识别的python库或源代码?

python-tesseract OCR : get digits only

我正在使用带有python-tesseract的tesseractOCR。在tesseractFAQ中,关于数字,我们有:UseTessBaseAPI::SetVariable("tessedit_char_whitelist","0123456789");BEFOREcallinganInitfunctionorputthisinatextfilecalledtessdata/configs/digits:tessedit_char_whitelist0123456789andthenyourcommandlinebecomes:tesseractimage.tifoutputbas

Python + OpenCV : OCR Image Segmentation

我正在尝试根据收据的这个玩具示例进行OCR。使用Python2.7和OpenCV3.1。灰度+模糊+外部边缘检测+收据中每个区域的分割(例如“类别”以稍后查看哪个标记-在本例中为现金-)。当图像“倾斜”以便能够正确转换然后“自动”分割收据的每个部分时,我觉得很复杂。例子:有什么建议吗?下面的代码是在边缘检测之前获取的示例,但是当收据像第一张图像时。我的问题不是图像到文本。是图像的预处理。非常感谢任何帮助!:)importos;os.chdir()#Putyourowndirectoryimportcv2importnumpyasnpimage=cv2.imread("Rent-Rece