草庐IT

$Umi-OCR

全部标签

ios - 改进 Tesseract OCR 中的预处理步骤以进行实时捕获

我正在使用Tesseract库读取身份证信息。我试过使用一些Googleimages并得到了很好的结果,但是当我转到实时图像时,即从iPhone相机捕获图像时,我没有得到好的结果。我发现了Tesseract建议的一些预处理步骤。1。修复DPI(如果需要)最低300DPI。从iPhone相机实时捕获图像时,如何设置图像的DPI?2。修复文本大小(例如12pt应该没问题)。如何修复iPhone相机创建的大图像的文本大小?3。尝试修复文本行(去歪斜和去扭曲文本)。我读到Tesseract使用Leptonica库应用去扭曲文本。在此预处理阶段文本是否需要去扭曲或去扭曲?4。尝试修复图像的照明(

android - android中最好的OCR(光学字符识别)示例

已结束。此问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是无关紧要的,因为它们往往会吸引固执己见的答案和垃圾邮件。相反,describetheproblem以及到目前为止为解决这个问题所做的工作。关闭9年前。Improvethisquestion我想要一个在android中运行OCR的示例,我做了一些研究并找到了一个在android中实现OCR的示例。https://github.com/rmtheis/tess-two其中有三个项目文件...两只眼睛苔丝二tess-two

android - android中最好的OCR(光学字符识别)示例

已结束。此问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是无关紧要的,因为它们往往会吸引固执己见的答案和垃圾邮件。相反,describetheproblem以及到目前为止为解决这个问题所做的工作。关闭9年前。Improvethisquestion我想要一个在android中运行OCR的示例,我做了一些研究并找到了一个在android中实现OCR的示例。https://github.com/rmtheis/tess-two其中有三个项目文件...两只眼睛苔丝二tess-two

java - Android:如何提高 tesseract ocr 检索到的图像中的数字?

我制作了一个简单的应用程序,可以读取图像并将数字图像检索为带有android的文本。但问题是准确率只有60%左右,而且还会出现一些不需要的噪音。我确实认为准确率不可能达到100%,但是,我相信一定有办法改进它。但是,由于我是业余爱好者,所以我觉得很难。我在谷歌周围搜索过,但无法获得可靠的信息。我想从如下图所示的东方幸运票中读取数字596、00和012345。 最佳答案 Tesseract-ocr最适合满足以下条件的字符图像:输入图像至少要有300dpi输入图像应该是黑白的输入图像中应该有最小的噪声(即文本应该与背景清楚地区分)文本行

java - 使用安卓相机的简单 OCR 应用程序

这个问题在这里已经有了答案:关闭10年前。PossibleDuplicate:androidOCR?我希望你构建一个应用程序,该应用程序具有使用相机的OCR扫描仪,并检测纸张中的文本并将其转换为常规文本。一个简单的程序。我该怎么做?最简单的方法是什么?

java - OCR算法改进

我正在创建基于Java的OCR。我的目标是从视频文件中提取文本(后处理)。要找到完全在Java上运行的免费开源OCR,这是一项艰巨的搜索工作。我发现Tess4J是唯一受欢迎的选择,但考虑到对native接口(interface)的需求,我不知何故倾向于从头开发算法。我需要创建一个可靠的OCR,以合理的准确度正确识别英文字母(仅计算机化字体,而不是手写文本),前提是文本在视频帧中的区域是预定义的。我们也可以假设文本的颜色是给定的。到目前为止我做了什么:(所有图像处理都使用openCV的Java绑定(bind)完成)我使用以下方法提取了用​​于训练我的分类器的特征:一个。将字符图像下采样到

python - 如何使用 OCR 从低分辨率图像中获得更好/准确的结果

我使用pytesseract在python中编写了一个脚本,以将文本嵌入到图像中。当我运行我的脚本时,抓取工具的工作很奇怪,这意味着我得到的结果文本与图像中的完全不同。我试过的脚本:importrequests,io,pytesseractfromPILimportImageresponse=requests.get('http://skoleadresser.no/4DCGI/WC_Pedlex_Adresse/864928.jpg')img=Image.open(io.BytesIO(response.content))imagetext=pytesseract.image_to_

python - Python 中 Tesseract OCR 的 UnicodeDecodeError

我正在尝试使用Python中的TesseractOCR从图像文件中提取文本,但我遇到了一个错误,我可以弄清楚如何处理它。我所有的环境都很好,因为我在python中使用ocr测试了一些示例图像!这是代码fromPILimportImageimportpytesseractstrs=pytesseract.image_to_string(Image.open('binarized_image.png'))print(strs)以下是我从eclipse控制台得到的错误strs=pytesseract.image_to_string(Image.open('binarized_body.png

python - Google Vision OCR 坐标值不完整

我有一个脚本可以遍历不同形式的图像。在解析GoogleVision文本检测响应时,我使用每个文本项的“boundingPoly”中的XY坐标来专门查找表单不同部分的数据。我遇到的问题是某些响应仅返回X坐标。示例:{u'description':u'sometext',u'boundingPoly':{u'vertices':[{u'x':5595},{u'x':5717},{u'y':122,u'x':5717},{u'y':122,u'x':5595}我已经设置了一个try/except(使用python2.7)来捕获这个问题,但它总是同一个问题:KeyError:'y'。我正在遍历

python - 使用什么库从图像中提取文本 (OCR)?

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是偏离主题的,因为它们往往会吸引自以为是的答案和垃圾邮件。相反,describetheproblem以及迄今为止为解决该问题所做的工作。关闭9年前。Improvethisquestion我需要识别图像中的文本(OCR)。我可以在Python中使用什么库从图像中提取文本?