OCR

c++ - Tesseract 或任何其他 OCR 库

我正在寻找有关如何在C++中使用(和训练？)Tesseract的解释/API文档/示例，在googleTesseract页面上没有任何有用的信息，但尚未在网上找到一些东西。任何有用的资源和经验都将非常受欢迎，因为我不知道如何开始。附言:我愿意听取关于其他方面的建议图书馆。仅免费库最佳答案我对Tesseract有一些经验...一个简单的“训练tesseract”谷歌显示了这个页面:http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract您必须在其中选择要训练的tes

c++ - Tessaract OCR 是否使用神经网络作为其默认训练机制

抱歉，这可能是个愚蠢的问题。但我对机器学习和TessaractOCR还很陌生。我听说TessaractOCR可以训练。我需要知道的是TessaractOCR是否使用神经网络作为它们的默认训练机制，或者我们是否必须对其进行显式编程才能使用神经网络？抱歉，如果我对这个“培训”概念有错误的想法。但我需要确切知道的是Tessaract是否已经在使用NN，或者如果没有，我如何使用NN和tessaractOCR来提高识别准确性？如果有人可以向我推荐一些好的资源/方法来引用/尝试并开始使用，这也会有很大的帮助。我目前对基native器学习监督训练概念以及在TessaractOCR中执行基本图像OCR

amp Tessaract section 自适 c++machine-learning neural-network tesseract

ios - 改进 Tesseract OCR 中的预处理步骤以进行实时捕获

我正在使用Tesseract库读取身份证信息。我试过使用一些Googleimages并得到了很好的结果，但是当我转到实时图像时，即从iPhone相机捕获图像时，我没有得到好的结果。我发现了Tesseract建议的一些预处理步骤。1。修复DPI(如果需要)最低300DPI。从iPhone相机实时捕获图像时，如何设置图像的DPI？2。修复文本大小(例如12pt应该没问题)。如何修复iPhone相机创建的大图像的文本大小？3。尝试修复文本行(去歪斜和去扭曲文本)。我读到Tesseract使用Leptonica库应用去扭曲文本。在此预处理阶段文本是否需要去扭曲或去扭曲？4。尝试修复图像的照明(

Tesseract 改进 section li ios ocr

android - android中最好的OCR(光学字符识别)示例

已结束。此问题不符合StackOverflowguidelines.它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于StackOverflow来说是无关紧要的，因为它们往往会吸引固执己见的答案和垃圾邮件。相反，describetheproblem以及到目前为止为解决这个问题所做的工作。关闭9年前。Improvethisquestion我想要一个在android中运行OCR的示例，我做了一些研究并找到了一个在android中实现OCR的示例。https://github.com/rmtheis/tess-two其中有三个项目文件...两只眼睛苔丝二tess-two

android OCR section strong tesseract

android - android中最好的OCR(光学字符识别)示例

android OCR section strong tesseract

java - Android:如何提高 tesseract ocr 检索到的图像中的数字？

我制作了一个简单的应用程序，可以读取图像并将数字图像检索为带有android的文本。但问题是准确率只有60%左右，而且还会出现一些不需要的噪音。我确实认为准确率不可能达到100%，但是，我相信一定有办法改进它。但是，由于我是业余爱好者，所以我觉得很难。我在谷歌周围搜索过，但无法获得可靠的信息。我想从如下图所示的东方幸运票中读取数字596、00和012345。最佳答案 Tesseract-ocr最适合满足以下条件的字符图像:输入图像至少要有300dpi输入图像应该是黑白的输入图像中应该有最小的噪声(即文本应该与背景清楚地区分)文本行

tesseract Android section 的 java ocr

java - 使用安卓相机的简单 OCR 应用程序

这个问题在这里已经有了答案:关闭10年前。PossibleDuplicate:androidOCR?我希望你构建一个应用程序，该应用程序具有使用相机的OCR扫描仪，并检测纸张中的文本并将其转换为常规文本。一个简单的程序。我该怎么做？最简单的方法是什么？

java OCR section notice blockquote android

java - OCR算法改进

我正在创建基于Java的OCR。我的目标是从视频文件中提取文本(后处理)。要找到完全在Java上运行的免费开源OCR，这是一项艰巨的搜索工作。我发现Tess4J是唯一受欢迎的选择，但考虑到对native接口(interface)的需求，我不知何故倾向于从头开发算法。我需要创建一个可靠的OCR，以合理的准确度正确识别英文字母(仅计算机化字体，而不是手写文本)，前提是文本在视频帧中的区域是预定义的。我们也可以假设文本的颜色是给定的。到目前为止我做了什么:(所有图像处理都使用openCV的Java绑定(bind)完成)我使用以下方法提取了用于训练我的分类器的特征:一个。将字符图像下采样到

改进 java section solutions strong opencv ocr knn neural-network

python - 如何使用 OCR 从低分辨率图像中获得更好/准确的结果

我使用pytesseract在python中编写了一个脚本，以将文本嵌入到图像中。当我运行我的脚本时，抓取工具的工作很奇怪，这意味着我得到的结果文本与图像中的完全不同。我试过的脚本:importrequests,io,pytesseractfromPILimportImageresponse=requests.get('http://skoleadresser.no/4DCGI/WC_Pedlex_Adresse/864928.jpg')img=Image.open(io.BytesIO(response.content))imagetext=pytesseract.image_to_

python OCR code img image python-3.x web-scraping tesseract python-tesseract

python - Python 中 Tesseract OCR 的 UnicodeDecodeError

我正在尝试使用Python中的TesseractOCR从图像文件中提取文本，但我遇到了一个错误，我可以弄清楚如何处理它。我所有的环境都很好，因为我在python中使用ocr测试了一些示例图像!这是代码fromPILimportImageimportpytesseractstrs=pytesseract.image_to_string(Image.open('binarized_image.png'))print(strs)以下是我从eclipse控制台得到的错误strs=pytesseract.image_to_string(Image.open('binarized_body.png

UnicodeDecodeError Tesseract pytesseract section open python python-tesseract

32 33 343536 37 38