草庐IT

LaTeX-OCR

全部标签

python - 如何使用 Sphinx 更改 LaTeX PDF 输出中的代码示例字体大小?

我发现Sphinx生成的PDF中的默认代码示例字体太大。我尝试在生成的.tex文件中亲自动手,在代码块上方插入字体大小命令,如\tiny,但这只会使代码块上方的行变小,而不是代码块本身。我不确定还能做什么-我是LaTeX的初学者。 最佳答案 我解决了。Pygments使用\begin{Verbatim}block来表示代码片段,它使用fancyvrb包。documentationIfound(warning:PDF)提到verbatimblock的formatcom选项。Pygments'latexwritersource表示一个实

python - 如何清理 LaTeX 输入?

我想接受用户输入(有时这将是大段)并生成一个LaTeX文档。我正在考虑用\textbackslash替换\的所有实例和{或}的所有实例的几个简单的正则表达式与\}或\{。我怀疑这是否足够。我还需要做什么?注意:如果有为此制作的特殊库,我使用的是python。澄清一下,我不希望任何被解析为LaTeX语法的东西:$a$应该替换为\$a\$。 最佳答案 如果您的输入是纯文本并且您处于正常的catcode机制中,则必须执行以下替换:\→\textbackslash{}(注意空组!){→\{}→\}$→\$&→\&#→\#^→\textasc

python OCR : ignore signatures in documents

我正在尝试对其中包含手写签名的扫描文档进行OCR。请参见下图。我的问题很简单,有没有办法在忽略签名的情况下仍然使用OCR提取人员的姓名?当我运行TesseractOCR时,它无法检索名称。我尝试使用下面的代码进行灰度/模糊/阈值处理,但没有成功。有什么建议吗?image=cv2.imread(file_path)image=cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)image=cv2.GaussianBlur(image,(5,5),0)image=cv2.threshold(image,0,255,cv2.THRESH_BINARY_INV|cv2.

OCR之Tesseract安装

Tesseract安装一、Tesseract下载二、添加环境变量三、配置Tesseract中文识别语言包四、下载相关库五、示例程序1.待识别图片2.识别程序3.识别结果Tesseract是常用的开源OCR识别引擎,后续的图片文字识别项目我们将会调用该库进行识别,本文针对Tesseract的安装配置进行相关说明。一、Tesseract下载下载地址:Tesseract选择最新的版本进行下载,下载完成后,解压安装在自己设定的安装路径,一直选择next即可完成安装。二、添加环境变量打开系统属性页面,然后点击高级,最后选择环境变量。在环境变量页面,将Tesseract安装路径添加到用户变量和系统变量的P

python - Matplotlib 错误 : LaTeX was not able to process the following string: 'lp'

这是我从底部提供的函数中得到的错误:'latex'isnotrecognizedasaninternalorexternalcommand,operableprogramorbatchfile.ExceptioninTkintercallbackTraceback(mostrecentcalllast):File"C:\python27\lib\lib-tk\Tkinter.py",line1486,in__call__returnself.func(*args)File"C:\python27\lib\site-packages\matplotlib\backends\backend

python - OCR应用前图像清洗

过去几个小时我一直在试验PyTesser,它是一个非常好的工具。关于PyTesser的准确性,我注意到几件事:包含图标、图片和文本的文件-5-10%的准确度只有文本的文件(图像和图标已删除)-50-60%准确拉伸(stretch)文件(这是最好的部分)-拉伸(stretch)文件在2)以上的x或y轴上,精度提高了10-20%很明显,Pytesser不处理字体尺寸或图像拉伸(stretch)。尽管有很多关于图像处理和OCR的理论需要阅读,但在应用PyTesser或其他库之前,是否有任何标准的图像清理程序(除了删除图标和图像)需要完成,无论语言如何?......哇,这篇文章现在已经很老了。

python - OCR应用前图像清洗

过去几个小时我一直在试验PyTesser,它是一个非常好的工具。关于PyTesser的准确性,我注意到几件事:包含图标、图片和文本的文件-5-10%的准确度只有文本的文件(图像和图标已删除)-50-60%准确拉伸(stretch)文件(这是最好的部分)-拉伸(stretch)文件在2)以上的x或y轴上,精度提高了10-20%很明显,Pytesser不处理字体尺寸或图像拉伸(stretch)。尽管有很多关于图像处理和OCR的理论需要阅读,但在应用PyTesser或其他库之前,是否有任何标准的图像清理程序(除了删除图标和图像)需要完成,无论语言如何?......哇,这篇文章现在已经很老了。

python - 通过 virtualenv 在 AWS Lambda 上进行 Tesseract OCR

我整个星期都在尝试这个,所以这有点像冰雹玛丽。我正在尝试将TesseractOCR打包到运行在Python上的AWSLambda中(我还使用PILLOW进行图像预处理,因此选择了Python)。我了解如何使用virtualenv将Python包部署到AWS,但是我似乎找不到将实际的TesseractOCR部署到环境中的方法(例如/env/)执行pipinstallpy-tesseract可以将python包装器成功部署到/env/,但这依赖于单独(本地)安装Tesseract执行pipinstalltesseract-ocr只让我在一定距离内出错,如下所示,我假设这是由于缺少lepto

python - 通过 virtualenv 在 AWS Lambda 上进行 Tesseract OCR

我整个星期都在尝试这个,所以这有点像冰雹玛丽。我正在尝试将TesseractOCR打包到运行在Python上的AWSLambda中(我还使用PILLOW进行图像预处理,因此选择了Python)。我了解如何使用virtualenv将Python包部署到AWS,但是我似乎找不到将实际的TesseractOCR部署到环境中的方法(例如/env/)执行pipinstallpy-tesseract可以将python包装器成功部署到/env/,但这依赖于单独(本地)安装Tesseract执行pipinstalltesseract-ocr只让我在一定距离内出错,如下所示,我假设这是由于缺少lepto

python - Google Cloud Vision - 数字和数字 OCR

我一直在尝试使用Python实现一个OCR程序,该程序读取具有特定格式XXX-XXX的数字。我使用了Google的CloudVisionAPI文本识别,但结果并不可靠。在30张高对比度1280x1024bmp图像中,只有少数图像输出正确,或者至少在结果中包含了正确的输出。该程序往往会省略一些数字、以非英语语言输出或潜入一些特殊字符。目标是至少连续输出正确的数字,如果结果中散布着其他垃圾也没关系。有没有办法帮助程序更好地识别数字,例如将结果限制为特定格式,或仅限于数字? 最佳答案 我无法告诉你为什么会这样,也许这与语言的阅读方式有关,