草庐IT

LaTeX-OCR

全部标签

python - 将 LaTex 公式转换为可以在 SymPy 中使用的类型

我想解析LaTeX公式并直接将它们用作SymPy表达式。换句话说,我需要的是类似于sympify的东西:fromsympyimportsympifyf=sympify('x^2+sin(y)+1/2')printf但可以将LaTeX表达式(字符串)作为输入,例如:f=latex_sympify('\frac{x}{1+x}')鉴于sympify能够将带有正则数学表达式的字符串转换为SymPy对象,如果有任何东西可以将LaTeX转换为正则数学表达式,我想这可以解决问题---但我更喜欢在Python中做所有事情。任何建议将不胜感激。 最佳答案

python - 使用 Python 将 latex 代码转换为图像(或其他可显示格式)

我有一个正在使用的函数,它返回一串latex代码。我需要从中生成图像。我见过的大多数这样做的方法都建议通过subprocess模块调用外部应用程序,该模块将为我生成图像。但是,管理层对此并不热衷,因为除了我们自己的软件之外,它还需要外部用户安装额外的软件,就我们的用户群而言,我们认为这不是一项简单的任务。那么是否有任何python库可以完成将latex转换为可在GUI中显示的格式(例如图像文件)的任务? 最佳答案 SymPy具有执行此操作的内置预览功能。expr=sin(sqrt(x**2+20))+1preview(expr,vi

python - python上的 latex :\alpha and\beta don't work?

我正在使用matplotlib生成一些图形,并且我正在使用latex作为图例。更具体地说,我正在尝试使用这样的东西:loglog(x,x,'-r',label='$\alpha$')legend()show()但是,此代码在图上没有显示图例,并且在我关闭图像后出现错误。我正在使用enthought包(适用于mac),但错误来自pylab/scipy。出现的错误正是:$lpha$(atchar0),(line:1,col:1)但是,如果使用\mu或\gamma,效果很好!我只在\beta和\alpha上发现了这个问题。有人知道这是什么吗?我相信python将"\a"解释为某个字符....

python - 从 PDF 上的 Google Vision API OCR 获取线条和段落,而不是符号

我正在尝试使用GoogleCloudVisionAPI现在支持的PDF/TIFF文档文本检测。使用他们的示例代码,我可以提交PDF并接收带有提取文本的JSON对象。我的问题是保存到GCS的JSON文件仅包含边界框和“符号”文本,即每个单词中的每个字符。这使得JSON对象非常笨重且难以使用。我希望能够获取“LINES”、“PARAGRAPHS”和“BLOCKS”的文本和边界框,但我似乎无法通过AsyncAnnotateFileRequest()方法。示例代码如下:defasync_detect_document(gcs_source_uri,gcs_destination_uri):""

Linux中的Python OCR模块?

我想在linux中找一个好用的OCRpython模块,我找到了pytesserhttp://code.google.com/p/pytesser/,但它包含一个.exe可执行文件。我尝试将代码更改为使用wine,它确实有效,但它太慢了,真的不是一个好主意。有没有像它一样易于使用的Linux替代品? 最佳答案 您可以将tesseract包装在一个函数中:importosimporttempfileimportsubprocessdefocr(path):temp=tempfile.NamedTemporaryFile(delete=F

python - 使用 pytesseract OCR 识别图像中的文本

我需要使用Pytesseract从这张图片中提取文字:和代码:fromPILimportImage,ImageEnhance,ImageFilterimportpytesseractpath='pic.gif'img=Image.open(path)img=img.convert('RGBA')pix=img.load()foryinrange(img.size[1]):forxinrange(img.size[0]):ifpix[x,y][0]而“temp.jpg”是还不错,但是打印的结果是,2WW不是正确的文本2HHH,那我怎样才能去除那些黑点呢? 最佳

python - matplotlib 中使用 latex 的无衬线数学

以下脚本:importmatplotlibmatplotlib.use('Agg')importmatplotlib.pyplotasmplmpl.rc('font',family='sans-serif')mpl.rc('text',usetex=True)fig=mpl.figure()ax=fig.add_subplot(1,1,1)ax.text(0.2,0.5,r"Mathfont:$451^\circ$")ax.text(0.2,0.7,r"Normalfont(exceptfordegreesymbol):451$^\circ$")fig.savefig('test.pn

python - 将 Python 数值表达式转换为 LaTeX

我需要使用有效的Python语法转换字符串,例如:'1+2**(x+y)'并获得等效的LaTeX:$1+2^{x+y}$我尝试过SymPy的latex函数,但它处理的是实际表达式,而不是它的字符串形式:>>>latex(1+2**(x+y))'$1+2^{x+y}$'>>>latex('1+2**(x+y)')'$1+2**(x+y)$'但要做到这一点,它需要将x和y声明为“符号”类型。我想要一些更直接的东西,最好是使用编译器模块中的解析器。>>>compiler.parse('1+2**(x+y)')Module(None,Stmt([Discard(Add((Const(1),Po

python - 我自己的 Python OCR 程序

我还是个初学者,但我想写一个字符识别程序。这个程序还没有准备好。而且我编辑了很多,因此评论可能不完全匹配。我将使用8-connectivity进行连接组件标记。fromPILimportImageimportnumpyasnpim=Image.open("D:\\Python26\\PYTHON-PROGRAMME\\bild_schrift.jpg")w,h=im.sizew=int(w)h=int(h)#2D-Arrayforareaarea=[]forxinrange(w):area.append([])foryinrange(h):area[x].append(2)#numbe

python - 使用 python 脚本生成 pdf-latex

我是一名大学生,在我的大学里,要提交任何类型的作业,都必须有一个标准的封面(带有大学Logo、类(class)名称、教授姓名、我的名字和blablabla)。所以,我有一个.tex文档,它生成我的标准封面pdf。它是这样的:...\begin{document}%%Collegelogo\vspace{5cm}\begin{center}\textbf{\huge"SchoolandProgramName"\\}\vspace{1cm}\textbf{\Large"HomeworkTitle"\\}\vspace{1cm}\textbf{\Large"CourseName"\\}\en