草庐IT

LaTeX-OCR

全部标签

python - Matplotlib 原始 latex "\epsilon"仅产生 "\varepsilon"

我正在使用Matplotlib来分析结果和生成图表。我需要图例和轴标签中的希腊符号,包括$\epsilon$。然而,生成的文本不区分“正常”\epsilon和\varepsilon---它们都显示为\varepsilon。这是一个最小的例子:importnumpyasnpfrompylabimport*importmatplotlib.pyplotaspltt=np.arange(0.0,1.0+0.01,0.01)s=np.cos(4*np.pi*t)+2fig=plt.figure()ax=fig.add_subplot(1,1,1)ax.plot(t,s,'k-',linewid

python - 如何使用 matplotlib 的 LaTeX 格式化程序格式化 float ?

我的python脚本中有一个数字,我想将其用作matplotlib绘图标题的一部分。是否有将float转换为格式化的TeX字符串的函数?基本上,str(myFloat)返回3.5e+20但是我想要$3.5\times10^{20}$或者至少让matplotlib像格式化第二个字符串一样格式化float。我也坚持使用python2.4,因此特别感谢在旧版本中运行的代码。 最佳答案 使用旧的stype格式:printr'$%s\times10^{%s}$'%tuple('3.5e+20'.split('e+'))采用新格式:printr

python - OOWrite 对于 LaTeX 就像 OODraw 一样?

我正在寻找一种工具来很好地生成单页PDF。我的需求是:能够将PDF/EPS/...作为背景绝对定位能够定义表格、列表能够旋转积木相当简单的语法(将用于自动生成许多外观相似的文档)可从Python轻松使用免费或非常便宜本质上,我正在寻找用于OODraw/CorelDraw/...的工具X,就像LaTeX用于OOWrite/MSWord一样。我看过webkit2pdf和headlessOODraw,但两者似乎都有些矫枉过正。XML-FO有一些局限性,例如无法预测您的文档跨越了多少页。Reportlab很贵。有什么想法吗?谢谢! 最佳答案

python - 为什么 matplotlib 在 latex 表达式中用 "!"替换右括号?

我的情况是我必须为最终用户将python表达式转换为Latex位图(他们有足够的信心自己编写python函数,但更喜欢在Latex中观看结果)。我正在使用Matplotlib.mathtext使用以下代码完成这项工作(来自翻译的latex原始字符串)。importwximportwx.lib.scrolledpanelasscrolledimportmatplotlibasmplfrommatplotlibimportcmfrommatplotlibimportmathtextclassLatexBitmapFactory():"""LatexExpressiontoBitmap"""

python - 为 OCR 对齐文本

我正在根据历史记录创建一个数据库,这些记录是我从书中拍摄的页面(+100K页)。在对每个页面进行OCR之前,我编写了一些python代码来进行一些图像处理。由于这些书中的数据没有以格式良好的表格形式出现,我需要将每一页分成行和列,然后分别对每一部分进行OCR。其中一个关键步骤是对齐图像中的文本。例如,这是一个需要对齐的典型页面:我找到的一个解决方案是水平涂抹文本(我使用的是skimage.ndimage.morphology.binary_dilation)并找到使水平维度上的白色像素总和最大化的旋转。这工作正常,但每页大约需要8秒,考虑到我正在处理的页面量,这太多了。您是否知道更好、

python - pandas 在 to_latex 时用任意数字替换 NAN

我有一个大型多索引多列数据框df,我没有在这里展示。我像这样生成一片索引:subDf=df.sort_index(level=0).loc[:'e']然后该切片在索引的第二层包含NaN:>>>subDf.iloc[0:1]changerobustnessvaluebaselineNaN-14.5to_csv()生成的csv似乎是正确的:>>>subDf.iloc[0:1].to_csv()Out[15]:'robustness,value,change\nbaseline,,-14.5\n'同样,to_html()的功能与预期的一样。但是,当我尝试获取latex_output时,NaN

python - Sphinx 文档处理器扩展对 HTML 和 LaTeX 输出的工作方式不同?

我有一个简单的Sphinx扩展如下:fromdocutilsimportnodesfromdocutils.parsers.rstimportdirectivesfromsphinx.util.compatimportDirectiveclasstestnode(nodes.Element):def__init__(self,*args,**kwargs):super(testnode,self).__init__(*args,**kwargs)self['foo']='?'defvisit_testnode_latex(self,node):self.body.append('Tes

python - 使用 Python 代码片段编写 LaTeX 文档

我正在使用LaTeX编写有关Python的文档。本文档将包含代码片段(示例)。我可以使用verbatim环境,但在开始使用它之前,我想知道您是否知道任何为Python代码提供环境的LaTeX样式文件。语法高亮会更好。谢谢。编辑:我必须指出minted包正是我要找的。它有漂亮的语法高亮显示,而且使用起来非常简单。检查thisquestion了解更多。 最佳答案 看看这个问题SourcecodehighlightinginLaTeX获取更多信息。您还应该查看pygments源代码高亮显示程序。我个人将Emacsorg-mode与#+BE

python - 将 Pandas 中的各个列对齐到_latex

我正在使用pandasto_latex方法将数据帧转换为Latextabular。我没有看到更改生成的表格的对齐字段的选项。例如,我有一个如下所示的数据框:In[46]:dfOut[46]:NumberofdaysTuplesDistinctTuples16229700587413001632049759929302164153655992138216510256903149161665127647744116725425431171681269871288我的输出表如下所示:In[50]:printdf.to_latex(index=None)\begin{tabular}{lll}

python - 从 OCR 文本中提取分段符?

我正在尝试从OCR图像文本的输出中重新创建段落和缩进,如下所示:输入(想象这是一张图片,不是打字的):输出(有一些错误):如您所见,没有保留段落分隔符或缩进。使用Python,我尝试了这样的方法,但它不起作用(经常失败):代码:defsmart_format(text):textList=text.split('\n')temp=''averageLL=sum([len(line)forlineintextList])/len(textList)forlineintextList:if(line.strip().endswith('!')orline.strip().endswith(