草庐IT

java - 从活页乐谱中提取每一行的小节

关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭3年前。Improvethisquestion我想知道一种提取单个度量值的方法。我不确定这方面的算法是否已经存在,所以我考虑过从左到右扫描乐谱,从一行小节的上方和下方提取所有空白。我不是在寻找将乐谱转换为MusicXML或提取其他有用信息的方法。不,本质上我正在处理的是一份普通文件。我需要分开段落。我对段落传达的信息不感兴趣,只是将它们与文档的区域分开。在这种情况下,一个段落将是一行措施。我不需要单独的小节,而是每行乐谱上的所有小节。

python - 为 OCR 对齐文本

我正在根据历史记录创建一个数据库,这些记录是我从书中拍摄的页面(+100K页)。在对每个页面进行OCR之前,我编写了一些python代码来进行一些图像处理。由于这些书中的数据没有以格式良好的表格形式出现,我需要将每一页分成行和列,然后分别对每一部分进行OCR。其中一个关键步骤是对齐图像中的文本。例如,这是一个需要对齐的典型页面:我找到的一个解决方案是水平涂抹文本(我使用的是skimage.ndimage.morphology.binary_dilation)并找到使水平维度上的白色像素总和最大化的旋转。这工作正常,但每页大约需要8秒,考虑到我正在处理的页面量,这太多了。您是否知道更好、

java - 如何找到所有基于图像的 PDF?

我的系统中有很多PDF文档,有时我注意到文档是基于图像的,没有编辑功能。在这种情况下,我在FoxitPhantomPDF中进行OCR以更好地搜索,您可以在其中对多个文件进行OCR。我想找到我的所有基于图像的PDF文档。我不明白PDF阅读器如何识别文档的OCR不是文本。这些读者必须访问某些字段。这也可以在终端中访问。这个答案给出了如何在线程CheckifaPDFfileisascannedone中进行的公开建议。:Yourbestbetmightbetochecktoseeifithastextandalsoseeifitcontainsalargepagesizedimageorlot

python - 用python识别文本布局

我正在尝试对数千个扫描文件进行分类,并根据类型将它们分类到文件夹中(即:如果其中一个文件是formA的扫描副本,那么它应该放在formA文件夹中,如果它是扫描的formB的副本,然后它应该放在formB文件夹中,等等...)。我觉得匹配文件和类型的最佳方法是基于它们的文本轮廓,但我对图像处理是全新的,所以如果有更好的解决方案,那么我会洗耳恭听。我在python工作。关于执行此操作的最佳方法的任何想法?太平船务?打开简历?图像魔术?提前致谢... 最佳答案 您可能对这个库感兴趣-http://code.google.com/p/ocr

python - 为什么不能用 PIL 和 pytesseract 获取字符串?

这是一个简单的Python3光学字符识别(OCR)程序,用于获取字符串,我在这里上传了目标gif文件,请下载并保存为/tmp/target.gif.try:fromPILimportImageexceptImportError:importImageimportpytesseractprint(pytesseract.image_to_string(Image.open('/tmp/target.gif')))我把所有的错误信息都贴在这里,请修复它以从图像中获取字符。/usr/lib/python3/dist-packages/PIL/Image.py:925:UserWarning:

python - 从 OCR 文本中提取分段符?

我正在尝试从OCR图像文本的输出中重新创建段落和缩进,如下所示:输入(想象这是一张图片,不是打字的):输出(有一些错误):如您所见,没有保留段落分隔符或缩进。使用Python,我尝试了这样的方法,但它不起作用(经常失败):代码:defsmart_format(text):textList=text.split('\n')temp=''averageLL=sum([len(line)forlineintextList])/len(textList)forlineintextList:if(line.strip().endswith('!')orline.strip().endswith(

从 tesseract 导入 image_to_string 时出现 Python 错误

我最近在python中使用了tesseractOCR,当我尝试从tesseract导入image_to_string时,我一直遇到错误。导致问题的代码:#PerformOCRusingtesseract-ocrlibraryfromtesseractimportimage_to_stringimage=Image.open('input-NEAREST.tif')printimage_to_string(image)以上代码导致的错误:Traceback(mostrecentcalllast):file"./captcha.py",line52,infromtesseractimpor

python OCR : ignore signatures in documents

我正在尝试对其中包含手写签名的扫描文档进行OCR。请参见下图。我的问题很简单,有没有办法在忽略签名的情况下仍然使用OCR提取人员的姓名?当我运行TesseractOCR时,它无法检索名称。我尝试使用下面的代码进行灰度/模糊/阈值处理,但没有成功。有什么建议吗?image=cv2.imread(file_path)image=cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)image=cv2.GaussianBlur(image,(5,5),0)image=cv2.threshold(image,0,255,cv2.THRESH_BINARY_INV|cv2.

OCR之Tesseract安装

Tesseract安装一、Tesseract下载二、添加环境变量三、配置Tesseract中文识别语言包四、下载相关库五、示例程序1.待识别图片2.识别程序3.识别结果Tesseract是常用的开源OCR识别引擎,后续的图片文字识别项目我们将会调用该库进行识别,本文针对Tesseract的安装配置进行相关说明。一、Tesseract下载下载地址:Tesseract选择最新的版本进行下载,下载完成后,解压安装在自己设定的安装路径,一直选择next即可完成安装。二、添加环境变量打开系统属性页面,然后点击高级,最后选择环境变量。在环境变量页面,将Tesseract安装路径添加到用户变量和系统变量的P

python - OCR应用前图像清洗

过去几个小时我一直在试验PyTesser,它是一个非常好的工具。关于PyTesser的准确性,我注意到几件事:包含图标、图片和文本的文件-5-10%的准确度只有文本的文件(图像和图标已删除)-50-60%准确拉伸(stretch)文件(这是最好的部分)-拉伸(stretch)文件在2)以上的x或y轴上,精度提高了10-20%很明显,Pytesser不处理字体尺寸或图像拉伸(stretch)。尽管有很多关于图像处理和OCR的理论需要阅读,但在应用PyTesser或其他库之前,是否有任何标准的图像清理程序(除了删除图标和图像)需要完成,无论语言如何?......哇,这篇文章现在已经很老了。