草庐IT

tesseract-doc

全部标签

ios - 扫描名片 Tesseract 和 Leptonica iOS

我正在尝试使用tesseractOCR扫描名片,我所做的只是在不进行预处理的情况下发送图像,这是我正在使用的代码。Tesseract*tesseract=[[Tesseractalloc]initWithLanguage:@"eng+ita"];tesseract.delegate=self;[tesseractsetVariableValue:@"0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ@.-()"forKey:@"tessedit_char_whitelist"];[tesseractsetImag

android - Android 中的 Tesseract 字符识别问题(但 iOS 上没有?)

我构建了一个应用程序,它使用Tesseract(V3.03rc1)来识别一些特定的文本字符串。不幸的是,这些打印在自定义字体上,需要我构建自己的训练数据文件。我在iOS(使用https://github.com/gali8/Tesseract-OCR-iOS作为灵感)和Android(也使用https://github.com/rmtheis/tess-two/作为灵感)上构建了应用程序。两个平台的工作流程如下:我在预览屏幕上选择了一个边界框,我可以在其中裁剪相关文本,并相应地裁剪图像。我使用OpenCV获取二值图像(使用OpenCV的自适应阈值函数,两个平台的参数相同)我将此二进制图

ios - 在 tesseract 中添加任何经过训练的数据文件并在 IOS 中使用

我能够编译已经在tesseract示例中的英文版本,但无法添加其他语言,如ara.traineddata。我是这样的Tesseract*tesseract=[[Tesseractalloc]initWithDataPath:@"tessdata"language:@"ara+eng"];它正在识别ENGLISH,但对于ara,它给出了错误Erroropeningdatafile/Users/harshthakur/Library/ApplicationSupport/iPhoneSimulator/7.0/Applications/3B0A1909-E1BA-45E9-99A0-FDE

ios - Tesseract ios SDK 错误打开数据文件/tessdata/eng.traineddata

我正在使用openCV和Tesseract框架开发一个应用程序。它在“不支持64位”的情况下运行良好,但苹果现在要求在每个版本中都支持64位。所以我已经将tesseract框架更新为pod'TesseractOCRiOS','3.4.0'在我的项目中。现在项目在所有设备上运行良好。但是当我扫描任何图像时,我总是会遇到以下错误:Erroropeningdatafile/tessdata/eng.traineddataPleasemakesuretheTESSDATA_PREFIXenvironmentvariableissettotheparentdirectoryofyour"tess

objective-c - 如何在 iOS 应用程序中创建 .doc 文件或文字处理器?

我正在寻找IOS应用程序中的word文件处理。我在谷歌上挖掘了很多东西,我发现word文件是基于OOXML.iOS可以遵循这种格式。如果有人有想法,请引用我。然后我试图找到另一种方法来更改.doc文件的样式。我发现,我们可以使用JavaScripts在UIWebView中执行此类操作在.html文件上。但仍然不知道如何将此.html文件存储在.doc中。如果有人对文字处理器有任何想法,请指导我如何在Objective-C中获得任何帮助。谢谢, 最佳答案 试试libopc开源库,根据他们的网站是:符合ISO/IEC29500标准,跨平

hadoop - Elasticsearch:数周的聚合 min_doc_count 不起作用

我对interval=week和min_doc_count=0进行了以下聚合{"aggs":{"scores_by_date":{"date_histogram":{"field":"date","format":"yyyy-MM-dd","interval":"week","min_doc_count":0}}}和日期过滤器从Jan-01-2015到Feb-23-2015{"range":{"document.date":{"from":"2015-01-01","to":"2015-02-23"}}}我预计Elasticsearch会填满七个星期,即使是空的并返回桶,但最终只有一个

php - 动态创建和下载 Doc 文件

所以我尝试动态创建一个.doc文件并让用户在单击按钮时下载它。这些是我找到的用于下载文件的headerheader('Content-Description:FileTransfer');header('Content-Type:application/octet-stream');这些是我找到的用于制作word文档的标题header('Content-type:application/vnd.ms-word');header('Content-Disposition:attachment;Filename='.$myFile);我只是很难将图片组合在一起,因为这两个任务都有一个“Co

php - 如何在 PHP 中使用 Tesseract OCR?

我在Windows上使用XAMPP。我想在PHP中使用TesseractOCR我的tesseract安装在C:/ProgramFiles/TesseractOCR/XAMPP安装在C:/xampp/我正在使用这段代码在我的PHP中执行Tesseractexec("tesseracttest.pngtest.txt");但它不工作...... 最佳答案 你的exec函数应该是exec("tesseract.exetest.pngtest.txt");您缺少tesseract上的.exe扩展名。我刚刚犯了同样的错误!此外,您的tesse

php - 如何使用 PHP 将最常用的文件扩展名(pdf、doc、docx、xls 等)显示到浏览器中?

目前正在为我的学校开发一个移动网络邮件,我遇到了iPhone问题:iPhone用户可以下载文件,所以我想至少允许他们查阅带有常见扩展名的文件:doc、docx,xls,xlsx,pdf,ppt,pptx,XML,打开office文件等等。是否存在使用PHP或HTML/Javascript执行此操作的方法? 最佳答案 您可以使用googledoc的查看器:http://docs.google.com/viewer这将允许您直接在浏览器中显示所有这些格式。基本上,您只需执行此操作即可显示文档:&embedded=true"width="

php - 让 PHP 在 Linux 上读取 .doc 文件

我正在尝试将.doc文件读入数据库,以便我可以为它的内容编制索引。Linux上的PHP是否有一种简单的方法来读取.doc文件?如果做不到这一点,是否可以将.doc文件转换为rtf、pdf或其他易于阅读的“开放”格式?请注意,我对.docx文件不感兴趣。 最佳答案 Conor,我建议查看OpenOffice命令行界面/调用宏。它可以将许多文件格式转换为许多其他格式。然后您可以选择比MS文档更易于解析的内容。例如,要转换为PDF,命令行是:/usr/lib/ooo-2.0/program/soffice.bin-norestore-no