草庐IT

tesseract-doc

全部标签

php - Tesseract 和 Php ocr

我希望使用Tesseract将大量图像文件转换为文本。我查看了他们的文档,但不知道它与PHP有何关系以及我的php脚本将如何与tesseractocr交互。我已经看到其他问题表明phpexec()可能是这样。$img=myimage.png;$text=exec($img,'tesseract');我已经下载并安装了tesseract。使用安装了最新版本xampp的Windows7。我有一个初级到中级的php知识。我缺少什么知识?更新我现在可以在powershell和cmd中使用它了tesseract.exeD:\Documents\Web_Development\Sandbox\ph

PHP 上传表单、PDF、Doc 和 Docx

我正在努力使这个上传代码适用于docx文件,它适用于doc和pdf..$allowedExts=array("pdf","doc","docx");$extension=end(explode(".",$_FILES["file"]["name"]));if((($_FILES["file"]["type"]=="application/pdf")||($_FILES["file"]["type"]=="application/msword"))&&($_FILES["file"]["size"]0){echo"ReturnCode:".$_FILES["file"]["error"]

php - 在 PHP 中生成报告(需要格式 pdf、xls、doc、csv)

我需要在我的PHP网站中生成报告(在zend框架中)要求的格式:PDF(withtables&images)//presentlyusingZend_PdfXLS(withtables&images)DOC(withtables&images)CSV(onlytables)请推荐使用PHP生成报告的可靠且快速的解决方案。平台:LAMP上的ZendFramework我知道创建此类报告有一些棘手的解决方案,我想知道是否有任何可以与LAMP环境一起使用的开源报告生成实用程序 最佳答案 Excel:http://www.phpexcel.n

java使用tesseract-ocr进行文字识别

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、tesseract-ocr是什么?二、使用步骤1.下载exe安装包2.安装3.使用3.设置全局path二、java如何进行调用1.引入依赖2.demo使用3.环境变量配置前言公司使用AI进行OCR文字识别效果不好,并且提供的服务不稳定,本次查找到使用java也能连接的OCR开源项目进行识别的学习一、tesseract-ocr是什么?tesseract-ocr是一个开源的OCR文字识别项目,目前版本已经更新到5.X.X了,并且提供多种环境的安装,本次我们在window进行安装并且使用。二、使用步骤1.下载exe安装包

php - 为 gif/jpg/png/pdf/doc、wmv 文件构建 PHP uploader ,可行,还是我应该购买一些东西?

我有一台Mac服务器,我正在构建PHP代码以允许用户上传图像、文档甚至视频文件。研究这个肯定让我很紧张,我希望上传的内容没有病毒。自己构建一些东西会是一个巨大的挑战吗?您会这​​样做,还是会找到一些操作系统或OTS产品?(你知道有什么可以推荐的吗)? 最佳答案 从概念上讲,您所说的非常简单。接受和处理上传非常简单,我认为您绝对不需要为此担心购买预建解决方案。通常像图像和视频之类的东西不会真的有“病毒”(除非查看器应用程序真的很差并且让它们以某种方式运行代码-也称为“InternetExplorer”),但病毒扫描并不难不管怎样,如果

java - 如何计算上传文件 PDF、Doc、Xls、Csv 等中的单词字符或句子

如何使用PHP、ZendFramework或基于CLI的Java触发器计算PDF、Doc、Xls、Csv等上传文件中的字数? 最佳答案 这是一个第三方应用程序可以做到这一点http://www.globalrendering.com/download.html.您可以为它创建一个简单的包装器。就wc而言,它对这些文件类型不准确。参见http://ubuntuforums.org/showthread.php?t=566407 关于java-如何计算上传文件PDF、Doc、Xls、Csv等

PHP:在 Linux 中从 .PDF、.DOC 和 .DOCX 生成图像缩略图

正如标题所说,我基本上是在寻找一种方法,从上传到Linux机器的.DOC、.DOCX或.PDF文件生成缩略图。我知道ImageMagick可以处理.PDF到.PNG的转换,并且使用PHP的IMagick可以使它变得更加容易,但我不确定是.DOC还是.DOCX。我想有人告诉我OpenOffice的headless版本可以做到这一点。 最佳答案 我自己还没有测试过,但是ooo-thumbnailer显然可以制作.31及更高版本的DOC、DOCX和PDF文件的缩略图。该项目可从此处获得:https://launchpad.net/ooo-

php - 如何像google doc一样获取 `thumbnails document`?

如何获取thumbs文档(doc,docx,pdf,pptx,ppt,.....)?可以使用C#、php、.....请帮帮我!非常感谢! 最佳答案 这个问题之前有人问过……请看LiveThumbnails/LargeImage一些例子它只捕获网站,但它对所有其他文档类型都是一样的......你需要做的就是将(doc,docx,pptx,ppt,......)转换为pdf或HTML或image...PDF更易于使用,但一些在线工具也可以将doc转换为image直接..当你拥有pdf时,你可以轻松地将它转换为jpg然后创建一个缩略图形式

php - 您如何构造 URL 来访问 google docs/drive 文件夹?

我想知道如何制作rawrequesttoGoogledrive至accessapublicfolder.https://www.googleapis.com/drive/v2/files?q=0B-eVxZFKAu61TmFQUUFPbzBmVVU&key=__________但是,该URL给出了以下错误:{"error":{"errors":[{"domain":"global","reason":"invalid","message":"InvalidValue","locationType":"parameter","location":"q"}],"code":400,"mes

php - NetBeans PHP 运行配置 : how can I omit the doc-root folder?

所以我在PHP中有这个项目,我在wwwroot(或doc-root)文件夹旁边有一些包含文件,而不是在wwwroot文件夹下。但是我需要运行/调试这个项目。在项目属性中,我可以选择一个索引文件(index.php),但它位于doc-root文件夹下,因此项目URL为http://myprojectmachine/doc-root/index.php而不是..://myprojectmachine/index.php。手动输入索引文件不起作用,因为NetBeans指出找不到该文件。我怎样才能以优雅的方式克服这个问题? 最佳答案 我昨天