草庐IT

php - 如何从文档中提取/识别文本?

我需要从上传的文档中提取纯文本,以使其可搜索。文件可以是MSWord或pdf(扫描件或包含文本)。有问题的应用程序在LAMP堆栈上运行,但可以选择安装其他软件。您是否可以推荐任何工具、服务、库或它们的组合来完成此任务? 最佳答案 您可以结合使用shell实用程序,例如用于PDF的pdftotext、用于DOC的wvWare、用于DOCX的docx2txt.pl,例如textractorrubygem可以。#onUbuntuapt-getinstallwvxpdf-utilslinks还有用于提取PDF和docx的nativephp类

php - 使用 tcpdf 在 pdf 中创建链接

如何使用TCPDF创建链接?当使用writeHTML()函数并传递我的整个html内容时,TCPDF不会使我的链接可点击。它们是蓝色的并带有下划线,但我无法点击它们。这是我做的。$html="stackoverflow.com";$tcpdf=newTCPDF();$tcpdf->writeHTML($html);$tcpdf-Output('output.pdf','F'); 最佳答案 根据documentation,您可以在TCPDF对象上使用Write()方法来实现此目的。例如:$tcpdf->Write(10,'Google

php在浏览器中打开fdf文件

我正在使用cakephp。我需要填写一个PDF表单,我通过从http://koivi.com/fill-pdf-form-fields获取代码生成了fdf文件。.fdf文件将生成良好,但我无法在浏览器中打开该文件。我已将实时PDF表单URL放入fdf文件中,并使用以下标题显示该文件。但显示的是fdf文件的原始内容。header("Content-type:application/vnd.fdf");echofile_get_contents($fdf_doc);请有人帮忙在浏览器中显示带有fdf文件中数据的pdf文件。这是我针对上面两行代码得到的代码%FDF-1.2%âãÏÓ10obj

php - 在 TCPDF 中,如何将当前页码获取为整数?

我尝试使用$pdf-getAliasNumPage(),如果以PDF格式呈现,它会显示页码。但是当我在一个基本的PHP上进行试验并打印它时,它只返回“{:pnp:}”。如果页面已经更改,我曾经有一个if条件,以便我可以再次重置值=0,但由于getAliasNumPage()的返回值等于"{:pnp:}".有什么方法可以找到整数形式的页码吗?那是什么TCPDF功能?我只声明了一次AddPage(),因为我不需要它。已经使用了$pdf->getPage();只返回0。谢谢!$this->payroll_id=$request->getParameter('payroll_id');$thi

php - 用于 PHP 的 TCPDF 在使用特殊(斯洛文语)字符 đ 时创建空 PDF

我正在使用TCPDF生成PDF(很明显)。一切都很好,但现在我正在尝试制作一个带有字符“đ”(显然是斯洛夫语字符)的PDF。数据是用户生成的,所以我不知道他们是否打算使用这些类型的字符-这就是我认为我应该使用UTF-8的原因。但显然这是不对的。PDF已创建,但它完全是空的/白色的。这是我的相关代码:$pdf=newXTCPDF('P',PDF_UNIT,'Letter',true,'UTF-8',false);$pdf->SetPrintHeader(false);$pdf->SetPrintFooter(false);$pdf->SetDefaultMonospacedFont(PD

php - FPDF 中的汉字问题

我正在使用FPDF库生成一些订单确认,效果很好。但是现在我需要文档中的一些汉字。到目前为止,我已经搜索了很多小时,但没有找到可行的解决方案。是否可以使用FPDF支持汉字,或者是否有FPDF的替代方案支持它?所有字符都与常规文本混合,并存储在MySQL数据库中。PDF文档在打印汉字时只显示unicode。 最佳答案 存在像Big5这样的中文编码格式或GBK.但是,您尝试输入的文本很可能是Unicode格式的。存在tFPDF,它提供Unicode支持。我将测试打印以下繁体汉字:中国。对于那些不了解的读者来说,这意味着中国。//Remem

php - Laravel PDF : No block-level parent found. 不好

直到今天,我的代码都运行良好。我没有做任何更改,但突然我的pdf代码不起作用。我在laravel5.2中使用barryvdh/laravel-dompdf这个包。我删除了我的本地项目并从实时服务器下载,但我的本地计算机上仍然出现此问题。我的实时项目使用此代码运行良好。这是我的代码$pdf=App::make('dompdf.wrapper');$pdf->loadView('back_end.pdf_template.make_invoice',['order_info'=>$order_info,'order_details'=>$order_details]);return$pdf

php - "Unable to find xref table"与 Dompdf0.6a + FPDI

我正在尝试使用dompdf0.6a从html生成一个pdf文件并且工作正常,但随后我需要对其进行加密以进行保护,但出现错误FPDFerror:Unabletofindxreftable-MaybeaProblemwith'auto_detect_line_endings'但是,如果我使用旧的dompdf版本,它工作正常。我猜它会生成fpdi不支持的更新的pdf版本。顺便说一句。我将其追踪到FPDI/pdf_parser.php:208(内部方法pdf_read_xref()) 最佳答案 我能够通过使用Adob​​eAcrobatPr

php - rtf格式转pdf

有什么方法可以使用PHP将rtf格式转换为pdf格式?谢谢 最佳答案 如果您想坚持使用纯PHP,您可以使用HTML作为中介:将RTF格式转换为HTMLhttp://freshmeat.net/projects/rtf2htm/,http://www.phpclasses.org/package/1930-PHP-RTF-to-HTML-converter-with-latin-character-support.html可选:清理HTMLhttp://htmlpurifier.org/将HTML转换为PDFhttp://dompdf

php - 使用 PHP 创建图表并导出为 PDF

我正在寻找有关使用PHP创建图形的建议。我还希望能够将这些图表导出为PDF文档。我目前正在使用谷歌图表,但我不喜欢将我的所有信息发送给谷歌的想法。我更喜欢我自己的托管解决方案。我见过很多Flash解决方案,但我不知道有什么方法可以将SWF导出为PDF。非常感谢任何指点。谢谢。 最佳答案 很多工具,例如PHPGraphLib,JPGraph这两者都会生成可以嵌入到pdf中的图像 关于php-使用PHP创建图表并导出为PDF,我们在StackOverflow上找到一个类似的问题: