草庐IT

pdf2word

全部标签

java - iText – HTML 到 PDF - 图像不显示在 PDF 中

我有一个包含文本、图像的html页面,我正在将HTML内容解析为iText以生成PDF。在生成的PDF中,不显示包含的图像,只显示文本。如果我传递像D:/Deiva/CRs/HTMLPage/article-101-horz.jpg这样的绝对路径,那么图像就会被打印出来。但是如果我尝试像这样从服务器打印图像http://localhost:8085/content/dam/article-101-h1.jpg或http://www.google.co.in/intl/en_ALL/images/logos/images_logo_lg.gif那么它不会打印在PDF中。注意:我正在使用i

java - PDF 页面的缩略图 (Java)

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。要求提供代码的问题必须表现出对所解决问题的最低限度理解。包括尝试过的解决方案、为什么它们不起作用,以及预期结果。另请参阅:StackOverflowquestionchecklist关闭9年前。Improvethisquestion如何使用Java生成PDF文档中页面的缩略图?

Java 正则表达式 : check if word has non alphanumeric characters

这是我的代码,用于确定一个单词是否包含任何非字母数字字符:Stringterm="Hello-World";booleanfound=false;Patternp=Pattern.Compile("\\W*");Matcherm=p.Matcher(term);if(matcher.find())found=true;我想知道正则表达式是否有误。我知道"\W"会匹配任何非单词字符。知道我缺少什么吗?? 最佳答案 将您的正则表达式更改为:.*\\W+.* 关于Java正则表达式:check

java - 即使是最简单的 Jasperreport jrxml 也是空白 PDF

我有一个带有glassfish3.1+JSFforjasperreport4.0.1的EJB站点。该站点在流式传输pdf上没有问题,但是在使用runReportToPdfStream打印PDF时会生成空白PDF,下面是代码片段:EJBpublicclassBookEJB{publicvoidprintReport()throwsClassNotFoundException,IOException,JRException{MapparameterMap=newHashMap();FacesContextctx=FacesContext.getCurrentInstance();HttpS

java - 将 PDF 文件转换为图像

我想将PDF文档转换为图像。我使用的是Ghost4j。问题:Ghost4J在运行时需要gsdll32.dll文件,而我不想使用该dll文件。问题一:有什么办法,在ghost4j中可以不用dll转成图片吗?问题2:我在PDFBoxAPI中找到了解决方案。org.apache.pdfbox.pdmodel.PDPagep具有将PDF页面转换为图像格式的方法convertToImage()`。PDDocumentdoc=PDDocument.load(newFile("/document.pdf"));Listpages=doc.getDocumentCatalog().getAllPage

python - 在 PDF 文件中查找文本位置

我有一个PDF文件,我正在尝试在PDF中查找特定文本并使用Python突出显示它。我找到了PyPDF2,这可以highlightpartofaPDF当我们给出文件中想要的高亮位置的坐标时。我正在尝试找到一种工具,它可以为我提供给定文本在PDF中的位置。 最佳答案 PyMuPDF可以通过坐标查找文本。您可以将其与PyPDF2突出显示方法结合使用来完成您所描述的内容。或者你可以usePyMuPDFtohighlightthetext.这是使用PyMuPDF查找文本和突出显示的示例代码:importfitz###READINPDFdoc=

python - 用python生成pdf

我正在尝试开发一个小脚本来生成一个完整的新pdf,主要是文本和表格,结果是文件。我正在寻找最好的方法。我读过有关reportlab的文章,它看起来不错。据我所知,它只有一个缺点。没有商业版的模版很难写,而且代码看起来也很难维护。所以我搜索了一个更充分的方法并找到了xhtml2pdf,但是这个软件很旧,不能生成超过两页或更多的表格。我想到的最后一个解决方案是使用模板框架生成一个tex文件,然后调用pdftex作为子进程。我会实现最后一个,然后再检查一下LateX。你会这样做吗,你有更好的想法吗? 最佳答案 我建议使用LaTeX方法。它

python - xhtml2pdf Pisa css 损坏无功能

我正在尝试使用Django使用xhtml2pdf.pisa使用html+css生成PDF。但是,我遇到了CSS的各种奇怪问题。下面是我的代码:fromdjango.template.loaderimportrender_to_stringimportcStringIOasStringIOimportxhtml2pdf.pisaaspisaimportcgi,osdeffetch_resources(uri,rel):path=os.path.join(settings.STATIC_ROOT,uri.replace(settings.STATIC_URL,""))returnpathd

Python - 计算 word2vec 向量的层次聚类并将结果绘制为树状图

我使用我的领域文本语料库生成了一个100Dword2vec模型,合并了常用短语,例如(goodbye=>good_bye)。然后我提取了1000个所需单词的向量。所以我有一个像这样的1000numpy.array:[[-0.050378,0.855622,1.107467,0.456601,...[100dimensions],[-0.040378,0.755622,1.107467,0.456601,...[100dimensions],......[1000Vectors]]单词数组如下:["hello","hi","bye","good_bye"...1000]我对我的数据运行了

python - 如何查找word在文件中的位置?

例如我有文件和单词“test”。文件是部分二进制文件,但有字符串“test”。如何在不加载内存的情况下找到文件中单词(索引)的位置? 最佳答案 除非打开文件,否则无法找到文本在文件中的位置。这就像要求某人在不睁开眼睛的情况下阅读报纸。回答你问题的第一部分,比较简单。withopen('Path/to/file','r')asf:content=f.read()printcontent.index('test') 关于python-如何查找word在文件中的位置?,我们在StackOver