草庐IT

FPDI-PDF-PARSER

全部标签

Java - XML 解析器性能 : Sun Java Streaming XML Parser (SJSXP) vs Woodstox

我正在寻找最新的、内存高效和高性能的JavaXML解析API。我需要解析3MB到5MB的XML文件。我对此进行了谷歌搜索,了解到SunJavaStreamingXMLParser(SJSXP)和Woodstox比DOM和SAX快得多。两者都使用StAXAPI。*这些技术不支持模式验证。AaltoXML处理器也实现了StAXAPI。我还没有找到关于这些技术性能的具体发现。哪一个在内存效率、高性能和易用性方面最好? 最佳答案 这里还有一些可能相关的链接:数据绑定(bind)的Stax实现:http://technotes.blogs.s

java - 使用 Stax Parser 将大于 10GB 的巨大 xml 文件拆分成小块

我们有一个场景,我们需要将大小超过10GB的大型xml文件分成小块。每个block应包含100或200个元素。示例xml29PankajMaleJavaDeveloper35LisaFemaleCEO40TomMaleManager25MeghnaFemaleManager29PankajMaleJavaDeveloper35LisaFemaleCEO40TomMaleManager我有Stax解析器代码,它将文件分成小块。但是每个文件只包含一个完整的Employee元素,我需要100或200或更多单个文件中的元素。这是我的java代码publicstaticvoidmain(Stri

xml - 如何访问由 XML::Parser 创建的解析树?

我有一个数组引用,其中包含一些数组引用。嵌套数组引用也包含数组引用。(这是tree的XML::Parser风格。)my$Filename="sample.xml";my$Parser=newXML::Parser(Style=>'tree');my$Tree=$Parser->parsefile($Filename);这里的$Tree是数组引用,它将是数组引用,内容和嵌套深度都取决于xml文件。我想遍历嵌套数组$Tree并打印内容。 最佳答案 这是一个简单的版本:usestrict;usewarnings;subprintEleme

xml - 在使用 FOP 生成的 PDF 中显示换行符

我正在使用FOP生成PDF文档。源XML包含一些包含换行符的文本数据。但是当它以PDF格式显示时,所有新行都将转换为空格。我尝试用替换所有\n字符 在java代码中,但这也无济于事。如何显示PDF文档中的新行?能否请您提供您的建议?提前致谢。 最佳答案 哎呀...想通了..linefeed-treatment="preserve"应该添加到fo:block中……仅此而已 关于xml-在使用FOP生成的PDF中显示换行符,我们在StackOverflow上找到一个类似的问题:

xml - 如何将自定义纸张格式链接到 Odoo 8 中的 pdf 报告?

我想从odoo打印标签。为此,我创建了一个自定义纸张格式,并找到了一种将其链接到我的标签报告的方法。我的标签报告是pdf报告。(当我创建报告时,我可以以默认的纸张格式查看它。)这是自定义纸张格式的代码ItemLabelcustom50100Portrait3333380我再说一遍,我的问题是如何将此纸质格式与我的pdf报告链接 最佳答案 Qweb报告自定义论文格式EuropeanA4lowmarginA400Portrait4444090在这里,我将自定义论文格式添加到QWeb报告中。我希望这对你有帮助..:)

xml - 如何将外部 OCR 嵌入到现有 PDF 中?

我有一组图像,我在这些图像上运行OCR应用程序。此过程会生成具有字符偏移量的XML文件。然后我使用Acrobat9将图像转换为PDF。现在,我想将XML文件信息作为不可见的文本层添加到PDF中,以实现可搜索的PDF。有没有简单又免费的方法?一些细节:我不想使用Acrobat的OCR功能;OCR过程生成一个XML文件,其中包含如下元素:Thisisasamplelineoftextfromanimage更新:也许可以用不同的方式做我想做的事。假设已经有一个从一组图像生成的PDF文件,并且已经包含OCRed文本。是否可以(也许以编程方式)仅访问每个页面的图像,对其进行处理(例如,将其转换为

xml - 从 XML 生成高质量 PDF 的最佳方法是什么?

我正在考虑从XML源创建高质量PDF,作为在线相册创建工具的输出。从手动创建PDF(iText、PdfSharp等)到PrinceXML再到xsl-fo工具,有数百种选项可用于完成此任务。以下是我希望支持的一些功能:强制支持全出血PDF多格式页面组合支持封套、书脊打印、全幅图形+文本非标准页面尺寸重叠图形元素自定义字体交叉折叠布局支持——双页展开300-600dpi图像支持真正的所见即所得/可靠、可预测的输出(即从源Material到PDF的像素完美转换)margin控制颜色配置文件嵌入Unicode支持绝对定位布局元素可选支持相对布局元素图片(CMYK、RGB)HTTP字体断字支持裁

asp.net - 使用 xml 数据合并/填充 pdf 表单文件

假设我在网站上有一个pdf表单文件,由用户填写并提交给服务器。在服务器端(Asp.Net),我想将我收到的xml格式的数据与填写的空pdf表单合并并保存。我发现有几种可能的方法:使用adobeacrobat创建的pdf表单并用itextsharp填充它。使用adobeacrobat创建的pdf表单并用FDFToolkit.net填充它(它似乎在内部使用itextsharp)使用pdfkt填写表格。使用adobelivecycle创建的pdf表单文件并使用FormDataIntegrationService合并数据由于我没有完成此类任务的经验,您能否建议哪个选项更好/更容易并提供一些额外

c# - 在 C# 中从 XML XSLT 创建 PDF 的最佳方式

我需要创建XML记录的PDF。我认为没有办法直接从xml创建pdf但使用XSLT或XSLFO我相信它可以完成。我一直在阅读大量文章,寻找使用C#执行此操作的好方法。-->在此期间最好的方法是什么?任何例子都会很棒。我的场景:我的XML看起来像:我如何创建一个包含显示所有这些信息的表格的pdf?我知道有很多类似的问题,但其中大部分都已过时。非常感谢任何帮助。 最佳答案 过去我使用过一个名为IbexPDFCreator的商业图书馆使用非常有效的XSL-FO标准从XML数据生成PDF文档。这是我将如何使用它的示例:XML数据:XSL-FO

xml - 多个 XML 到 PDF : best approach

我有一些用于生成我的网页的XML文件,但是我需要能够允许用户选择多个页面,然后将它们组合成一个PDF。此PDF需要与实际网页具有不同的样式(内容保存在XML文件中;))。附注PDF必须有目录......并且将包括从网站上截取的图像。 最佳答案 您将使用像iText或iTextSharp这样的库使用您的内容构建PDF。 关于xml-多个XML到PDF:bestapproach,我们在StackOverflow上找到一个类似的问题: https://stackov