pdf2txt_草庐IT

xml - 如何将外部 OCR 嵌入到现有 PDF 中？

我有一组图像，我在这些图像上运行OCR应用程序。此过程会生成具有字符偏移量的XML文件。然后我使用Acrobat9将图像转换为PDF。现在，我想将XML文件信息作为不可见的文本层添加到PDF中，以实现可搜索的PDF。有没有简单又免费的方法？一些细节:我不想使用Acrobat的OCR功能；OCR过程生成一个XML文件，其中包含如下元素:Thisisasamplelineoftextfromanimage更新:也许可以用不同的方式做我想做的事。假设已经有一个从一组图像生成的PDF文件，并且已经包含OCRed文本。是否可以(也许以编程方式)仅访问每个页面的图像，对其进行处理(例如，将其转换为

xml - 从 XML 生成高质量 PDF 的最佳方法是什么？

我正在考虑从XML源创建高质量PDF，作为在线相册创建工具的输出。从手动创建PDF(iText、PdfSharp等)到PrinceXML再到xsl-fo工具，有数百种选项可用于完成此任务。以下是我希望支持的一些功能:强制支持全出血PDF多格式页面组合支持封套、书脊打印、全幅图形+文本非标准页面尺寸重叠图形元素自定义字体交叉折叠布局支持——双页展开300-600dpi图像支持真正的所见即所得/可靠、可预测的输出(即从源Material到PDF的像素完美转换)margin控制颜色配置文件嵌入Unicode支持绝对定位布局元素可选支持相对布局元素图片(CMYK、RGB)HTTP字体断字支持裁

asp.net - 使用 xml 数据合并/填充 pdf 表单文件

假设我在网站上有一个pdf表单文件，由用户填写并提交给服务器。在服务器端(Asp.Net)，我想将我收到的xml格式的数据与填写的空pdf表单合并并保存。我发现有几种可能的方法:使用adobeacrobat创建的pdf表单并用itextsharp填充它。使用adobeacrobat创建的pdf表单并用FDFToolkit.net填充它(它似乎在内部使用itextsharp)使用pdfkt填写表格。使用adobelivecycle创建的pdf表单文件并使用FormDataIntegrationService合并数据由于我没有完成此类任务的经验，您能否建议哪个选项更好/更容易并提供一些额外

c# - 在 C# 中从 XML XSLT 创建 PDF 的最佳方式

我需要创建XML记录的PDF。我认为没有办法直接从xml创建pdf但使用XSLT或XSLFO我相信它可以完成。我一直在阅读大量文章，寻找使用C#执行此操作的好方法。-->在此期间最好的方法是什么？任何例子都会很棒。我的场景:我的XML看起来像:我如何创建一个包含显示所有这些信息的表格的pdf？我知道有很多类似的问题，但其中大部分都已过时。非常感谢任何帮助。最佳答案过去我使用过一个名为IbexPDFCreator的商业图书馆使用非常有效的XSL-FO标准从XML数据生成PDF文档。这是我将如何使用它的示例:XML数据:XSL-FO

xml - 多个 XML 到 PDF : best approach

我有一些用于生成我的网页的XML文件，但是我需要能够允许用户选择多个页面，然后将它们组合成一个PDF。此PDF需要与实际网页具有不同的样式(内容保存在XML文件中；))。附注PDF必须有目录......并且将包括从网站上截取的图像。最佳答案您将使用像iText或iTextSharp这样的库使用您的内容构建PDF。关于xml-多个XML到PDF:bestapproach，我们在StackOverflow上找到一个类似的问题： https://stackov

xml - 为什么将 XML 转换为 pdf 如此困难？

谁能向我解释为什么从xml表创建pdf文件如此复杂？Acrobat可以创建XML文件，但是当我想以其他方式执行此操作时，它突然变得复杂起来。我想找到一些简单的应用程序，它可以让我用xml创建一个pdf文件。可能吗？最佳答案 XML是一堆配料，PDF是成品。会做饭的人可以使用相同的食材制作出各式各样的饭菜。有了土bean，他可以做汤、土bean泥、薯片、炸薯条……几乎有无穷无尽的可能性。不会做饭的人会盯着土bean想:我到底怎样才能把这种丑陋的蔬菜变成美味的炸肉饼？答案是:您需要一份食谱。该配方可以是XSL:FO文件、XHTML规范

c# - 使用 C#.NET 生成 PDF

关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭1年前。Improvethisquestion我正在尝试使用C#.NET创建PDF生成器，但遇到了一些重大困难。我有一个包含数据的xml文件和一个用于pdf模板的xslt文件。我在那里尝试了许多不同的库，但似乎无法正常工作。任何人都可以建议我可以使用的示例来说明如何执行此操作。任何帮助将非常感激。谢谢

XML 到 TeX 或如何从类似 XHTML 的源中获取漂亮的 PDF

从表面上看，这是一个简单的问题:如何从我的XML文档中获取漂亮的PDF？实际上，我的输入是XHTML的一个子集，添加了一些自定义属性(以保存一些关于引文来源的信息等)。我一直在探索一些路线，如果有人以前尝试过其中一些路线，我想得到一些反馈。注意:我考虑过使用XSL-FO生成PDF，但听说开源工具的排版质量仍然落后于TeX很多。猜猜最高级的是ApacheFOP.但我真的对漂亮的PDF很感兴趣(否则我可以使用浏览器的打印对话框)。对此有任何想法和更新吗？所以我一直在考虑使用XSLT将我定制的XML/XHTML方言转换为DocBook，然后从那里开始(DocBookviaXSLT到正确的HT

xml - XSLT 插入 TXT 文件

我正在使用XSLT将XML文件转换为HTML文件。作为转换的一部分，我想将一个纯文本文件插入到HTML中。这可能吗？最佳答案您有几个选择:如果你能把中的纯文本包围起来标签，您可以使用document()导入它功能。这适用于XSLT1.0，不需要其他编程语言。如果您不能修改源文件，但您有XSLT2.0，那么您可以使用unparsed-text()来完成。.如果您没有XSLT2.0，但您使用的是Java，那么您可以invokeaJavafunction.Microsoft平台可能会提供类似的功能。

xml - 使用 XSL-FO 在 PDF 中添加换行符？

尝试创建基于XML的PDF文件和使用XMLSpy的文件。我正在尝试根据字段内容将一个字段分成两行。例如，如果我的varialbe="JohnDoeAKAJohnnyD"，我想这样查看它:李四强尼D我的问题是，即使使用网上的所有示例，我也无法使其正常工作。这是我的代码:基本上，每次我找到“AKA”字符串时，我都想将该字段分成两行。所以我的代码，找到字符串，创建新变量但仍然显示在一行中。我尝试使用各种技术创建一个带有空白行的变量，但仍然显示在一行中。有什么想法吗？最佳答案参见myanswerhere关于使用十六进制实体引用和line