我有一组图像,我在这些图像上运行OCR应用程序。此过程会生成具有字符偏移量的XML文件。然后我使用Acrobat9将图像转换为PDF。现在,我想将XML文件信息作为不可见的文本层添加到PDF中,以实现可搜索的PDF。有没有简单又免费的方法?一些细节:我不想使用Acrobat的OCR功能;OCR过程生成一个XML文件,其中包含如下元素:Thisisasamplelineoftextfromanimage更新:也许可以用不同的方式做我想做的事。假设已经有一个从一组图像生成的PDF文件,并且已经包含OCRed文本。是否可以(也许以编程方式)仅访问每个页面的图像,对其进行处理(例如,将其转换为
我正在考虑从XML源创建高质量PDF,作为在线相册创建工具的输出。从手动创建PDF(iText、PdfSharp等)到PrinceXML再到xsl-fo工具,有数百种选项可用于完成此任务。以下是我希望支持的一些功能:强制支持全出血PDF多格式页面组合支持封套、书脊打印、全幅图形+文本非标准页面尺寸重叠图形元素自定义字体交叉折叠布局支持——双页展开300-600dpi图像支持真正的所见即所得/可靠、可预测的输出(即从源Material到PDF的像素完美转换)margin控制颜色配置文件嵌入Unicode支持绝对定位布局元素可选支持相对布局元素图片(CMYK、RGB)HTTP字体断字支持裁
假设我在网站上有一个pdf表单文件,由用户填写并提交给服务器。在服务器端(Asp.Net),我想将我收到的xml格式的数据与填写的空pdf表单合并并保存。我发现有几种可能的方法:使用adobeacrobat创建的pdf表单并用itextsharp填充它。使用adobeacrobat创建的pdf表单并用FDFToolkit.net填充它(它似乎在内部使用itextsharp)使用pdfkt填写表格。使用adobelivecycle创建的pdf表单文件并使用FormDataIntegrationService合并数据由于我没有完成此类任务的经验,您能否建议哪个选项更好/更容易并提供一些额外
我需要创建XML记录的PDF。我认为没有办法直接从xml创建pdf但使用XSLT或XSLFO我相信它可以完成。我一直在阅读大量文章,寻找使用C#执行此操作的好方法。-->在此期间最好的方法是什么?任何例子都会很棒。我的场景:我的XML看起来像:我如何创建一个包含显示所有这些信息的表格的pdf?我知道有很多类似的问题,但其中大部分都已过时。非常感谢任何帮助。 最佳答案 过去我使用过一个名为IbexPDFCreator的商业图书馆使用非常有效的XSL-FO标准从XML数据生成PDF文档。这是我将如何使用它的示例:XML数据:XSL-FO
我有一些用于生成我的网页的XML文件,但是我需要能够允许用户选择多个页面,然后将它们组合成一个PDF。此PDF需要与实际网页具有不同的样式(内容保存在XML文件中;))。附注PDF必须有目录......并且将包括从网站上截取的图像。 最佳答案 您将使用像iText或iTextSharp这样的库使用您的内容构建PDF。 关于xml-多个XML到PDF:bestapproach,我们在StackOverflow上找到一个类似的问题: https://stackov
谁能向我解释为什么从xml表创建pdf文件如此复杂?Acrobat可以创建XML文件,但是当我想以其他方式执行此操作时,它突然变得复杂起来。我想找到一些简单的应用程序,它可以让我用xml创建一个pdf文件。可能吗? 最佳答案 XML是一堆配料,PDF是成品。会做饭的人可以使用相同的食材制作出各式各样的饭菜。有了土bean,他可以做汤、土bean泥、薯片、炸薯条……几乎有无穷无尽的可能性。不会做饭的人会盯着土bean想:我到底怎样才能把这种丑陋的蔬菜变成美味的炸肉饼?答案是:您需要一份食谱。该配方可以是XSL:FO文件、XHTML规范
关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭1年前。Improvethisquestion我正在尝试使用C#.NET创建PDF生成器,但遇到了一些重大困难。我有一个包含数据的xml文件和一个用于pdf模板的xslt文件。我在那里尝试了许多不同的库,但似乎无法正常工作。任何人都可以建议我可以使用的示例来说明如何执行此操作。任何帮助将非常感激。谢谢
从表面上看,这是一个简单的问题:如何从我的XML文档中获取漂亮的PDF?实际上,我的输入是XHTML的一个子集,添加了一些自定义属性(以保存一些关于引文来源的信息等)。我一直在探索一些路线,如果有人以前尝试过其中一些路线,我想得到一些反馈。注意:我考虑过使用XSL-FO生成PDF,但听说开源工具的排版质量仍然落后于TeX很多。猜猜最高级的是ApacheFOP.但我真的对漂亮的PDF很感兴趣(否则我可以使用浏览器的打印对话框)。对此有任何想法和更新吗?所以我一直在考虑使用XSLT将我定制的XML/XHTML方言转换为DocBook,然后从那里开始(DocBookviaXSLT到正确的HT
我正在使用XSLT将XML文件转换为HTML文件。作为转换的一部分,我想将一个纯文本文件插入到HTML中。这可能吗? 最佳答案 您有几个选择:如果你能把中的纯文本包围起来标签,您可以使用document()导入它功能。这适用于XSLT1.0,不需要其他编程语言。如果您不能修改源文件,但您有XSLT2.0,那么您可以使用unparsed-text()来完成。.如果您没有XSLT2.0,但您使用的是Java,那么您可以invokeaJavafunction.Microsoft平台可能会提供类似的功能。
尝试创建基于XML的PDF文件和使用XMLSpy的文件。我正在尝试根据字段内容将一个字段分成两行。例如,如果我的varialbe="JohnDoeAKAJohnnyD",我想这样查看它:李四强尼D我的问题是,即使使用网上的所有示例,我也无法使其正常工作。这是我的代码:基本上,每次我找到“AKA”字符串时,我都想将该字段分成两行。所以我的代码,找到字符串,创建新变量但仍然显示在一行中。我尝试使用各种技术创建一个带有空白行的变量,但仍然显示在一行中。有什么想法吗? 最佳答案 参见myanswerhere关于使用十六进制实体引用和line