草庐IT

并行处理

全部标签

xml - 在内存中处理大型 XML 文档

我需要在内存中保存大量XML(很可能会使用OracleCoherence作为分布式缓存)。期望在内存中保存100,000个XML。这些XML相当大-大约。每个250KB。这些XML由其他系统请求-它们只请求与它们相关的XML部分。此外,他们还会要求更改XML的内容。负载将是每分钟大约300个这样的请求,或多或少均匀地分布在检索和更新之间。重要的一点是XML不是结构化的,所以我不会为它们提供XSD,但我有提取和更新XML的算法。我的问题是什么会产生更好的性能:将XML按原样保存在内存中,并通过使用XQuery甚至使用编码过程从中提取所有数据并进行更新,或者将XML转换为对象,在代码中操作

java - 使用 Java DOM 处理空节点

我有一个关于XML、Java对DOM的使用和空节点的问题。我目前正在从事一个项目,其中我使用抽象机器的XML描述rune件(用于文本解析)并使用它们解析一系列输入字符串。这些抽象机器的实际构建和解释都已完成并且工作正常,但我遇到了一个相当有趣的XML需求。具体来说,我需要能够将一个空的InputString节点变成一个空字符串("")并且仍然执行我的解析例程。然而,当我试图从我的XML树中提取这个空白节点时,问题就出现了。这会导致空指针异常,然后通常会发生不好的事情。这是有问题的XML片段(注意第一个元素是空的):000111010011011011101100001010101010

python - 如何用 Python 2.6 和 minidom 添加 xml-stylesheet 处理指令节点?

我正在使用minidom创建XML文档-如何确保生成的XML文档包含如下样式表引用:谢谢! 最佳答案 使用这样的东西:fromxml.domimportminidomxml="""text"""dom=minidom.parseString(xml)pi=dom.createProcessingInstruction('xml-stylesheet','type="text/xsl"href="mystyle.xslt"')root=dom.firstChilddom.insertBefore(pi,root)printdom.to

xml - 使用 perl XML::LibXML 处理 XML 这么慢

XML文件是这样的:0011B51B6D2020130107091545201301070930190011B51B6D212013010709154620130107093019还有我的代码:#!/usr/bin/perluseEncode;useXML::LibXML;useData::Dumper;$parser=newXML::LibXML;$struct=$parser->parse_file("d:/AP_201301073100_1.xml");my$file_data="d:\\ap.txt";openIN,">$file_data";$rootel=$struct->

c# - 在解析 XDocument 时处理空 XElement

有没有更好的方法来做这样的事情:privateXElementGetSafeElem(XElementelem,stringkey){XElementsafeElem=elem.Element(key);returnsafeElem??newXElement(key);}privatestringGetAttributeValue(XAttributeattrib){returnattrib==null?"N/A":attrib.Value;}varelem=GetSafeElem(elem,"hdhdhddh");stringfoo=GetAttributeValue(e.Attri

html - 如何在 XSLT 中处理 HTML 实体 nbsp。不改变输入文件

我正在尝试使用XSLT(使用Oxygen9.0进行转换)将HTML文件转换为XML文件。当我使用HTML文件配置和运行XSLT转换时,Oxygen输出引用了实体“nbsp”,但未声明。我的输入html文件是: sometext注意:我想知道如何仅使用XSLT处理该实体,我不想对输入文件进行任何更改。 最佳答案 您可以使用XML实体来创建定义nbsp的XML文件实体,并包含(损坏的)XML片段。例如,假设您的片段保存为名为“invalid.xml”的文件 sometext像这样创建一个XML文件:]>&invali

html - XPath 和 XQuery 可以处理 HTML 文档吗?

我从https://stackoverflow.com/a/39560454听说HTML文档不是XML文档.XPath和XQuery处理XML文档。他们可以处理HTML文档吗?为什么?虽然我不知道为什么,我猜XPath可以在HTML文档上工作,因为https://www.quora.com/Why-do-we-use-XPath-in-Selenium-even-though-CSS-Selector-is-faster和https://html-agility-pack.net/ 最佳答案 XQuery和XPath被定义为在称为X

java - 使用 Java 和 JavaScript 处理消息 : JSON or XML?

我目前正在从事一个需要一些服务器-客户端通信的项目。我们计划在服务器端使用Websockets和Java服务器(Jetty)。因此,发送的消息必须使用来自服务器的Java和来自客户端的JavaScript进行解释。现在我们正在考虑协议(protocol)以及消息应该具有的结构。我们已经有一个使用XML消息的引用实现。但由于JSON旨在与JavaScript一起使用,我们也在考虑使用JSON字符串的可能性。消息将包含由XML字符串和处理此数据所需的一些元信息组成的数据(即将其存储在数据库中,重定向到其他客户端...)。如果消息的处理(解析和创建)在服务器端和客户端都能够轻松快速地进行,这

xml - 处理格式错误的 XML

这个问题在这里已经有了答案:Howtoparseinvalid(bad/notwell-formed)XML?(4个答案)关闭3年前。我正在处理perl中格式错误的XML,它是由我无法更改的上游进程生成的(似乎这是这里的常见问题)。但是,据我所知,XML仅以一种特定方式存在格式错误:它的属性值包含未转义的小于号,例如:我将perl与XML::LibXML一起使用解析,当然,这会产生解析错误。我试过使用recover选项,它允许我进行解析,但它在遇到第一个解析错误时就停止了,所以我就这样丢失了数据。似乎我有两个一般选择:在解析输入XML之前修复它,也许使用正则表达式。寻找更宽容的XML解

xml - 我可以使用 Scala 的内置 xml 处理程序忽略无效的 XML 字符吗?

我有一个xml文件(来自联邦政府的data.gov),我试图用scala的xml处理程序读取它。valloadnode=scala.xml.XML.loadFile(filename)显然,存在无效的xml字符。是否可以选择忽略无效字符?还是我唯一的选择是先清理它?org.xml.sax.SAXParseException:AninvalidXMLcharacter(Unicode:0x12)wasfoundintheelementcontentofthedocument.Ruby的nokogiri能够用无效字符解析它。 最佳答案