草庐IT

Simple_HTML_DOM

全部标签

c# - 将 HTML 5 文档类型添加到 XDocument (.NET)

像这样为System.Xml.Linq.XDocument创建文档类型时:doc.AddFirst(newXDocumentType("html",null,null,null));生成的保存的XML文件开头为:注意右尖括号前的额外空间。我怎样才能防止这个空间出现?如果可能的话,我想要一个干净的方式:) 最佳答案 如果您写入XmlTextWriter,则不会获得空间:XDocumentdoc=newXDocument();doc.AddFirst(newXDocumentType("html",null,null,null));do

php - 修改 XML 属性 PHP DOM

我有一个看起来像这样的XML文件。SomeInfo我正在寻找用新属性替换上述XML文件中的任何属性的方法,使用PHPDOM和Xpath。非常感谢任何帮助 最佳答案 不确定你到底想做什么,但总体思路是:您必须实例化DOMDocument并加载您的XML字符串:DOMDocument::loadXML然后,您必须实例化DOMXpath在那个文件上并用它来查询文档:DOMXPath::query一旦你找到了你感兴趣的节点,你就可以操纵它例如,您可以设置一个属性的值:DOMElement::setAttribute例如,在这里,您可以使用这

html - 在 Ruby(或 Shell)中漂亮地打印 HTML

有什么方法可以在Mac上通过命令行漂亮地打印HTML或XML字符串?试图在Ruby中做到这一点。有任何想法吗?我考虑过XSLT,也考虑过编写我自己的解析器,但这两者都非常复杂。寻找已经存在的东西。 最佳答案 XML文件xmllint--formatfile.xmlHTML文件xmllint--format--htmlfile.htmlhttp://developer.apple.com/mac/library/documentation/Darwin/Reference/ManPages/man1/xmllint.1.html

python - 如何在 Python 中将来自 Web 的原始 html 转换为可解析的 xml

我认为BeautifulSoup可以做到这一点,但它似乎并没有成功。您已经使用过什么方法,并且长期可靠? 最佳答案 您可以使用lxml库,特别是lxml.html它为您提供了一个ETree对象,然后您可以将其序列化为XML(以及其他).tostring()method.如果这在您的HTML上失败(它太破),您可以使用ElementSoup(BeautifulSoup的扩展)构建一个lxml.html树。 关于python-如何在Python中将来自Web的原始html转换为可解析的xml

java - Java中的XML解析和DOM管理

我需要用java管理xml。只有DOM就足够了...我需要一些非常简单或更好的东西我真的会避免安装新库......Java6中使用的包是什么??我查看了文档,但没有提供任何明确的信息,只是对org中xml的引用,但没有提供任何有用的信息......或者我没有找到它:(谢谢 最佳答案 XMLDOM解析器包含在Java6中。以下是如何使用它的片段:importjavax.xml.parsers.*;importorg.w3c.dom.*;importorg.xml.sax.*;....finalDocumentBuilderFactor

java dom getTextContent() 问题

当我尝试从我的servlet的doGet方法访问我的xml数据时,它只输出不超过空格的值,包括整个值。XML文件:Apartment22BondiJunction1000然后我在doGet中从JavaServlet调用Suburb:Nodesuburb1=doc.getElementsByTagName("Suburb").item(i);out.println("Suburb"+""+suburb1.getTextContent()+"");它只输出“Bondi”而不是“BondiJunction”有人知道为什么吗? 最佳答案 我

javascript - HTML DOM 和 XML DOM 有什么区别

在w3school网站上有两个教程:HTMLDOMXMLDOM我想知道它们之间的关系,因为我认为HTMLDOM是XMLDOM的一种。所以XMLDOM中的方法/属性可以在HTMLDOM中使用,并且HTMLDOM可能拥有一些特殊的方法。但是,当我尝试使用它时:HTML:xxxvara=document.createElement("a");document.getElementById("con").appendChild(a);它在IE中不起作用。所以我想知道问题是什么? 最佳答案 DOM是指用XML制作的树。树由节点组成。例如:te

html - 排除 <!DOCTYPE> 的影响?

什么是描述所使用的HTML版本以外的内容,如果排除在外会有什么后果? 最佳答案 doctype基本上告诉浏览器该页面符合HTML标准。省略文档类型会使某些浏览器(其中最主要的是InternetExplorer)失控并退回到“怪癖模式”,其中HTML元素不会按标准呈现。IntheQuirksmodethebrowsersviolatecontemporaryWebformatspecificationsinordertoavoid“breaking”pagesauthoredaccordingtopracticesthatwerepr

html - 使用 XSLT 识别特定的 XHTML 单元格,并在找到它们后修改它们的属性

我遇到一个问题,我们需要对输入的XHTML文档执行转换,以便更好地在移动设备上显示页面。每个输入文档都有大量带有特定ID的HTML表格。在一个这样的表中,我需要识别一个单元格,以便不仅修改它的“colspan”属性,还修改它两侧单元格的“colspan”属性。我无法修改输入的HTML,这是从外部获取的。我只能改造它。在我尝试转换的每个单元格中,它的左侧和右侧都有一个空白单元格,均具有“colspan=2”属性。我需要使这个中间单元格具有“colspan=4”属性,左侧单元格具有“colspan=1”属性,右侧单元格被删除。我一直在使用XSLT,到目前为止,我的文档已经设法实现了许多其他

java - 如何使用 xsom\dom\jaxb 获取 xsd 的最大深度?

如何使用xsom获取xsd的最大深度。例如:xsd的每个复杂类型下的元素总数?此外,如果在该复杂类型下存在复杂类型,那么该复杂类型下的元素+属性的数量……使用dom\xsom\jaxbCommentdescribingyourrootelement 最佳答案 其实我只是在找这个。我在API中找不到任何东西,所以昨天找到了一种递归方法。我只是将我的递归方式粘贴到最深处并将它们添加到一个Hashmap中。/**Parsesthexmlschemastringintoahashmap*notethathashmaphasaformofat