草庐IT

WPE_FOOTER_HTML

全部标签

python - 使用 XPATH 处理格式错误的 HTML 文件

我继承了别人的(糟糕的)代码库,目前正拼命地尝试修复问题。今天,这意味着收集我们模板/主页中所有无效链接的列表。我目前在Python中使用ElementTree,尝试使用xpath解析站点。不幸的是,似乎html格式不正确,ElementTree不断抛出错误。是否有更多错误友好的xpath解析器?有没有办法在非严格模式下运行ElementTree?是否有任何其他方法,例如预处理,可以用来帮助这个过程? 最佳答案 LXML可以解析一些格式错误的HTML,实现ElementTreeAPI的扩展版本,并支持XPath:>>>fromlxm

html - 将 'embedded' XML 文档转换为 XSLT (1.0) 中的 CDATA 输出

给定一个像这样的输入XML文档:Thiscontainsan'embedded'HTMLdocumentHTMLDOCHelloWorld我如何提取“内部”HTML文档;将其呈现为CDATA并包含在我的输出文档中?因此输出文档将是一个HTML文档;其中包含一个将元素显示为文本的文本框(因此它将显示内部文档的“源View”)。我试过这个:但这只会渲染文本节点。我试过这个:]]>但这逃避了实际的XSLT,我得到:<xsl:value-ofselect="*"/>我试过这个:[...]这确实插入了一个CDATA部分,但输出仍然只包含文本(剥离的元素):MydocTitle:Thi

html - 使用 ColdFusion 函数 XMLFormat() 时如何转义 HTML 字符实体?

我有以下HTMLblock:Thequickbrownfoxjumpsoverthelazydog—Thequickbrownfoxjumpsoverthelazydog.Thequickbrownfoxjumpsoverthelazydog—Thequickbrownfoxjumpsoverthelazydog.Thequickbrownfoxjumpsoverthelazydog—Thequickbrownfoxjumpsoverthelazydog.它不是有效的XHTML。但是,我需要将此HTML包含在XML文档中。我尝试使用XMLFormat

java - 在 eclipse 中突出显示 html 标签(打开/结束)

我想在使用光标选择结束/打开时启用打开/结束html标记的突出显示-也就是说,如果您有以下示例:......当把光标放在开始标签div1旁边时,我想让这个div的结束标签高亮显示,当把光标放在div1的结束标签旁边时>此div的打开标记被突出显示。如何启用此功能? 最佳答案 General>Editors>TextEditors>Annotations然后找到“匹配标签”并在那里更改颜色。 关于java-在eclipse中突出显示html标签(打开/结束),我们在StackOverflo

html - 在 PowerShell 管道中有选择地格式化数据并输出为 HTML 的技术

假设您想对powershell的某些表格输出进行一些奇特的格式化,目标是html(用于网络服务器,或通过电子邮件发送)。例如,假设您希望某些数值具有不同的背景颜色。任何。我可以想到两种可靠的编程方式来实现这一点:输出XML并使用XSLT进行转换,或者输出HTML并使用CSS进行装饰。XSLT可能是两者中较难的一个(我这么说是因为我不知道),但据我所知,它的好处是能够为上述花哨的选择嵌入选择标准(xpath?)格式化。另一方面,CSS需要帮助。如果您希望对某个单元格进行特殊处理,那么您需要使用类、id或类似的东西将它与它的sibling区分开来。PowerShell本身并没有真正做到这一

xml - JSF 2 - 如何在 HTML 输出中保留 XML 实体定义?

我正在开发一个JSF2网络应用程序。如果我定义一个如下开头的小面:]>当呈现为HTML时,实体定义已被删除。如果我真的希望它们包含在输出标记中,有没有办法保留它们? 最佳答案 我不知道您是否也可以编写一个新的渲染器,但我在响应XML结果时遇到了类似的问题。在我的例子中,我获取了BackingBean中的HttpOutputStream并编写了XML。也许如果您跳过我示例中的关闭和ctx.responseComplete(),JSF通常会在流中写入他的响应。FacesContextctx=FacesContext.getCurrent

php - Word XML 到 HTML(备选方案)

我的公司使用基于模式的XML标记创建Word文档,然后将它们转换为html,将它们放入MySQL数据库中,并使用PHP将它们加载到Web上。问题是,我们一直在使用Word2003。新版本的office不再允许使用XML标记保存。此外,WordML和VML中的垃圾代码太多,导致页面无法在Chrome、Firefox或Safari中正确显示。是否有更好的方法将Word转换为HTML?或者是否有更好的替代方法来替代我们的XML模式使用word? 最佳答案 我认为你最好的选择是使用MSWordapisifwith.NET(如果这允许你将文件

xml - 通过 VBA 和剪贴板将 HTML 复制到 Word 会丢失特殊字符

我想通过VBA将一些HTML格式的数据粘贴到Word。HTML数据是通过将给定的xsl的xml文档转换为适当的html从MSXML获得的,我想将这种转换后的html数据放入保留HTML格式的Word中。我发现将HTML数据导入Word的唯一方法是将它们放入剪贴板。我为此使用了这个函数:http://support.microsoft.com/kb/274326然后使用PasteSpecialIm将其放入Word。总的来说它可以工作但是......问题在于完全畸形的特殊字符(在我的例子中是波兰语变音符号)。根据http://msdn.microsoft.com/en-us/library

html - 我可以使用什么标记将信息存储在 XHTML 文档 HEAD 中,而浏览器会忽略它?

我需要在XHTMLHEAD元素中存储一些任意的XML数据,这些数据将被浏览器忽略。有点像元素版本的“data-*”机制,用于组成您自己的属性。是否有符合标准的方法来执行此操作?编辑:有些人问我为什么要这样做。基本上我正在构建一个处理网页的服务,我希望网页的创建者能够将可选的“提示”传递给该服务以告诉它如何解析页面。我还没有决定具体的提示是什么,所以我想保持相当的灵active。我的代码已经使用JavaJSoup库来解析XHTML,所以我认为如果同一个库可以解析“提示”信息而不是单独解析它会很好。 最佳答案 您是否尝试过将信息放在元元

android - 在 Android 上解析 HTML,主要性能问题

我需要解析大约100kB的HTML数据,这只会导致Android上出现巨大的性能问题。我已经尝试了内置的XML解析器和JTidy。内置的XML解析器给我大约半秒的解析时间,我可以轻松接受。问题是使用XML解析器来解析凌乱的HTML代码不是一个好主意,这不是一个选项。(我尝试过预处理,但它甚至开始提示有效的HTML,所以...)我在谷歌上搜索了一下,有人建议JTidy在将代码传递给XML解析器之前清理代码。这绝对是一场噩梦,使用JTidy进行预处理解析现在大约需要7秒。所以现在我唯一的选择就是正则表达式。你怎么看? 最佳答案 这取决于