草庐IT

xpathSApply

全部标签

xml - 使用 xpathSApply、R v3.1.1、XML v3.98-1.1 解析 XML 文件时出现问题

我正在尝试在R中解析以下XML文件:http://reports.ieso.ca/public/GenOutputCapability/PUB_GenOutputCapability_20140517_v24.xml到目前为止,我的脚本非常简单:file每当我运行它时,我的输出只是一个空列表。将此用于其他XML文件,我可以毫无问题地提取值,但对于这个特定文件,我无法提取任何内容。我已经尝试了许多不同的节点、大写字母、使用useInternal=FALSE以及我可以尝试的任何其他组合,但仍然没有成功。例如,我可以使用rootNode[["IMODocBody"]][["Date"]]语法

xml - R,使用 XML 和 xpathSApply 时的正确 xpath 表达式

假设我使用以下表达式解析了一个网站library(XML)url.df_1=htmlTreeParse("http://www.appannie.com/app/android/com.king.candycrushsaga/",useInternalNodes=T)如果我运行下面的代码,xpathSApply(url.df_1,"//div[@class='app_content_section']/h3",function(x)c(xmlValue(x),xmlAttrs(x)[["href"]]))我会在下面-[1]"Description""What'snew"[3]"Perm

xml - 使用 xpathSApply 在 R 中抓取 XML 属性

我正在使用xpathSApply(在XML包中)在R中抓取XML,但无法提取属性。首先,一段相关的XML片段:FancyProduct我已经使用以下方法成功提取了“FancyProduct”(即元素?):Products这花了一些时间(我是n00b),但是文档很好,而且这里有几个我可以利用的已回答问题。我不知道如何拉出“http://www.somesite.com”(属性?)。我推测它涉及将第3项从“xmlValue”更改为“xmlGetAttr”,但我可能会完全放弃。仅供引用(1)在我粘贴的代码片段上方还有2个父级并且(2)这里是缩写的完整代码(我认为不相关但为了完整起见包含在内)