草庐IT

xml - 在 XML 中保留原始换行符类型(\r vs\r\n)

我有一个应用程序,我想在其中使用XML文件来存储:(1)文档的原始文本,以及(2)使用字符偏移“指向”原始文本的几个实体。例如:Thisisatest但是,我担心一个潜在的问题——我无法控制输入文档的内容,因此它可能包含“\n”或“\r\n”换行符。然而,XML规范[1]说:TheXMLprocessorMUSTbehaveasifitnormalizedalllinebreaksinexternalparsedentities(includingthedocumententity)oninput,beforeparsing,bytranslatingboththetwo-charac

xml - 调试编码问题(R XML)

有没有办法找出XML文件中的编码问题?我正在尝试用doc解析这样一个文件(我们称它为XML)图书馆R,但编码似乎有问题。xmlInternalTreeParse(doc,asText=TRUE)Error:DocumentlabelledUTF-16buthasUTF-8content.Error:InputisnotproperUTF-8,indicateencoding!Error:Prematureendofdataintag...以及可能过早结束数据的标签列表如下。但是,我很确定本文档中不存在过早的结束。好的,接下来试试:doc后面还有一个标签列表和行号。我检查了这些行,没有发

xmlvalue 与 XMLAttributeValue

我使用以下代码解析了一个XML文件并得到如下结果:url=htmlTreeParse("http://www.appannie.com/app/ios/candy-crush-saga/",useInternalNodes=T)ItemList=getNodeSet(url,"//li/a/@title")>ItemList[[1]]title"AngryBirdsStarWarsHD"attr(,"class")[1]"XMLAttributeValue"[[2]]title"iShuffleBowling2"attr(,"class")[1]"XMLAttributeValue".

xml - R中的属性值错误中不允许未转义的 '<'

我有许多XML格式的“原始”主题数据,我需要将它们读入数据表以处理一些汇总统计数据。我用于测试的程序为我提供了以下输出(文件中一个事件的片段):第一个数据字段“Relation1”的值始终为“”。有没有办法让R将其识别为数据值而不是新属性值的开始?我已经使用XML和XML2R包尝试了很多事情,但最终总是在一长串错误列表的顶部出现错误。 最佳答案 在XML中和>是>如果你不能改变输出过程,你可以写一个过程以文本方式改变文件;我的意思是,逐行读取文件。如果检测到relation1,则更改其后的第一个;之后它应该工作。我无法向您展示这是如

xml - rvest 中的 html 与 XML 中的 htmlParse

如下代码所示,rvest包中的html使用了XML包中的htmlParse。.htmlfunction(x,...,encoding=NULL){parse(x,XML::htmlParse,...,encoding=encoding)}htmlParsefunction(file,ignoreBlanks=TRUE,handlers=NULL,replaceEntities=FALSE,asText=FALSE,trim=TRUE,validate=FALSE,getDTD=TRUE,isURL=FALSE,asTree=FALSE,addAttributeNamespaces=FA

r - 无法从维基百科中抓取表格

我无法理解thisquestion的选定答案.我要抓取的表格是thislistofU.S.statepopulations.library(XML)theurl这是我遇到的错误..Error:failedtoloadexternalentity"http://en.wikipedia.org/wiki/List_of_U.S._states_and_territories_by_population"什么给了?(注意-尽管我正在寻求解决此错误,但如果您能指出一种更简单的获取人口数据的方法,我将不胜感激。) 最佳答案 您的代码没有任何

xml - 使用命名空间在 R 中创建 XML

我正在尝试在R中构建一个如下所示的XML结构。注意默认命名空间、其他命名空间和位于备用命名空间中的内部Name对象:MyLayer这段代码很接近,标签上的命名空间没问题,但根标签中没有默认命名空间:require(XML)makesimple=function(){z=xmlTree("sld",namespaces=list("ogc"="http://www.o.net/ogc","se"="http://www.o.net/se"),attrs=list(version="1.1.0"))z$addNode("layer",close=FALSE)z$setNamespace("

xml - 如何将复杂的 XML 解析为 R 中的长格式数据框

我尝试将XML解析为R数据框。xml.text6001102015000000Equipos.0CR02-1.AE34.405000Equipos.0CR02-1.API160.79400001102015001500Equipos.0CR02-1.AE38.309000Equipos.0CR02-1.API152.800000'library(XML)xml我得到它只适用于一条记录。结果是它创建了一个包含两列(dateTime和field)且只有一行的表。field下方标签之间的所有文本都连接在一起:dateTimefield101102015000000Equipos.0CR02-

xml - R xml树到数据框

我有以下XMLtreelibrary("XML")library("RCurl")url我能够获得一个计划名称数据框和一个操作名称数据框。planname但是将它们放在一个df中(即展平xml树)是行不通的。我尝试了多种方法(参见下面我尝试过的方法和收到的错误消息),但到目前为止没有任何效果。感谢您指出我犯的错误。xmlToDataFrame函数Operation.df1列的重复下标xmlToDF函数根据https://hopstat.wordpress.com/2014/01/14/faster-xml-conversion-to-data-frames/require(XML)xm

xml - 从 Lat Lng 到 Loop 的行驶距离

我有数据框中两个点的纬度和经度。我在R中使用下面的代码来获取行驶距离。library(XML)library(RCurl)latlon2ft但我收到以下错误。ErrorinxpathApply(xmlfile,"//distance")[[1]]:subscriptoutofbounds3xmlChildren(xpathApply(xmlfile,"//distance")[[1]])2xmlValue(xmlChildren(xpathApply(xmlfile,"//distance")[[1]])$value)1latlon2ft(test[i,"origin1"],test[