很多关于此的问题,但找不到适合这种数据格式的解决方案。感谢您提供有关如何解析此内容的建议:所需的字段显然是c('hansard_id','id','fromdate','todate','name')。为了读入和解析我尝试了以下方法:require(XML)>indata=htmlParse('data.xml',isHTML=F)>class(indata)[1]"XMLInternalDocument""XMLAbstractDocument">print(indata)>xmlToDataFrame(indata,stringsAsFactors=F)name123读取正常,但x