草庐IT

DataFrame

全部标签

r - 将 xml 文件转换为 r 数据框

在MacOS10.12.1上使用RStudio1.0.44这是我第一次使用xml文件,我遇到了很多麻烦..我想将我的xml文件转换为如下所示的r数据框:Datehousehouldidmemberidsessionbeginend11/1/154FDYT14A1Q1235494484945311/1/154FDYT14A1Q11010001494534946311/1/154FDYT14A1Q110104754946349468我只想要数据框中的Date、householdid、memberid、session、begin和end。我试过...xmldataframe得到这个...de

xml - 用 R 解析 XML - 总是那么困难吗?

我花了比预期更多的时间将xml传输到dataframe(代码片段同时包含xml和xmlTreeParse以使post更小,整个解决方案在此之后):users=xmlTreeParse(file='',asText=TRUE)XML只是来自stackexchange数据转储的Users表的表示:.....到数据帧的映射就像我映射表一样。这是为我完成工作的代码:require(XML)require(plyr)#insertxmlTreeParseherer=xmlRoot(users)attrs=c('Id','Reputation','CreationDate','DisplayNam

r - 将数据从 xml 转换为 R 数据框

我正在尝试将xml文件转换为数据框,但格式似乎已关闭。我查看了不同的教程,虽然我在使用for循环和浏览已解析文件方面取得了一定的成功,但有人告诉我这个解决方案效率不高。然后我尝试了这段代码:require(XML)parsed但它给出了一个错误:[中的错误(*tmp*,i,names(nodes[[i]]),value=c("\"LL18179\"\"2016/08\"0.32485.43896.59801.2131\"OK\"",:列的重复下标其他代码有效,但格式不是我需要的:require(XML)require(plyr)pldf生成的数据框如下:.idX..i..text.at

python - XML 到 Pandas 数据框

我有一个包含数千行的XML文件,例如:WORD我想将它(所有属性)转换为pandasdataframe。为此,我可以使用漂亮的汤遍历文件并逐行插入值或创建要作为列插入的列表。但是我想知道是否有更多的pythonic方式来完成我所描述的。提前谢谢你。代码示例:x1list=[]x2list=[]forwordinsoup.page.findAll('word'):x1list.append(int(word['x1']))x2list.append(int(word['x2']))df=DataFrame({'x1':x1list,'x2':x2list})

xml - 将xml "rows"加载到R数据表中

我有一些这样的数据:我想要一个如下所示的数据框:firstlastsexheight1MaryJaneFNA2SusanSmithF1683JosephBlackMNA4JessicaJonesFNA我已经走到这一步了:library(XML)xpeople但我终究无法弄清楚如何将列表放入数据框中。我可以让列表成为“正方形”(即填补空白),然后将其放入数据框中:lst但是我有以下问题:数据框被转置first和last是因子,不是chr高度是一个因素,不是数字JosephBlack的名字和姓氏被调换了(这不是什么大问题,因为我的数据通常是一致的,但仍然很烦人)如何获得正确形式的数据框?

python - 将 MS Excel XML 文件读取到 pandas 数据框?

我有一个包含以下元数据的MSExcelXML(2003)文件:我想将其读入Pandas数据框。这样做的好方法是什么?谢谢。 最佳答案 您尝试过Canopypython的pyxll吗?,它被宣传为“PythonforExcelSolution”请检查一下,看看它是否解决了您的问题。 关于python-将MSExcelXML文件读取到pandas数据框?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/q

xml - R中数据框的列表列表

我必须处理一个名为ul的丑陋列表,它看起来像这样:[[1]][[1]]$paramnamevalue"Section""1"[[1]]$paramnamevalue"field""1"[[1]]$paramnamevalue"finalanswer""1"[[1]]$paramnamevalue"points""-0.0"[[2]][[2]]$paramnamevalue"Section""1"[[2]]$paramnamevalue"field""2"[[2]]$paramnamevalue"finalanswer""1"[[2]]$paramnamevalue"points""1.

xml - R:将 XML 数据转换为数据框

对于一项家庭作业,我正在尝试将XML文件转换为R中的数据框。我尝试了很多不同的方法,并且在互联网上搜索了一些想法,但都没有成功。到目前为止,这是我的代码:library(XML)url我得到的输出就像一个巨大的数字向量。我正在尝试将数据组织到一个数据框中,但我不知道如何正确调整我的代码来获得它。 最佳答案 它可能不像XML包那样冗长,但xml2没有内存泄漏并且专注于数据萃取。我使用trimws,它是真正最近添加到R核心的。library(xml2)pgsrecsortags#andthengrabsthe'name'attribut

xml - 如何将 XML 数据转换为 data.frame?

我正在尝试学习R的XML包。我正在尝试从books.xml示例xml数据文件创建一个data.frame。这是我得到的:library(XML)books这些xpathSApply中的每一个都没有让我接近我的意图。应该如何着手构建一个格式良好的数据框架? 最佳答案 通常,我会建议尝试使用xmlToDataFrame()函数,但我相信这实际上相当棘手,因为它一开始就没有很好的结构。我建议使用这个函数:xmlToList(books)一个问题是每本书有多个作者,因此您需要在构建数据框架时决定如何处理这个问题。一旦您决定了如何处理多作者问

python - Pandas Rolling_std with Window 使用所有以前的行数

我想计算每日yield的rolling_std,使用当前行之前的所有记录。如何设置窗口以使用行的滚动计数?例如:在04-04上。我想使用所有行来计算,在04-01我想使用日期小于04-01的所有行。DateDailyStd4/4/2016-0.003087335?4/1/20160.006480923?3/31/2016-0.001553158?3/30/20160.004351748?3/29/20160.009234222? 最佳答案 在pandas0.18中,使用Rolling对象。这是为期2天的滚动标准:df.rolling