pandas-loc_草庐IT

python - Pandas - 用空的 python dict 对象替换 DataFrame 中的所有 NaN 值

我有一个pandasDataFrame，其中每个单元格都包含一个python字典。>>>data={'Q':{'X':{2:2010},'Y':{2:2011,3:2009}},'R':{'X':{1:2013}}}>>>frame=DataFrame(data)>>>frameQRX{2:2010}{1:2013}Y{2:2011,3:2009}NaN我想用一个空的字典替换NaN，以获得这个结果:QRX{2:2010}{1:2013}Y{2:2011,3:2009}{}但是，因为fillna函数不是将空字典解释为标量值，而是解释为列-->值的映射，所以如果我只是这样做，它什么也不做(

python - 在 pandas 和 numpy 中聚合 lambda 函数

下面有一个聚合语句:data=data.groupby(['type','status','name']).agg({'one':np.mean,'two':lambdavalue:100*((value>32).sum()/reading.mean()),'test2':lambdavalue:100*((value>45).sum()/value.mean())})我继续遇到关键错误。我已经能够让它适用于一个lambda函数，但不能适用于两个。最佳答案您需要在data中指定要聚合其值的列。例如，data=data.group

python pandas code 39 value numpy lambda

python - 如何将每行加一的简单计数器列添加到 Pandas DataFrame？

我经常遇到这个问题。如果您在Pandas中有一个现有的DataFrame，并且您想要添加一个只是增加计数的行，即。0、1、2...，最有效的方法是什么？谢谢!山姆最佳答案最简单的方法可能是df=df.reset_index()这将为您提供一个从0开始的新索引。你也可以这样做df['counter']=range(len(df)) 关于python-如何将每行加一的简单计数器列添加到PandasDataFrame？，我们在StackOverflow上找到一个类似的问题：

加一 DataFrame section code 山姆 python pandas

python - 将列添加到包含先前数据平均值的 Pandas DataFrame 的末尾

我有一个包含以下内容的DataFrameave_data:ave_dataTimeF7F8F900:00:0043.005593-56.50974625.27127101:00:0055.114918-59.17385231.84926202:00:0063.990762-64.69949252.426017我想在此数据框中添加另一列，其中包含每行F7、F8和F9列下的平均值。ave_dataDataFrame可能会随着我的代码稍后从不同的Excel文件中读取而改变大小，因此该方法需要是通用的(即添加包含平均值的列始终作为DataFrame中的最后一列，不在第4列中)desiredou

末尾 DataFrame code section 00 python pandas calculated-columns

python Pandas : how to find rows in one dataframe but not in another?

假设我有两个表:people_all和people_usa，它们具有相同的结构，因此具有相同的主键。我怎样才能得到不在美国的人的表格？在SQL中，我会做类似的事情:selecta.*frompeople_allaleftouterjoinpeople_usauona.id=u.idwhereu.idisnullPython的等价物是什么？我想不出将这个where语句翻译成pandas语法的方法。我能想到的唯一方法是在people_usa中添加一个任意字段(例如people_usa['dummy']=1)，进行左连接，然后只取“dummy”所在的记录'是nan，然后删除虚拟字段-这看起来

dataframe another people code people_usa python pandas

python - Pandas - 将列值拆分为新列

我有一个很大的数据框，我存储了很多冗余值，这使得我很难处理我的数据。我有以下形式的数据框:importpandasaspddf=pd.DataFrame([["a","g","n1","y1"],["a","g","n2","y2"],["b","h","n1","y3"],["b","h","n2","y4"]],columns=["meta1","meta2","name","data"])>>>dfmeta1meta2namedataagn1y1agn2y2bhn1y3bhn2y4我在name中有我想要的新列的名称，在data中有相应的数据。我想生成以下形式的数据框:df=pd.

python Pandas 34 code meta dataframe

python - 将 HTML 表放入 pandas Dataframe，而不是 dataframe 对象列表

如果此问题已在其他地方得到回答，我深表歉意，但我未能在这里或其他地方找到满意的答案。我对python和pandas比较陌生，在将HTML数据导入pandas数据框时遇到了一些困难。在pandas文档中它说.read_html()返回一个数据框对象列表，所以当我尝试进行一些数据操作以摆脱一些样本时，我得到了一个错误。这是我读取HTML的代码:df=pd.read_html('http://espn.go.com/nhl/statistics/player/_/stat/points/sort/points/year/2015/seasontype/2',header=1)然后我尝试清理它

Dataframe section pandas code python html-parsing

python Pandas : drop rows of a timeserie based on time range

我有以下时间序列:start=pd.to_datetime('2016-1-1')end=pd.to_datetime('2016-1-15')rng=pd.date_range(start,end,freq='2h')df=pd.DataFrame({'timestamp':rng,'values':np.random.randint(0,100,len(rng))})df=df.set_index(['timestamp'])我想删除这两个时间戳之间的行:start_remove=pd.to_datetime('2016-1-4')end_remove=pd.to_datetime

timeserie python code remove section pandas

python - 如何将 pandas 数据框中的时间戳转换为 datetime.date？

我需要在日期上将2个pandas数据框合并在一起，但它们目前具有不同的日期类型。1是时间戳(从excel导入)，另一个是datetime.date。有什么建议吗？我试过pd.to_datetime().date但这只适用于单个项目(例如df.ix[0,0])，它赢了让我应用于整个系列(例如df['mydates'])或数据框。最佳答案我得到了一位同事的帮助。这似乎解决了上面发布的问题pd.to_datetime(df['mydates']).apply(lambdax:x.date())

datetime python section code date pandas

python - Pandas:从保留其顺序的 2D numpy 数组创建数据框

假设您有3个numpy数组:lat、lon、val:importnumpyasnplat=np.array([[10,20,30],[20,11,33],[21,20,10]])lon=np.array([[100,102,103],[105,101,102],[100,102,103]])val=np.array([[17,2,11],[86,84,1],[9,5,10]])假设您想创建一个pandas数据框，其中df.columns=['lat','lon','val']，但由于每个值inlat与long和val数量相关联，您希望它们出现在同一行中。此外，您希望每列的行顺序遵循每个

python Pandas code section lat arrays numpy dataframe