草庐IT

dataframe

全部标签

python - 向 MultiIndex DataFrame/Series 添加一行

我想知道是否有一种等效的方法可以将行添加到带有MultiIndex的Series或DataFrame中,就像使用单个索引一样,即使用.ix或.loc?我认为自然的方式应该是这样的row_to_add=pd.MultiIndex.from_tuples()df.ix[row_to_add]=my_row但这会引发KeyError。我知道我可以使用.append(),但我会发现使用.ix[]或.loc[]更简洁。举个例子:>>>df=pd.DataFrame({'Time':[dt.datetime(2013,2,3,9,0,1),dt.datetime(2013,2,3,9,0,1)],

python - Pandas ,将多列的多个功能应用于groupby对象

我想将多列的多个函数应用到一个groupby对象,从而产生一个新的pandas.DataFrame。我知道如何分步完成:by_user=lasts.groupby('user')elapsed_days=by_user.apply(lambdax:(x.elapsed_time*x.num_cores).sum()/86400)running_days=by_user.apply(lambdax:(x.running_time*x.num_cores).sum()/86400)user_df=elapsed_days.to_frame('elapsed_days').join(runn

python - 使用时间戳列表选择由 DatetimeIndex 索引的 Pandas DataFrame 的子集

我有一只PandasDataFrameDatetimeIndex:3425100entries,2011-12-0100:00:00to2011-12-3123:59:59Datacolumns:sig_qual3425100non-nullvaluesheave3425100non-nullvaluesnorth3425099non-nullvalueswest3425097non-nullvaluesdtypes:float64(4)我选择了DataFrame的一个子集使用.ix[start_datetime:end_datetime]然后我将其传递给peakdetectfunct

Python Pandas,将 DataFrame 写入固定宽度文件(to_fwf?)

我看到Pandas有read_fwf,但它有类似DataFrame.to_fwf的东西吗?我正在寻找对字段宽度、数值精度和字符串对齐的支持。DataFrame.to_csv似乎没有这样做。numpy.savetxt可以,但我不想这样做:numpy.savetxt('myfile.txt',mydataframe.to_records(),fmt='someformat')这似乎是错误的。非常感谢您的想法。 最佳答案 直到有人implements这在Pandas中,你可以使用tabulate包裹:importpandasaspdfro

python - 如何更改 Pandas 数据框中的特定行标签?

我有一个数据框,例如:012345041.022.09.04.02.01.016.01.02.01.01.01.024.02.04.01.00.01.031.02.01.01.01.01.045.01.00.01.00.01.0511.45.63.21.60.81.0最后一行包含平均值。我想将最后一行标签重命名为"A"以便数据框看起来像这样:012345041.022.09.04.02.01.016.01.02.01.01.01.024.02.04.01.00.01.031.02.01.01.01.01.045.01.00.01.00.01.0A11.45.63.21.60.81.0我

python - 将具有属性和边的节点从 DataFrame 加载到 NetworkX

我是使用Python处理图形的新手:NetworkX。到目前为止,我一直在使用Gephi。那里的标准步骤(但不是唯一可能的)是:从表格/电子表格加载节点信息;其中一列应该是ID,其余列是关于节点的元数据(节点是人,所以性别,组......通常用于着色)。喜欢:id;NormalizedName;Genderper1;Jesús;maleper2;Abraham;maleper3;Isaac;maleper4;Jacob;maleper5;Judá;maleper6;Tamar;female...然后也从表/电子表格加载边,使用与通常有四列(目标、源、权重和类型)的节点电子表格的列ID中

python - 使用 pandas 将索引列添加到 DataFrame

我是pandas的初学者,在研究了文档之后,我仍然找不到一种直接的方法来执行以下操作。我有一个带有pandas.DateRange索引的DataFrame,我想添加一个包含相同DateRange的部分值的列。假设我有dfAB2010-01-0100:00:000.3407170.7024322010-01-0101:00:000.6499700.4117992010-01-0102:00:000.9323670.1080472010-01-0103:00:000.0519420.5263182010-01-0104:00:000.5183010.0578092010-01-0105:0

python - 对 pandas DataFrame 中的空值使用 None 而不是 np.nan

我有一个包含混合数据类型的pandasDataFrame。我想用None替换所有空值(而不是默认的np.nan)。出于某种原因,这似乎几乎是不可能的。实际上我的DataFrame是从csv中读入的,但这里有一个简单的DataFrame混合数据类型来说明我的问题。df=pd.DataFrame(index=[0],columns=range(5))df.iloc[0]=[1,'two',np.nan,3,4]我做不到:>>>df.fillna(None)ValueError:mustspecifyafillmethodorvalue也不是:>>>df[df.isnull()]=NoneT

pandas dataframe获取所有行名称与列名称

1.获取dataframe行名称pandas中,dataframe获取行名称,可以有如下两种方式。defcheck_rows():data={'name':['a','a','a','b','b','c','c','c'],'s1':[1,2,3,4,5,6,7,8],'s2':[0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8]}df=pd.DataFrame(data)row_index=df.indexprint("row_indexis:",row_index)print("type(row_index)is:",type(row_index))rows_f1=df.in

python - DataFrames 的点箱线图

Pandas中的数据框有一个boxplot方法,但是有什么方法可以在Pandas中创建dot-boxplots,或者以其他方式使用seaborn?点箱线图是指在图中显示实际数据点(或它们的相关样本)的箱线图,例如就像下面的例子(在R中获得)。 最佳答案 有关OP问题的更准确答案(使用Pandas):importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltdata=pd.DataFrame({"A":np.random.normal(0.8,0.2,20),"B":np.r