草庐IT

column-alias

全部标签

Python Pandas : how to add a totally new column to a data frame inside of a groupby/transform operation

我想在我的数据中标记一些分位数,对于DataFrame的每一行,我希望在一个名为例如的新列中的条目"xtile"来保存这个值。例如,假设我创建一个这样的数据框:importpandas,numpyasnpdfrm=pandas.DataFrame({'A':np.random.rand(100),'B':(50+np.random.randn(100)),'C':np.random.randint(low=0,high=3,size=(100,))})假设我编写了自己的函数来计算数组中每个元素的五分位数。我对此有自己的功能,但例如只需引用scipy.stats.mstats.mquan

Python Pandas : how to add a totally new column to a data frame inside of a groupby/transform operation

我想在我的数据中标记一些分位数,对于DataFrame的每一行,我希望在一个名为例如的新列中的条目"xtile"来保存这个值。例如,假设我创建一个这样的数据框:importpandas,numpyasnpdfrm=pandas.DataFrame({'A':np.random.rand(100),'B':(50+np.random.randn(100)),'C':np.random.randint(low=0,high=3,size=(100,))})假设我编写了自己的函数来计算数组中每个元素的五分位数。我对此有自己的功能,但例如只需引用scipy.stats.mstats.mquan

Python Pandas : Boolean indexing on multiple columns

这个问题在这里已经有了答案:selectingacrossmultiplecolumnswithpandas(3个回答)关闭9年前。尽管至少有twogood关于如何在Python的pandas库中索引DataFrame的教程,我仍然无法找到一种优雅的方式来对多个列进行SELECTing。>>>d=pd.DataFrame({'x':[1,2,3,4,5],'y':[4,5,6,7,8]})>>>dxy014125236347458>>>d[d['x']>2]#Thisworksfinexy236347458>>>d[d['x']>2&d['y']>7]#Ihadexpectedthis

Python Pandas : Boolean indexing on multiple columns

这个问题在这里已经有了答案:selectingacrossmultiplecolumnswithpandas(3个回答)关闭9年前。尽管至少有twogood关于如何在Python的pandas库中索引DataFrame的教程,我仍然无法找到一种优雅的方式来对多个列进行SELECTing。>>>d=pd.DataFrame({'x':[1,2,3,4,5],'y':[4,5,6,7,8]})>>>dxy014125236347458>>>d[d['x']>2]#Thisworksfinexy236347458>>>d[d['x']>2&d['y']>7]#Ihadexpectedthis

python - Pandas : update value if condition in 3 columns are met

我有一个像这样的数据框df:ABCD1blueredsquareNaN2orangeyellowcircleNaN3blackgreycircleNaN我想在满足3个条件时更新D列。例如:df.ix[np.logical_and(df.A=='blue',df.B=='red',df.C=='square'),['D']]='succeed'它适用于前两个条件,但它不适用于第三个条件,因此:df.ix[np.logical_and(df.A=='blue',df.B=='red',df.C=='triangle'),['D']]='succeed'结果完全相同:ABCD1bluered

python - Pandas : update value if condition in 3 columns are met

我有一个像这样的数据框df:ABCD1blueredsquareNaN2orangeyellowcircleNaN3blackgreycircleNaN我想在满足3个条件时更新D列。例如:df.ix[np.logical_and(df.A=='blue',df.B=='red',df.C=='square'),['D']]='succeed'它适用于前两个条件,但它不适用于第三个条件,因此:df.ix[np.logical_and(df.A=='blue',df.B=='red',df.C=='triangle'),['D']]='succeed'结果完全相同:ABCD1bluered

Python Pandas : Convert Rows as Column headers

这个问题在这里已经有了答案:HowcanIpivotadataframe?(5个回答)关闭3年前.我有以下数据框:YearCountrymedalnoofmedals1896AfghanistanGold51896AfghanistanSilver41896AfghanistanBronze31896AlgeriaGold11896AlgeriaSilver21896AlgeriaBronze3我想要这样。YearCountryGoldSilverBronze1896Afghanistan5431896Algeria123Stack/Unstack似乎不起作用。

Python Pandas : Convert Rows as Column headers

这个问题在这里已经有了答案:HowcanIpivotadataframe?(5个回答)关闭3年前.我有以下数据框:YearCountrymedalnoofmedals1896AfghanistanGold51896AfghanistanSilver41896AfghanistanBronze31896AlgeriaGold11896AlgeriaSilver21896AlgeriaBronze3我想要这样。YearCountryGoldSilverBronze1896Afghanistan5431896Algeria123Stack/Unstack似乎不起作用。

python - numpy 数组 : replace nan values with average of columns

我有一个numpy数组,其中大部分填充了实数,但其中也有一些nan值。如何将nan替换为它们所在列的平均值? 最佳答案 不需要循环:print(a)[[0.93230948nan0.477734390.76998063][0.944607790.878824560.796158380.56282885][0.942729340.486152680.06196785nan][0.649402160.74414127nannan]]#Obtainmeanofcolumnsasyouneed,nanmeanisconvenient.col

python - numpy 数组 : replace nan values with average of columns

我有一个numpy数组,其中大部分填充了实数,但其中也有一些nan值。如何将nan替换为它们所在列的平均值? 最佳答案 不需要循环:print(a)[[0.93230948nan0.477734390.76998063][0.944607790.878824560.796158380.56282885][0.942729340.486152680.06196785nan][0.649402160.74414127nannan]]#Obtainmeanofcolumnsasyouneed,nanmeanisconvenient.col