dataframe_草庐IT

python - 在 Pandas 的多列上应用自定义函数

我在Pandas中“应用”自定义函数时遇到问题。当我测试该函数时，直接传递它起作用的值并正确返回响应。但是，当我尝试以这种方式传递列值时deffeez(rides,plan):pmt4=200inc4=50#numberridesincludedmin_rate4=4ifplan=="4Plan":ifrides>inc4:fee=((rides-inc4)*min_rate4)+pmt4else:fee=pmt4return(fee)else:return0.1df['fee'].apply(feez(df.total_rides,df.plan_name))我收到错误:“Serie

自定多列 code section rides python pandas function dataframe apply

python - 将相同的随机值分配给 python Dataframe 中的 A-B , B-A 对

我有一个类似的数据框SouDes1314232431324142我需要为0和1之间的每一对分配随机值，但必须为两个相似的对(如“1-3”、“3-1”和其他对)分配相同的随机值。我期待一个像这样的结果数据框SouDesVal130.1140.6230.9240.5310.1320.9410.6420.5如何在pythonpandas中分配相同的随机值相似对，如“A-B”和“B-A”。最佳答案让我们首先创建一个按axis=1排序的助手DF:In[304]:x=pd.DataFrame(np.sort(df,axis=1),df.in

python 配给 section code pre pandas dataframe

python - pandas:规范化 DataFrame

我在扁平化文件中输入了数据。我想通过将这些数据拆分成表格来规范化这些数据。我可以用pandas巧妙地做到这一点吗-也就是说，通过将扁平化数据读入DataFrame实例，然后应用一些函数来获得生成的DataFrame实例？例子:数据以CSV文件的形式在磁盘上提供给我，如下所示:ItemIdClientIdPriceQuotedItemDescription1110scrollofSneak1212scrollofSneak1313scrollofSneak222500scrollofInvisible242200scrollofInvisible我想创建两个DataFrame:ItemI

DataFrame python scroll code ItemId pandas database-normalization

python - 有条件地将 HDF5 文件读取到 pandas DataFrame

我有一个巨大的HDF5文件，我想将其中的一部分加载到pandasDataFrame中以执行一些操作，但我有兴趣过滤一些行。我可以用一个例子更好地解释:原始HDF5文件看起来像这样:ABCD10341120321531352241341551319103415212911303415411214503415103213213415etcetcetcetc我想做的是将它原封不动地加载到pandasDataframe，但只是whereA==1or3or4到目前为止，我可以使用以下方法加载整个HDF5:store=pd.HDFStore('Resutls2015_10_21.h5')df=pd

DataFrame python code 39 pre pandas hdf5

python - 将 pandas dataframe 列从十六进制字符串转换为 int

我有一个非常大的数据框，我想避免遍历每一行，并希望将整个列从十六进制字符串转换为int。它不能使用astype正确处理字符串，但单个条目没有问题。有没有办法告诉astype数据类型是base16？IN:importpandasaspddf=pd.DataFrame(['1C8','0C3'],columns=['Command0'])df['Command0'].astype(int)OUT:ValueError:invalidliteralforint()withbase10:'1C8'这可行，但要避免行迭代。forindex,rowindf.iterrows():print(row

进制 dataframe code section Command0 python python-3.x pandas hex

python - Pandas 切片多索引数据框

我想对多索引pandas数据帧进行切片这里是获取我的测试数据的代码:importpandasaspdtestdf={'Name':{0:'H',1:'H',2:'H',3:'H',4:'H'},'Division':{0:'C',1:'C',2:'C',3:'C',4:'C'},'EmployeeId':{0:14,1:14,2:14,3:14,4:14},'Amt1':{0:124.39,1:186.78,2:127.94,3:258.35000000000002,4:284.77999999999997},'Amt2':{0:30.0,1:30.0,2:30.0,3:30.0,4:

多索 python 39 code image pandas dataframe pivot-table multi-index

python - pandas 中的新列 - 通过应用列表 groupby 将系列添加到数据框

给出以下dfIdotherconcat0Az11Ay22Bx33Bw44Bv55Bu6我想要新列的结果，分组值作为列表Idotherconcatnew0Az1[1,2]1Ay2[1,2]2Bx3[3,4,5,6]3Bw4[3,4,5,6]4Bv5[3,4,5,6]5Bu6[3,4,5,6]这类似于这些问题:groupingrowsinlistinpandasgroupbyReplicatingGROUP_CONCATforpandas.DataFrame但是，它会应用您从df.groupby('Id')['concat'].apply(list)获得的分组，这是一个Series小于数据

groupby python 39 code concat pandas dataframe group-concat pandas-groupby

python - Pandas DataFrame 条形图，按其他列排序值

我有一个Pandas数据框。我想用条形图绘制两列的值，条形图按另一列对值进行排序。例如，我想按列a_b(列a和b的总和)对值进行降序排序。另外，xlabel旋转了，我想修复一下。我们将不胜感激。importpandasaspd%matplotlibinlinea=pd.Series([4,8,6,7,8,3,9,7])b=pd.Series([3,6,8,3,4,6,10,4])a_b=a+bdf=pd.concat([a,b,a_b],axis=1,join='inner')df.columns=['a','b','c']df[['a','b']].sort_values(by='a

条形 DataFrame code section 39 python pandas matplotlib plot

python - 正在解决试图在 DataFrame 的切片副本上设置值

我收到以下警告:SettingWithCopyWarning:AvalueistryingtobesetonacopyofaslicefromaDataFrame在下一行:df3[['prod_tags_0','prod_tags_1','prod_tags_2','prod_tags_3']].fillna(0,inplace=True)我该如何解决这个警告？最佳答案 df3[['prod_tags_0','prod_tags_1','prod_tags_2','prod_tags_3']]创建一个新数据帧，它是df3的一个子集

DataFrame python prod_tags prod tags pandas

python - 将具有多个参数的函数传递给 DataFrame.apply

假设我有一个这样的数据框:df=pd.DataFrame([['foo','x'],['bar','y']],columns=['A','B'])AB0foox1bary当涉及到数据帧时，我知道如何将单个参数函数与Apply一起使用，如下所示:defsome_func(row):return'{0}-{1}'.format(row['A'],row['B'])df['C']=df.apply(some_func,axis=1)dfABC0fooxfoo-x1barybar-y当涉及多个输入参数时，如何在数据帧上应用？这是我想要的示例:defsome_func(row,var1):ret

数传递给 code 39 section python function pandas multiple-arguments