pyhton_Pandas_草庐IT

python - 将 pandas dataframe 列从十六进制字符串转换为 int

我有一个非常大的数据框，我想避免遍历每一行，并希望将整个列从十六进制字符串转换为int。它不能使用astype正确处理字符串，但单个条目没有问题。有没有办法告诉astype数据类型是base16？IN:importpandasaspddf=pd.DataFrame(['1C8','0C3'],columns=['Command0'])df['Command0'].astype(int)OUT:ValueError:invalidliteralforint()withbase10:'1C8'这可行，但要避免行迭代。forindex,rowindf.iterrows():print(row

进制 dataframe code section Command0 python python-3.x pandas hex

python - 在 Pandas 中设置联盟

我有两列存储在我的数据框中。我想使用快速向量化操作对两列执行集合联合df['union']=df.set1|df.set2但是错误TypeError:unsupportedoperandtype(s)for|:'set'and'bool'阻止我这样做，因为我输入了np.nan在两列中。是否有好的解决方案来克服这个问题？最佳答案对于这些操作，纯Python通常更高效。%timeitpd.Series([set1.union(set2)forset1,set2inzip(df['A'],df['B'])])10loops,besto

中设 python section code set python-3.x numpy pandas vectorization

python - Pandas :df.mul 与 df.rmul

谁能帮我理解这两种方法之间的区别(如果有的话):df.mul和df.rmul？文档看起来相同:docsformuldocsforrmul 最佳答案文档不完全相同。如文档中所述，df.mul(other)等同于df*other，而df.rmul(other)等同于其他*df.这在大多数情况下可能无关紧要，但如果您有一个对象dtype的数据框，其元素具有非交换乘法，这将很重要。也许你写了一个四元数类并用四元数填充了一个数据框。拥有更多Pandas经验的人可能会提出更重要的实际案例。关于p

python Pandas code section

python - 如何停止在 csv 文件末尾写一个空行 - pandas

将数据保存到csv时，data.to_csv('csv_data',sep=',',encoding='utf-8',header=False,index=False)，它创建csv文件末尾的空行。你如何避免这种情况？它与line_terminator有关，默认值为n，表示换行。有没有办法指定line_terminator以避免在末尾创建空行，或者我是否需要读取csv文件，删除空行并保存？不熟悉Pandas。非常感谢您的帮助，在此先致谢! 最佳答案一种方法是使用默认的line_terminator(\n)保存除最后一个条目之外的数

空行末尾 code data section python csv pandas

python - 使用 resample 和 groupby - pandas 计算时间序列的百分位数/四分位数

我有一个每小时值的时间序列，我正在尝试每周/每月得出一些基本统计数据。如果我们使用以下抽象数据框，每一列都是时间序列:rng=pd.date_range('1/1/2016',periods=2400,freq='H')df=pd.DataFrame(np.random.randn(len(rng),4),columns=list('ABCD'),index=rng)printdf[:5]返回:ABCD2016-01-0100:00:001.5215810.1023350.7962710.3170462016-01-0101:00:00-0.369221-0.179821-1.3401

resample groupby 2016 code pandas python group-by resampling quantile

python - Pandas 切片多索引数据框

我想对多索引pandas数据帧进行切片这里是获取我的测试数据的代码:importpandasaspdtestdf={'Name':{0:'H',1:'H',2:'H',3:'H',4:'H'},'Division':{0:'C',1:'C',2:'C',3:'C',4:'C'},'EmployeeId':{0:14,1:14,2:14,3:14,4:14},'Amt1':{0:124.39,1:186.78,2:127.94,3:258.35000000000002,4:284.77999999999997},'Amt2':{0:30.0,1:30.0,2:30.0,3:30.0,4:

多索 python 39 code image pandas dataframe pivot-table multi-index

python - Pandas 箱线图中共享轴的不同 ylim

我有一个分组的pandas箱线图，排列在(2,2)网格中:importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltdf=pd.DataFrame(np.random.rand(140,4),columns=['A','B','C','D'])df['models']=pd.Series(np.repeat(['model1','model2','model3','model4','model5','model6','model7'],20))bp=df.boxplot(by="models",layout=(2,2),fig

中共 python 39 model code pandas matplotlib

python - pandas 中的新列 - 通过应用列表 groupby 将系列添加到数据框

给出以下dfIdotherconcat0Az11Ay22Bx33Bw44Bv55Bu6我想要新列的结果，分组值作为列表Idotherconcatnew0Az1[1,2]1Ay2[1,2]2Bx3[3,4,5,6]3Bw4[3,4,5,6]4Bv5[3,4,5,6]5Bu6[3,4,5,6]这类似于这些问题:groupingrowsinlistinpandasgroupbyReplicatingGROUP_CONCATforpandas.DataFrame但是，它会应用您从df.groupby('Id')['concat'].apply(list)获得的分组，这是一个Series小于数据

groupby python 39 code concat pandas dataframe group-concat pandas-groupby

python - Pandas DataFrame 条形图，按其他列排序值

我有一个Pandas数据框。我想用条形图绘制两列的值，条形图按另一列对值进行排序。例如，我想按列a_b(列a和b的总和)对值进行降序排序。另外，xlabel旋转了，我想修复一下。我们将不胜感激。importpandasaspd%matplotlibinlinea=pd.Series([4,8,6,7,8,3,9,7])b=pd.Series([3,6,8,3,4,6,10,4])a_b=a+bdf=pd.concat([a,b,a_b],axis=1,join='inner')df.columns=['a','b','c']df[['a','b']].sort_values(by='a

条形 DataFrame code section 39 python pandas matplotlib plot

python - Pandas 链索引的替代方案是什么？

我正在上在线类(class)学习python，讲师告诉我们链式索引不是一个好主意。但是，他没能说出是合适的替代方法。假设我有一个Pandas数据框，其中的行索引为['1','2','3']，列的名称为['a','b','c'].除了使用命令df['1']['a']提取在第一行和第一列中找到的值之外，什么是合适的替代方法？最佳答案使用multi-axisindexing，例如df.loc['a','1']当你使用df['1']['a']时，你首先访问的是系列对象s=df['1']，然后访问系列元素s['a']，导致两次__geti

链索 python code section indexing pandas chain