草庐IT

dataframe

全部标签

python - 计算表中每 x 行的平均值并创建新表

我有一个长数据表(约200行乘50列),我需要创建一个代码来计算每两行和表中每一列的平均值,最终输出是一个新表的平均值。这在Excel中显然很疯狂!我使用python3并且我知道一些类似的问题:here,here和here.但是这些都没有帮助,因为我需要一些优雅的代码来处理多个列并生成一个有组织的数据表。顺便说一句,我的原始数据表是使用pandas导入的,并被定义为数据框,但在pandas中找不到简单的方法。非常感谢您的帮助。表格的一个例子(短版)是:abcd2502526411384463316258372725102848321247354514816716121630182239

python - 计算表中每 x 行的平均值并创建新表

我有一个长数据表(约200行乘50列),我需要创建一个代码来计算每两行和表中每一列的平均值,最终输出是一个新表的平均值。这在Excel中显然很疯狂!我使用python3并且我知道一些类似的问题:here,here和here.但是这些都没有帮助,因为我需要一些优雅的代码来处理多个列并生成一个有组织的数据表。顺便说一句,我的原始数据表是使用pandas导入的,并被定义为数据框,但在pandas中找不到简单的方法。非常感谢您的帮助。表格的一个例子(短版)是:abcd2502526411384463316258372725102848321247354514816716121630182239

pandas合并dataframe

本文不使用“列”,“行”这样的方式描述合并。为了更加形象,采用“左右”,“上下”这样的措辞1.appendappend()函数用于将其他dataframe的行添加到给定dataframe的末尾,即上下连接,并返回一个新的dataframe对象。新列和新单元格将插入到原始DataFrame中,并用NaN值填充。df1=pd.DataFrame({"x":[15,25,37,42],"y":[24,38,18,45]})df2=pd.DataFrame({"x":[15,25,37],"y":[24,38,45]})df=df1.append(df2)print('****************

python - Pandas : Proper way to set values based on condition for subset of multiindex dataframe

我不确定如何在没有链式分配的情况下执行此操作(这可能无论如何都行不通,因为我要设置一个副本)。我不想获取多索引pandas数据帧的子集,测试小于零的值并将它们设置为零。例如:df=pd.DataFrame({('A','a'):[-1,-1,0,10,12],('A','b'):[0,1,2,3,-1],('B','a'):[-20,-10,0,10,20],('B','b'):[-200,-100,0,100,200]})df[df['A']给予In[37]:dfOut[37]:ABabab0-10-20-2001-11-10-10020200310310100412-120200这

python - Pandas : Proper way to set values based on condition for subset of multiindex dataframe

我不确定如何在没有链式分配的情况下执行此操作(这可能无论如何都行不通,因为我要设置一个副本)。我不想获取多索引pandas数据帧的子集,测试小于零的值并将它们设置为零。例如:df=pd.DataFrame({('A','a'):[-1,-1,0,10,12],('A','b'):[0,1,2,3,-1],('B','a'):[-20,-10,0,10,20],('B','b'):[-200,-100,0,100,200]})df[df['A']给予In[37]:dfOut[37]:ABabab0-10-20-2001-11-10-10020200310310100412-120200这

python - 混淆重新 : pandas copy of slice of dataframe warning

我查看了一堆与此问题相关的问题和答案,但我仍然发现我在我不期望的地方收到了切片警告的副本。此外,它出现在以前对我来说运行良好的代码中,这让我想知道某种更新是否可能是罪魁祸首。例如,这是一组代码,我所做的只是将Excel文件读入pandasDataFrame,并减少df中包含的列集[[]]语法。izmir=pd.read_excel(filepath)izmir_lim=izmir[['Gender','Age','MC_OLD_M>=60','MC_OLD_F>=60','MC_OLD_M>18','MC_OLD_F>18','MC_OLD_18>M>5','MC_OLD_18>F>5

python - 混淆重新 : pandas copy of slice of dataframe warning

我查看了一堆与此问题相关的问题和答案,但我仍然发现我在我不期望的地方收到了切片警告的副本。此外,它出现在以前对我来说运行良好的代码中,这让我想知道某种更新是否可能是罪魁祸首。例如,这是一组代码,我所做的只是将Excel文件读入pandasDataFrame,并减少df中包含的列集[[]]语法。izmir=pd.read_excel(filepath)izmir_lim=izmir[['Gender','Age','MC_OLD_M>=60','MC_OLD_F>=60','MC_OLD_M>18','MC_OLD_F>18','MC_OLD_18>M>5','MC_OLD_18>F>5

python - 获取值是 Pandas 数据框中的值的列名

我试图在每个时间戳处查找数据框中的列名,其值与同一时间戳的时间序列中的列名匹配。这是我的数据框:>>>dfcol5col4col3col2col11979-01-0100:00:001181.220328912.154923648.848635390.986156138.1858611979-01-0106:00:001190.724461920.767974657.099560399.395338147.7613521979-01-0112:00:001193.414510918.121482648.558837384.632475126.2543421979-01-0118:00:

python - 获取值是 Pandas 数据框中的值的列名

我试图在每个时间戳处查找数据框中的列名,其值与同一时间戳的时间序列中的列名匹配。这是我的数据框:>>>dfcol5col4col3col2col11979-01-0100:00:001181.220328912.154923648.848635390.986156138.1858611979-01-0106:00:001190.724461920.767974657.099560399.395338147.7613521979-01-0112:00:001193.414510918.121482648.558837384.632475126.2543421979-01-0118:00:

python - 将 Json 文件读取为 Pandas Dataframe 错误

我有一个如下的Json文件。这是一个字典列表。[{"city":"ab","trips":4,"date":"2014-01-25","value":4.7,"price":1.1,"request_date":"2014-06-17","medium":"iPhone","%price":15.4,"type":true,"Weekly_pct":46.2,"avg_dist":3.67,"avg_price":5.0},{"city":"bc","trips":0,"date":"2014-01-29","value":5.0,"price":1.0,"request_date":