草庐IT

dataframe

全部标签

python - Pandas 使用什么规则来生成 View 和副本?

我对Pandas在确定从数据框中选择的内容是原始数据框的副本还是原始数据框的View时使用的规则感到困惑。如果我有,例如,df=pd.DataFrame(np.random.randn(8,8),columns=list('ABCDEFGH'),index=range(1,9))我知道query会返回一个副本,这样类似foo=df.query('2对原始数据帧df没有影响。我也明白标量或命名切片返回一个View,以便对这些进行分配,例如df.iloc[3]=70或df.ix[1,'B':'E']=222将改变df。但是当涉及到更复杂的情况时,我会迷路。例如,df[df.C改变了df,但

python - Pandas 使用什么规则来生成 View 和副本?

我对Pandas在确定从数据框中选择的内容是原始数据框的副本还是原始数据框的View时使用的规则感到困惑。如果我有,例如,df=pd.DataFrame(np.random.randn(8,8),columns=list('ABCDEFGH'),index=range(1,9))我知道query会返回一个副本,这样类似foo=df.query('2对原始数据帧df没有影响。我也明白标量或命名切片返回一个View,以便对这些进行分配,例如df.iloc[3]=70或df.ix[1,'B':'E']=222将改变df。但是当涉及到更复杂的情况时,我会迷路。例如,df[df.C改变了df,但

python - 如何创建两个 Pandas DataFrame 列的字典

组织以下Pandas数据框的最有效方法是什么:数据=PositionLetter1a2b3c4d5e进入像alphabet[1:'a',2:'b',3:'c',4:'d',5:'e']这样的字典? 最佳答案 In[9]:pd.Series(df.Letter.values,index=df.Position).to_dict()Out[9]:{1:'a',2:'b',3:'c',4:'d',5:'e'}速度比较(使用Wouter方法)In[6]:df=pd.DataFrame(randint(0,10,10000).reshape(

python - 如何创建两个 Pandas DataFrame 列的字典

组织以下Pandas数据框的最有效方法是什么:数据=PositionLetter1a2b3c4d5e进入像alphabet[1:'a',2:'b',3:'c',4:'d',5:'e']这样的字典? 最佳答案 In[9]:pd.Series(df.Letter.values,index=df.Position).to_dict()Out[9]:{1:'a',2:'b',3:'c',4:'d',5:'e'}速度比较(使用Wouter方法)In[6]:df=pd.DataFrame(randint(0,10,10000).reshape(

python - 使用 sklearn 缩放的 pandas 数据框列

我有一个带有混合类型列的pandas数据框,我想将sklearn的min_max_scaler应用于某些列。理想情况下,我想在适当的位置进行这些转换,但还没有找到一种方法来做到这一点。我编写了以下有效的代码:importpandasaspdimportnumpyasnpfromsklearnimportpreprocessingscaler=preprocessing.MinMaxScaler()dfTest=pd.DataFrame({'A':[14.00,90.20,90.95,96.27,91.21],'B':[103.02,107.26,110.35,114.23,114.68

python - 使用 sklearn 缩放的 pandas 数据框列

我有一个带有混合类型列的pandas数据框,我想将sklearn的min_max_scaler应用于某些列。理想情况下,我想在适当的位置进行这些转换,但还没有找到一种方法来做到这一点。我编写了以下有效的代码:importpandasaspdimportnumpyasnpfromsklearnimportpreprocessingscaler=preprocessing.MinMaxScaler()dfTest=pd.DataFrame({'A':[14.00,90.20,90.95,96.27,91.21],'B':[103.02,107.26,110.35,114.23,114.68

python - Pandas :索引数据框时的多个条件 - 意外行为

我正在按两列中的值过滤数据框中的行。由于某种原因,OR运算符的行为与我期望AND运算符的行为相似,反之亦然。我的测试代码:df=pd.DataFrame({'a':range(5),'b':range(5)})#let'sinsertsome-1valuesdf['a'][1]=-1df['b'][1]=-1df['a'][3]=-1df['b'][4]=-1df1=df[(df.a!=-1)&(df.b!=-1)]df2=df[(df.a!=-1)|(df.b!=-1)]print(pd.concat([df,df1,df2],axis=1,keys=['originaldf','u

python - Pandas :索引数据框时的多个条件 - 意外行为

我正在按两列中的值过滤数据框中的行。由于某种原因,OR运算符的行为与我期望AND运算符的行为相似,反之亦然。我的测试代码:df=pd.DataFrame({'a':range(5),'b':range(5)})#let'sinsertsome-1valuesdf['a'][1]=-1df['b'][1]=-1df['a'][3]=-1df['b'][4]=-1df1=df[(df.a!=-1)&(df.b!=-1)]df2=df[(df.a!=-1)|(df.b!=-1)]print(pd.concat([df,df1,df2],axis=1,keys=['originaldf','u

python - 查找每行具有最大值的列名

我有一个像这样的DataFrame:CommunicationsandSearchBusinessGeneralLifestyle00.7457630.0508470.1186440.08474600.3333330.0000000.5833330.08333300.6170210.0425530.2978720.04255300.4358970.0000000.4102560.15384600.3589740.0769230.4102560.153846我想获取每行具有最大值的列名。想要的输出是这样的:CommunicationsandSearchBusinessGeneralLif

python - 查找每行具有最大值的列名

我有一个像这样的DataFrame:CommunicationsandSearchBusinessGeneralLifestyle00.7457630.0508470.1186440.08474600.3333330.0000000.5833330.08333300.6170210.0425530.2978720.04255300.4358970.0000000.4102560.15384600.3589740.0769230.4102560.153846我想获取每行具有最大值的列名。想要的输出是这样的:CommunicationsandSearchBusinessGeneralLif