Dataframe

python - 为 Pandas 数据框中的两列创建邻接矩阵

我有以下形式的数据框:indexName_AName_B0AdamBen1ChrisDavid2AdamChris3BenChris我想获取Name_A和Name_B的邻接矩阵，即:AdamBenChrisDavidAdam0110Ben0010Chris0001David0000解决这个问题的最pythonic/可扩展的方法是什么？编辑:另外，我知道如果Adam,Ben行在数据集中，那么在其他某个点，Ben,Adam也将在数据集中。最佳答案您可以使用crosstab然后reindex通过union列和索引值:df=pd.cro

邻接 python code pandas section dataframe

python - 如何保存用 'pandas.DataFrame.plot' 创建的图像？

这个问题在这里已经有了答案:Savingplots(AxesSubPlot)generatedfrompythonpandaswithmatplotlib'ssavefig(6个答案)saveapandas.Serieshistogramplottofile(4个答案)关闭2年前。当尝试从“pandas.core.series.Series”对象保存使用“pandas.DataFrame.plot”创建的绘图图像时:%matplotlibinlinetype(class_counts)#pandas.core.series.Seriesclass_counts.plot(kind='b

amp DataFrame section pandas class python plot

python - 将列从一个数据框映射到另一个数据框以创建新列

这个问题在这里已经有了答案:PandasMerging101(8个答案)关闭3年前。我有一个数据框idstoreaddress1100xyz2200qwe3300asd4400zxc5500bnm我有另一个数据框df2serialNostore_codewarehouse1300Land2500Sea3100Land4200Sea5400Land我希望我的最终数据框看起来像:idstoreaddresswarehouse1100xyzLand2200qweSea3300asdLand4400zxcLand5500bnmSea即从一个数据框映射到另一个创建新列

python 一个 section code Land pandas dataframe mapping

python - pandas 使用查询函数检查列是否为空

我有pandas数据框，我想在其上执行带有isnull()或非isnull()条件的查询函数:In[67]:df_data=pd.DataFrame({'a':[1,20,None,40,50]})In[68]:df_dataOut[68]:a01.0120.02NaN340.0450.0如果我使用这个命令:df_data.query('aisnull',engine='python')或者这个命令:df_data.query('aisnull()',engine='python')我得到一个错误:In[75]:df_data.query('aisnull',engine='pytho

python pandas code 39 df_data dataframe null

python - 如何从 Python 中的邻接矩阵创建边列表数据框？

我有一个形式为df,的pandas数据框(将if视为网络中节点的加权邻接矩阵)ABCDA00.50.50B1000C0.8000.2D0010我想获得一个代表边列表的数据框。对于上面的例子，我需要一些形式，edge_list_df,SourceTargetWeight0AB0.51AC0.52AD03BA14BC05BD06CA0.87CB08CD0.29DA010DB011DC1创建它的最有效方法是什么？最佳答案将对角线标记为nan，然后我们堆叠df.values[[np.arange(len(df))]*2]=np.nand

邻接 python section code 0.0 pandas numpy dataframe

python - 在 pandas/python 中，读取存储为字符串的数组

我有一个pandas数据框，其中一列的每个元素都有字符串数组。所以像这样。col1col20120['abc','def']1130['ghi','klm']现在，当我使用to_csv将其存储到csv时，它看起来很好。当我使用from_csv读回它时，我似乎读回了。但是当我分析每个单元格中的值时，数组是'['''''a''b''c'等等。所以本质上它不是将它作为一个数组而是一组字符串来读取。有人可以建议我如何将此字符串转换为数组吗？我的意思是说数组已经像字符串一样存储了'[\'abc\',\'def\']' 最佳答案如其他问题中所

python pandas 39 section code arrays csv dataframe

python - 如何使用名称列表更改 pandas Dataframe 中的列名称？

我一直在尝试使用名称列表更改pandas数据框的列名称。正在使用以下代码:df.rename(columns=list_of_names,inplace=True)但是我每次都遇到类型错误，错误消息是“listobjectisnotcallable”。我想知道为什么会这样？我该怎么做才能解决这个问题？感谢您的帮助。最佳答案你可以用df.columns=['Leader','Time','Score'] 关于python-如何使用名称列表更改pandasDataframe中的列名称？，

列名 Dataframe section strong python pandas numpy

python - 将 statsmodels 摘要对象转换为 Pandas Dataframe

我正在Windows10上使用statsmodels.formula.api(ver0.9.0)进行多元线性回归。拟合模型并使用以下行获取摘要后，我得到摘要对象格式的摘要.X_opt=X[:,[0,1,2,3]]regressor_OLS=sm.OLS(endog=y,exog=X_opt).fit()regressor_OLS.summary()OLSRegressionResults==============================================================================Dep.Variable:yR-squared

statsmodels Dataframe section results python pandas

python - pandas dataframe group year index by decade

假设我有一个索引为每月时间步长的数据框，我知道我可以使用dataframe.groupby(lambdax:x.year)将每月数据分组为每年并应用其他操作。有什么方法可以快速对它们进行分组，比方说按十年分组？感谢任何提示。最佳答案要得到十年，您可以将年份除以10，然后乘以10。例如，如果您从>>>dates=pd.date_range('1/1/2001',periods=500,freq="M")>>>df=pd.DataFrame({"A":5*np.arange(len(dates))+2},index=dates)>>

dataframe python code section gt pandas

python - 如何将列添加到空的 Pandas 数据框中？

我有一个空的dataframe。df=pd.DataFrame(columns=['a'])出于某种原因，我想生成另一个空数据框df2，其中包含两列“a”和“b”。如果我这样做df.columns=df.columns+'b'它不起作用(我将列重命名为“ab”)以下也不是df.columns=df.columns.tolist()+['b']如何向df添加一个单独的列'b'，并且df.emtpy保持True？也无法使用.locdf.loc[:,'b']=None因为它返回Cannotsetdataframewithnodefinedindexandascalar

python Pandas code section pre dataframe

37 38 394041 42 43