pandas

python - 将多列连接成一列，同时复制其他列的值

我有以下数据框:DateDVFA1FA2FA3FA422/02/2019200LazardNaNNaNNaN2/02/201950DeutscheOndraNaNNaN22/02/2019120ChinaSecuritiesBallasDaiwaMorganStanley我需要将所有FA列连接成一列，同时还要复制Date和DV列。最终结果如下:DateDVFA22/02/2019200Lazard2/02/201950Deutsche2/02/201950Ondra22/02/2019120ChinaSecurities22/02/2019120Ballas22/02/2019120D

多列 python 2019 section code pandas merge concatenation

python - 当列值匹配时，Pandas Dataframe 从行中替换 Nan

我有数据框，即InputDataframeclasssectionsubmarksschoolcity0IAEng80jghsssalem1IAMat90jghsssalem2IAEng50Nansalem3IIIAEng80gphssNan4IIIAMat45Nansalem5IIIAEng40gphssNan6IIIAEng20gphsssalem7IIIAMat55gphssNan当“class”和“section”列中的值匹配时，我需要替换“school”和“city”中的“Nan”。结果应该是，输入数据框classsectionsubmarksschoolcity0IAEng

Dataframe python salem section gphss python-3.x pandas nan

python - Pandas :生成并绘制平均值

我有一个像这样的Pandas数据框:In[61]:df=DataFrame(np.random.rand(3,4),index=['art','mcf','mesa'],columns=['pol1','pol2','pol3','pol4'])In[62]:dfOut[62]:pol1pol2pol3pol4art0.6615920.4792020.7004510.345085mcf0.2355170.6659810.7787740.610344mesa0.8383960.0356480.4240470.866920我想生成一行，其中包含基准中策略的平均值，然后绘制它。目前，我这样做

python Pandas code 39 pol matplotlib plot

python - Pandas 面板中的 bool 掩码

我在用与DataFrame相同的方式屏蔽面板时遇到了一些问题。我想做的事情感觉很简单，但我还没有找到查看文档和在线论坛的方法。我在下面有一个简单的例子:importpandasimportnumpyasnpimportdatetimestart_date=datetime.datetime(2009,3,1,6,29,59)r=pandas.date_range(start_date,periods=12)cols_1=['AAPL','AAPL','GOOG','GOOG','GS','GS']cols_2=['close','rate','close','rate','close'

python Pandas 2009 nan 03 panel mask

python - Pandas 错误 : 'DataFrame' object has no attribute 'loc'

我是pandas的新手，正在尝试Pandas0.10.1版的Pandas10分钟教程。但是，当我执行以下操作时，出现如下所示的错误。printdf工作正常。为什么.loc不起作用？代码importnumpyasnpimportpandasaspddf=pd.DataFrame(np.random.randn(6,4),index=pd.date_range('20130101',periods=6),columns=['A','B','C','D'])df.loc[:,['A','B']]错误:AttributeErrorTraceback(mostrecentcalllast)in(

amp 39 section code python python-2.7 numpy scipy pandas

python - 从 github python 下载和访问数据

您好，我正在学习Python进行数据分析，我想分析他在书中学习的数据。在第9章中，他使用了以下数据。但是，一旦我将ipython笔记本中的数据下载到我在mac上的github应用程序，我就很难理解如何利用它。库存数据在这里:https://github.com/pydata/pydata-book/blob/master/ch09/stock_px.csv我点击“打开”，在我的github应用程序上下载了一个大文件。它看起来像下面这样。如何让这些数据在我的ipython笔记本中打开？**查看其他stackoverflow问题，我知道我可以下载zip文件，我也正在这样做。知道如何有效地使

python github section code git pandas

python - 在 python 中绘制配置文件命中图

我正在尝试为pandas.DataFrame的两列绘制剖面图。我不希望它直接出现在pandas中，但似乎matplotlib中也没有。我四处搜索，但在rootpy以外的任何包中都找不到它。在我花时间自己写这篇文章之前，我想我会问是否有一个包含配置文件直方图的小包，也许它们以不同的名称为人所知。如果您不知道我所说的“配置文件直方图”是什么意思，请查看ROOT实现。http://root.cern.ch/root/html/TProfile.html 最佳答案您可以使用scipy.stats.binned_statistic轻松完成此

中图 python section means scipy matplotlib pandas histogram

python - Pandas :使用 if-else 填充新列

我有一个像这样的DataFrame:col1col210010000332004如果col2>0或0，我想添加一个为1的列，否则为0。如果我使用R，我会做类似的事情df1[,'col3']0,1,0)我如何在python/pandas中执行此操作？最佳答案您可以将bool系列df.col2>0转换为整数系列(True变为1和False变为0):df['col3']=(df.col2>0).astype('int')(要创建一个新列，您只需为其命名并将其分配给与您的DataFrame长度相同的系列、数组或列表。)这产生col3为:

if-else python code section col pandas if-statement dataframe

python - Pandas 在 Groupby 中重新索引日期

我有一个以零星日期作为索引的数据框，列='id'和'num'。我想pd.groupby'id'列，并将重新索引应用于数据框中的每个组。我的示例数据集如下所示:idnum2015-08-01132015-08-05152015-08-06142015-07-31212015-08-03222015-08-0623使用ffillpd.reindex后我的预期输出是:idnum2015-08-01132015-08-02132015-08-03132015-08-04132015-08-05152015-08-06142015-07-31212015-08-01212015-08-02212

Groupby python 2015 code section pandas reindex

python - 使用已知列值更改 pandas DataFrame 多列中的值

假设我有一个这样的数据框:KnownvalueABCDEFGH17.34130000000033.453400000000我想做的是，当已知值在0-10之间时，A从0变为1。当已知值在10-20之间时，B从0变为1，依此类推。改完之后应该是这样的:KnownvalueABCDEFGH17.34130100000033.453400010000有人知道如何应用一种方法来改变它吗？最佳答案我首先将Knownvalue系列放入一个等于其截断值除以10的整数列表中(例如27.87//10=2)。这些桶表示所需列位置的整数。因为Known

多列已知 Knownvalue code section python pandas

39 40 414243 44 45