pyhton_Pandas

python - 基于从 Pandas DataFrame 中其他 2 列的值进行条件选择的新列

我有一个包含股票值(value)的DataFrame。看起来像这样:>>>DataOpenHighLowCloseVolumeAdjCloseDate2013-07-0876.9177.8176.8577.04510620077.04当我尝试使用以下if语句创建条件新列时:Data['Test']=Data['Close']ifData['Close']>Data['Open']elseData['Open']我收到以下错误:Traceback(mostrecentcalllast):File"",line1,inData[1]['Test']=Data[1]['Close']ifDa

python - pandas:使用 .loc 选择索引标签数组

考虑这个数据框:df=pd.DataFrame({u'A':{2.0:2.2,7.0:1.4,8.0:1.4,9.0:2.2},u'B':{2.0:7.2,7.0:6.3,8.0:4.4,9.0:5.0}})看起来像这样:AB22.27.271.46.381.44.492.25.0我想获得标签为2和7的索引(数字，不是字符串)df.loc[[2,7]]报错!IndexError:indicesareout-of-bounds但是，df.loc[7]和df.loc[2]工作正常并且符合预期。另外，如果我用字符串而不是数字定义数据帧索引:df2=pd.DataFrame({u'A':{'2

python pandas code 39 section

python - 重新索引 Pandas 数据框多索引的子级别

我有一个时间序列数据框，我想通过试验和测量重新索引它。简化，我有这个:valueTrial1013132423NaN4123534我想把它变成这样:valueTrial1013132420NaN1123034我怎样才能最好地做到这一点？最佳答案就在昨天，杰出的安迪·海登(AndyHayden)将此功能添加到pandas0.13版本中，该版本随时都会发布。参见here对于他添加到文档中的用法示例。如果您愿意从源代码安装pandas的开发版本，您现在就可以使用它。df['Measurements']=df.reset_index()

多索级别 section code pandas python dataframe multi-index

python - 如何将数据框堆叠在一起(Pandas、Python3)

假设我有3个PandasDFDF1WordsScoreTheMan2TheGirl4Df2Words2Score2TheBoy6TheMother7Df3Words3Score3TheSon3TheDaughter4现在，我将它们连接在一起，使其成为一个DF中的6列。一切都很好，但我想知道，是否有一个pandas函数可以将它们垂直堆叠成两列并更改标题？所以要做这样的东西？FamilyMembersScoreTheMan2TheGirl4TheBoy6TheMother7TheSon3TheDaughter4我在这里阅读的所有内容http://pandas.pydata.org/pand

堆叠 Python3 The code section python python-3.x pandas

python - 在 Python 中使用 Pandas 查找每日最大小时数

我试图在我的需求时间序列中找出每天最大需求的时间。我创建了一个数据框，看起来像..power2011-01-0100:00:001015.702011-01-0101:00:001015.702011-01-0102:00:001010.302011-01-0103:00:001010.902011-01-0104:00:001021.102011-01-0105:00:001046.002011-01-0106:00:001054.60...和一个分组系列，使用.max()找到每天的最大值grouped=df.groupby(pd.TimeGrouper('D'))grouped['

小时数 python 2011 01 00 pandas

python - Pandas df.plot 子图上的多个传说？

我之前曾问过一个问题，关于如何在此处的单独子图上绘制pandas数据框中的不同列:Plotmultiplelinesonsubplotswithpandasdf.plot，并得到了很好的答案。现在我正试图最大限度地利用情节上的空间，而传说被证明是一个问题。我想要做的是将3或4个系列放在一个图例上，将其余系列放在另一个图例上，这样我就可以将每个系列放在一个角落里，它们会很好地适合。我尝试使用为matplotlib描述的方法，如下所示:frommatplotlib.pyplotimport*p1,=plot([1,2,3],label="test1")p2,=plot([3,2,1],la

python Pandas code ax1 axes python-2.7 matplotlib

python - Pandas :如何将行中的一列旋转成列

这个问题在这里已经有了答案:HowcanIpivotadataframe?(5个答案)关闭13天前。给定这个数据框:featurescoresearchTerm0a0.534509pizza1b0.586020pizza2c0.588972pizza3a0.566261chinese4b0.572405chinese5c0.489369chinese6a0.499068thai7b0.431068thai8c0.441617thai特征仅限于(a,b,c)我想将数据框转换为:abcsearchTerm0.5345090.5860200.588972pizza0.5662610.5724

python Pandas section code chinese dataframe pivot multiple-columns

python - Pandas : Delete rows based on other rows

我有一个看起来像这样的Pandas数据框:qseqidsseqidqstartqend21125345411503203215045062253008250500我想根据具有这些条件的其他行值删除行:如果另一行(r2)存在相同的sseqid，则必须删除行(r1)和r1[qstart]>r2[qstart]和r1[qend].这对Pandas来说可能吗？最佳答案 df=pd.DataFrame({'qend':[345,320,450,300,500],'qseqid':[2,4,3,6,8],'qstart':[125,150,1

rows python code 39 merged pandas dataframe

python - pandas 如何使用 groupby 在标签中按日期对列进行分组？

我有一个数据框10730行×249列，我有列:Index(['RegionID','Metro','CountyName','SizeRank','1996-04','1996-05','1996-06','1996-07','1996-08','1996-09',...'2015-11','2015-12','2016-01','2016-02','2016-03','2016-04','2016-05','2016-06','2016-07','2016-08'],dtype='object',length=249)所以我需要做的是按季度对列进行分组，从1月到3月Q1，依此类推，直

groupby python 2016 39 code python-3.x pandas dataframe group-by

python - 使用 Pandas 读取数据(.dat 文件)

如何使用Pandas读取以下(两列)数据(来自.dat文件)TIMEXGSM2004006010001376001200400601000232800520040060100032800082004006010004232001120040060100051840017列分隔符(至少)是2个空格。我试过了df=pd.read_table("test.dat",sep="\s+",usecols=['TIME','XGSM'])printdf但是它会打印TIMEXGSM2004620046200462004620046 最佳答案您可

python Pandas 2004 006 code dataframe

28 29 303132 33 34