pandas-loc

python - Pandas 滚动标准差

还有其他人在使用pandas中的新rolling.std()时遇到问题吗？弃用的方法是rolling_std()。新方法运行良好，但会产生一个不随时间序列滚动的常数。示例代码如下。如果您交易股票，您可能会认出布林带的公式。我从rolling.std()获得的输出每天跟踪库存，显然没有滚动。这在pandas0.19.1中。任何帮助，将不胜感激。importdatetimeimportpandasaspdimportpandas_datareader.dataaswebstart=datetime.datetime(2012,1,1)end=datetime.datetime(2012,1

python Pandas rolling 39 stocks standard-deviation

python - 将 dict 构造函数转换为 Pandas MultiIndex 数据框

我有很多数据想在Pandas数据框中构建。但是，为此我需要一个多索引格式。PandasMultiIndex功能一直让我感到困惑，而且这次我无法理解它。我按照自己的意愿构建了结构，但由于我的实际数据要大得多，所以我想改用Pandas。下面的代码是dict变体。请注意，原始数据有更多的标签和更多的行。想法是，原始数据包含索引为Task_n的任务的行，该任务已由索引为Participant_n的参与者执行。每行是一个段。即使原始数据没有这种区别，我也想将其添加到我的数据框中。换句话说:Participant_n|Task_n|val|dur--------------------------

MultiIndex python 39 dur val python-3.x pandas dictionary dataframe

python - 如何从 Pandas 中的另一列中减去字符串类型列的值

我有一个这样的数据框dfcol1col2col3AblackberryblackBgreenapplegreenCredwinered我想从col2值中减去col3值，结果看起来像df1col1col2col3AberryblackBapplegreenCwinered如何使用pandas有效地做到这一点最佳答案将listcomprehension与replace和split结合使用:df['col2']=[a.replace(b,'').strip()fora,binzip(df['col2'],df['col3'])]pri

python Pandas 39 col code dataframe

python - numpy 数组中非唯一行的快速组合，映射到列(即快速数据透视表问题，没有 Pandas)

我想知道是否有人可以就以下编码问题提供任何想法或建议，我对快速Python实现特别感兴趣(即避免Pandas)。我有一组(虚拟示例)数据，例如:|User|Day|Place|Foo|Bar|1105TrueFalse1118TrueFalse1119TrueFalse2119TrueFalse2121FalseTrue1122FalseTrue包含2个用户(“user1”和“user2”)在给定日期/地点的数据，其中有2个感兴趣的bool值(此处称为foo和bar)。我只对在同一天同一地点为两个用户记录数据的情况感兴趣。有了这些相关的数据行，然后我想为将用户和foo/bar描述为bo

中非 python code iterID found_iterID arrays pandas numpy vectorization

python - pandas.crosstab 中缺少数据

我正在用pandas制作一些交叉表:a=np.array(['foo','foo','foo','bar','bar','foo','foo'],dtype=object)b=np.array(['one','one','two','one','two','two','two'],dtype=object)c=np.array(['dull','dull','dull','dull','dull','shiny','shiny'],dtype=object)pd.crosstab(a,[b,c],rownames=['a'],colnames=['b','c'])bonetwocdul

crosstab python 39 section dull pandas

python - 尝试删除列时的 Pandas 警告

ItemY1961Y1962Y1963Y1964Y1965Y1966Y1967Y1968\8Wheat212139212221201443217656229353231643216676220347Y1969...Y2004Y2005Y2006Y2007Y2008Y2009Y2010Y2011\8215759...00000000在上面的数据框中，我尝试使用foll删除名为“Item”的列。命令:vals_bel_lux.drop('Item',axis=1,inplace=True)但是，这给了我一个foll。警告:C:\Anaconda64\lib\site-packages\pa

python Pandas code section pre

Python Pandas 使用另一列删除子字符串

我试过四处搜索，但找不到一个简单的方法来做到这一点，所以我希望你的专业知识能有所帮助。我有一个包含两列的Pandas数据框importnumpyasnpimportpandasaspdpd.options.display.width=1000testing=pd.DataFrame({'NAME':['FIRST',np.nan,'NAME2','NAME3','NAME4','NAME5','NAME6'],'FULL_NAME':['FIRSTLAST',np.nan,'FIRSTLAST','FIRSTNAME3','FIRSTNAME4LAST','ANOTHERNAME','

Python Pandas NAME 39 FIRST string replace series

python - Pandas to_sql 给出带有时区感知列的 ValueError

我想使用pandasto_sql在postgresql中存储时区感知列。当时间不受时区感知时，它会起作用times=['201510100222','201510110333']df=pd.DataFrame()df['time']=pd.to_datetime(times)df.time.to_sql('test',engine,if_exists='replace',index=False)但是当我指定UTC时times=['201510100222','201510110333']df=pd.DataFrame()df['time']=pd.to_datetime(times,u

ValueError python 39 section code postgresql pandas sqlalchemy

python - Pandas.dataframe.query() - 获取非空行(Pandas 相当于 SQL : "IS NOT NULL")

我正在使用以下代码从pandas数据框中获取具有某些值的行。我需要将此代码转换为pandas.query()。results=rs_gp[rs_gp['Col1'].notnull()]当我转换为:results=rs_gp.query('Col1!=None')它给了我错误Noneisnotdefined 最佳答案我们可以利用NaN!=NaN的事实:In[1]:np.nan==np.nanOut[1]:False因此将列与自身进行比较将只返回非NaN值:rs_gp.query('Col1==Col1')演示:In[42]:df=

空行 Pandas code section pre python dataframe

python - pandas DataFrame reset_index 可以处理重复的列名？

是否有任何等效于pandas.DataFrame.reset_index()的操作，可以处理列名重复的情况？我希望它丢弃列名并为列返回默认编号索引0,1,2..。(当我有重复的列名时，df.rename或df.reindex_axis等方法不起作用。)示例输入:pd.DataFrame(np.random.rand(5,3),columns=['A','A','B'])AAB00.50.30.910.70.90.320.90.40.830.60.20.940.70.40.6预期输出:01200.80.10.210.40.20.420.30.30.430.40.10.841.00.90.

列名 reset_index code section python pandas dataframe duplicates reindex

66 67 686970 71 72