dataframe

python - Pandas 和 Rolling_Mean with Offset(平均每日交易量计算)

当我将股票数据从Yahoo提取到数据框中时，我希望能够计算5天的平均交易量，不包括当前日期。有没有办法使用带有偏移量的滚动均值？例如，5天表示不包括当前日期并基于前5天。当我运行下面的代码时r=DataReader("BBRY","yahoo",'2015-01-01','2015-01-31')r['ADV']=pd.rolling_mean(r['Volume'],window=5)它返回5天的交易量，包括当前日期，所以当您查看下面的内容时，1/8具有1/2、1/5、1/6、1/7和1/的平均交易量8.我希望1/9是第一个返回平均交易量的日期，它包含来自1/2、1/5、1/6、1/

Rolling_Mean Rolling 10 2015 01 python pandas dataframe

Python 类型错误 : cannot convert the series to <class 'int' > when trying to do math on dataframe

我有一个看起来像这样的数据框:defaultdict(,{'XYF':TimeUSGyrXGyrYGyrZAccX\02071465700.0008329140.001351716-0.0004189798-0.65118312071866710.0019627870.001242457-0.0001859666-0.642349722072267919.520243E-050.001076498-0.0005664826-0.636041232072464740.00010930590.0016169170.0003615251-0.634287542072862440.001412

amp dataframe code 0.02 39 python pandas

python - 如何在 Python 中创建全零数据框

我想在Python中创建一个包含24列(表示24小时)的数据框，如下所示:columnname0123...24row100000row200000row300000我想知道如何初始化它？将来我可能会添加第4行，全“0”，怎么做？谢谢，最佳答案这里有一个技巧:当DataFrame(或Series)构造函数被传递一个标量作为第一个参数时，这个值被传播:In[11]:pd.DataFrame(0,index=np.arange(1,4),columns=np.arange(24))Out[11]:0123456789...14151

中创零数 section code python pandas dataframe

python - 通过放大设置 DataFrame 值

我有两个DataFrames(带有DatetimeIndex)，我想用第二帧(较新的)的数据更新第一帧(较旧的)。对于旧框架中已包含的行，新框架可能包含更新的数据。在这种情况下，旧帧中的数据应该被新帧中的数据覆盖。此外，较新的框架可能比第一个框架具有更多的列/行。在这种情况下，旧框架应该被新框架中的数据放大。Pandasdocs状态，那个“.loc/.ix/[]操作可以在为该轴设置不存在的键时执行放大”和“DataFrame可以通过.loc在任一轴上放大”但是这似乎不起作用并抛出一个KeyError。示例:In[195]:df1Out[195]:ABC2015-07-0912:00:0

DataFrame python 2015 00 39 pandas

python - 将 Pandas 系列列表转换为数据框

我有一个由列表组成的系列importpandasaspds=pd.Series([[1,2,3],[4,5,6]])我想要一个DataFrame，每列都有一个列表。from_items、from_records、DataFrameSeries.to_frame似乎都不起作用。如何做到这一点？最佳答案正如@Hatshepsut在评论中指出的那样，from_items是deprecatedasofversion0.23.该链接建议改用from_dict，因此可以将旧答案修改为:pd.DataFrame.from_dict(dict(

为数 python code DataFrame pre pandas

python - 遍历 pandas 中的行以检查条件

我在Pandas中有以下DF。+-------+-------+|Col_A|Col_B|+-------+-------+|1234|||6267|||6364|||573|||0|||838|||92|||3221||+-------+-------+Col_B应填充True或False值。默认情况下，它是False，但是当第一个0已经被“看到”时，其余的DF应该是True。DF有超过100000行。自从Col_A中出现第一个“0”值以来，将col_B中的值设置为等于“True”的最快方法是什么？+-------+--------+|Col_A|Col_B|+-------+---

python pandas code False True dataframe

python - 高效地将值从一列替换为另一列 Pandas DataFrame

我有一个像这样的PandasDataFrame:col1col2col310.20.30.320.20.30.3300.40.44000.3500060.10.40.4仅当col1值等于0时，我想用第二列(col2)中的值替换col1值，之后(对于剩余的零值)，再次执行此操作，但使用第三列(col3)。期望的结果是下一个:col1col2col310.20.30.320.20.30.330.40.40.440.300.3500060.10.40.4我使用pd.replace函数完成了它，但它似乎太慢了。我认为必须有一种更快的方法来完成它。df.col1.replace(0,df.col

DataFrame python col 39 col1 pandas replace

python - 在 Pandas 中使用 groupby 来计算一列中与另一列相比的内容

也许groupby是错误的方法。似乎它应该工作，但我没有看到它...我想按结果对事件进行分组。这是我的数据框(df):StatusEventSUCCESSRunSUCCESSWalkSUCCESSRunFAILEDWalk这是我想要的结果:EventSUCCESSFAILEDRun21Walk01我正在尝试制作一个分组对象，但我不知道如何调用它来显示我想要的内容。grouped=df['Status'].groupby(df['Event']) 最佳答案试试这个:pd.crosstab(df.Event,df.Status)Sta

groupby python section Event Status pandas dataframe

python - 用 "sign"数字填充 DataFrame

我有一个充满float(正数和负数)和一些NaN的DataFrame。我想用它的符号替换每个float:如果它是NaN->它仍然是Nan如果为正->替换为1如果为负->替换为-1如果为零->保留为0对进行这种大规模替换有什么建议吗？最佳答案您可以使用np.sign:dfOut[100]:A0-4.012.02NaN30.0importnumpyasnpnp.sign(df["A"])Out[101]:0-1.011.02NaN30.0Name:A,dtype:float64为了应用到所有列，可以直接传递dataframe:dfO

amp DataFrame 1.0 section code python pandas

python - 如何使用 tkinter 提示用户将 DataFrame 保存到 Excel 文件？

我是Python和一般编程的新手。我正在尝试为我编写的一些代码构建一个GUI，这些代码从Excel导入数据，进行一些分析，然后将新数据从DataFrame导出到另一个Excel文件。我以前使用过这段代码，但现在我需要一个提示，询问用户他们想将文件保存到哪里:writer=pd.ExcelWriter("Results.xlsx",engine="xlsxwriter")data.to_excel(writer,index=False,sheet_name="Results")worksheet=writer.sheets["Results"]writer.save()不幸的是，当我使用

DataFrame tkinter 34 self message python excel python-3.x user-interface

30 31 323334 35 36