草庐IT

python - 通过放大设置 DataFrame 值

我有两个DataFrames(带有DatetimeIndex),我想用第二帧(较新的)的数据更新第一帧(较旧的)。对于旧框架中已包含的行,新框架可能包含更新的数据。在这种情况下,旧帧中的数据应该被新帧中的数据覆盖。此外,较新的框架可能比第一个框架具有更多的列/行。在这种情况下,旧框架应该被新框架中的数据放大。Pandasdocs状态,那个“.loc/.ix/[]操作可以在为该轴设置不存在的键时执行放大”和“DataFrame可以通过.loc在任一轴上放大”但是这似乎不起作用并抛出一个KeyError。示例:In[195]:df1Out[195]:ABC2015-07-0912:00:0

python - Pandas - 等效的 SQL case 语句

注意:除了megajoin然后计算日期之间的差异之外,寻求一些有效方法的帮助我有包含国家ID和日期的table1(这些值没有重复项),我想总结table2信息(包含国家、日期、cluster_x和count变量,其中cluster_x是cluster_1、cluster_2、cluster_3),以便table1已将集群ID的每个值和来自table2的汇总计数附加到它,其中datefromtable2发生在table1中的日期之前30天内。我相信这在SQL中很简单:HowtodothisinPandas?selecta.date,a.country,sum(casewhena.date

python - 如何计算 Pandas 数据框中连续行之间的差异?

我有一个数据框df,包含三列:count_a、count_b和date;计数是float,日期是2015年的连续天数。我正在尝试找出count_a和count_b列中每一天的计数之间的差异—也就是说,我正在尝试计算每一天之间的差异这两列的行和前一行。我已将日期设置为索引,但我无法弄清楚如何执行此操作;有一些关于使用pd.Series和pd.DataFrame.diff的提示,但我没有找到适用的答案或说明集。我有点卡住了,希望能在这里得到一些指导。这是我的数据框的样子:df=pd.Dataframe({'count_a':{Timestamp('2015-01-0100:00:00'):

python - 更改 pandas datetime64 列的时间组件

我有一个可以简化为的数据框:dateid002/04/201502:341106/04/201512:342209/04/201523:033312/04/201501:004415/04/201507:125521/04/201512:596629/04/201517:337704/05/201510:448806/05/201511:129910/05/201508:52101012/05/201514:19111119/05/201519:22121227/05/201522:31131301/06/201511:09141404/06/201512:57151510/06/20

python - Pandas 数据框条件 .mean() 取决于特定列中的值

我正在尝试创建一个新列,它返回同一df中现有列的值的平均值。但是,应根据其他三个列中的分组来计算平均值。Out[184]:YEARdaytypehourtypescenariooption_value02015SATof_h00.13449912015SUNof_h163.01925022015WDof_h252.11351632015WDpk_h343.12651342015SATof_h456.431392当“YEAR”、“daytype”和“hourtype”相似时,我基本上想要一个新列“mean”来计算“optionvalue”的平均值。我尝试了以下方法但没有成功......I

TFS 2015.3发行管理更新发布说明事实之后

是否可以在创建版本后更新版本的描述?看来创建它时有一次机会,但是如果您错过了它,则无法在之后添加/更新描述。本地TFS2015更新3。看答案您无法在TFS中更新版本的描述。此功能可在VisualStudio团队服务上获得。

python bson.errors.InvalidDocument : Cannot encode object: datetime. 日期 (2015, 3, 1)

我有以下功能:#thisisinamodulecalled'dbw_lib'defdateTimeOuput(start_days_back,end_days_back):start_delta=datetime.timedelta(days=start_days_back)end_delta=datetime.timedelta(days=end_days_back)start_date=datetime.date.today()-start_deltaend_date=datetime.date.today()-end_deltareturnstart_date,end_dated

Python/Pandas - 将类型从 pandas period 转换为 string

我有一个数据框:SeasonalDate2014-12-1.0897442015-01-0.2836542015-020.1589742015-030.461538我在DataFrame中使用了pd.to_period,所以它的索引变成了Pandasperiod类型(type'pandas._period.Period')。现在,我想将该索引转换为字符串。我正在尝试应用以下内容:df.index=df.index.astype(str)但是这不起作用...ValueError:CannotcastPeriodIndextodtype|S0我的代码从那时起就被卡住了。紧急求救

python - 从 Pandas 系列中删除零行

我有一个数字Pandas系列,其中601行按日期索引,如下所示。值在某个点之前为零,之后所有值都不为零。这一点因每个系列而异,但我想要一种方法来删除所有值为零的行,同时保持日期索引的完整性。Name:users,dtype:float64dates2015-08-1714:29:59-04:00182015-08-1614:29:59-04:0032015-08-1514:29:59-04:00112015-08-1414:29:59-04:00122015-08-1314:29:59-04:0082015-08-1214:29:59-04:00102015-08-1114:29:59

python - 按组在日期范围内高效的 p​​andas 滚动聚合 - Python 2.7 Windows - Pandas 0.19.2

我正在尝试找到一种有效的方法来在给定分组和日期范围的情况下在pandas中生成滚动计数或总和。最终,我希望能够添加条件,即。评估“类型”字段,但我还没有到那儿。我已经写了一些东西来完成工作,但我觉得可能有更直接的方法来达到预期的结果。我的pandas数据框目前看起来像这样,所需的输出放在最后一列“rolling_sales_180”中。namedateamountrolling_sales_1800David2015-01-01100100.01David2015-01-05500600.02David2015-05-3050650.03David2015-07-2550100.04R