草庐IT

Pandas-Datareader

全部标签

python - Pandas 如何使用 pd.cut()

这是片段:test=pd.DataFrame({'days':[0,31,45]})test['range']=pd.cut(test.days,[0,30,60])输出:daysrange00NaN131(30,60]245(30,60]我很惊讶0不在(0,30]中,我该怎么做才能将0归类为(0,30]? 最佳答案 test['range']=pd.cut(test.days,[0,30,60],include_lowest=True)print(test)daysrange00(-0.001,30.0]131(30.0,60.0

python - Pandas 如何使用 pd.cut()

这是片段:test=pd.DataFrame({'days':[0,31,45]})test['range']=pd.cut(test.days,[0,30,60])输出:daysrange00NaN131(30,60]245(30,60]我很惊讶0不在(0,30]中,我该怎么做才能将0归类为(0,30]? 最佳答案 test['range']=pd.cut(test.days,[0,30,60],include_lowest=True)print(test)daysrange00(-0.001,30.0]131(30.0,60.0

python - 基于 Pandas 范围的 bin 值

这个问题在这里已经有了答案:Binningacolumnwithpandas(3个回答)关闭2年前。我在一个文件夹中有多个具有类似值的CSV文件:GroupID.csv是文件名。有多个这样的文件,但值范围是在同一个XML文件中定义的。我正在尝试将它们分组我该怎么做?更新1:根据BobHaffner的评论,我已经这样做了importpandasaspdimportglobpath=r'path/to/files'allFiles=glob.glob(path+"/*.csv")frame=pd.DataFrame()list_=[]forfile_inallFiles:df=pd.rea

python - 基于 Pandas 范围的 bin 值

这个问题在这里已经有了答案:Binningacolumnwithpandas(3个回答)关闭2年前。我在一个文件夹中有多个具有类似值的CSV文件:GroupID.csv是文件名。有多个这样的文件,但值范围是在同一个XML文件中定义的。我正在尝试将它们分组我该怎么做?更新1:根据BobHaffner的评论,我已经这样做了importpandasaspdimportglobpath=r'path/to/files'allFiles=glob.glob(path+"/*.csv")frame=pd.DataFrame()list_=[]forfile_inallFiles:df=pd.rea

python - Pandas 测量自条件以来耗时

我有以下数据框:TimeWork2018-12-0110:00:00Off2018-12-0110:00:02On2018-12-0110:00:05On2018-12-0110:00:06On2018-12-0110:00:07On2018-12-0110:00:09Off2018-12-0110:00:11Off2018-12-0110:00:14On2018-12-0110:00:16On2018-12-0110:00:18On2018-12-0110:00:20Off我想创建一个新列,其中包含设备开始工作以来耗时。TimeWorkElapsedTime2018-12-0110:

python - Pandas 测量自条件以来耗时

我有以下数据框:TimeWork2018-12-0110:00:00Off2018-12-0110:00:02On2018-12-0110:00:05On2018-12-0110:00:06On2018-12-0110:00:07On2018-12-0110:00:09Off2018-12-0110:00:11Off2018-12-0110:00:14On2018-12-0110:00:16On2018-12-0110:00:18On2018-12-0110:00:20Off我想创建一个新列,其中包含设备开始工作以来耗时。TimeWorkElapsedTime2018-12-0110:

python - Python/Pandas 中的 R/ifelse 等价物?比较字符串列?

我的目标是比较两列并添加结果列。R使用ifelse但我需要知道pandas的方式。R>head(mau.payment)log_monthuser_idinstall_monthpayment12013-0612013-04022013-0622013-04032013-0632013-0414994>mau.payment$user.typehead(mau.payment)log_monthuser_idinstall_monthpaymentuser.type12013-0612013-040existing22013-0622013-040existing32013-06320

python - Python/Pandas 中的 R/ifelse 等价物?比较字符串列?

我的目标是比较两列并添加结果列。R使用ifelse但我需要知道pandas的方式。R>head(mau.payment)log_monthuser_idinstall_monthpayment12013-0612013-04022013-0622013-04032013-0632013-0414994>mau.payment$user.typehead(mau.payment)log_monthuser_idinstall_monthpaymentuser.type12013-0612013-040existing22013-0622013-040existing32013-06320

python - Pandas : Proper way to set values based on condition for subset of multiindex dataframe

我不确定如何在没有链式分配的情况下执行此操作(这可能无论如何都行不通,因为我要设置一个副本)。我不想获取多索引pandas数据帧的子集,测试小于零的值并将它们设置为零。例如:df=pd.DataFrame({('A','a'):[-1,-1,0,10,12],('A','b'):[0,1,2,3,-1],('B','a'):[-20,-10,0,10,20],('B','b'):[-200,-100,0,100,200]})df[df['A']给予In[37]:dfOut[37]:ABabab0-10-20-2001-11-10-10020200310310100412-120200这

python - Pandas : Proper way to set values based on condition for subset of multiindex dataframe

我不确定如何在没有链式分配的情况下执行此操作(这可能无论如何都行不通,因为我要设置一个副本)。我不想获取多索引pandas数据帧的子集,测试小于零的值并将它们设置为零。例如:df=pd.DataFrame({('A','a'):[-1,-1,0,10,12],('A','b'):[0,1,2,3,-1],('B','a'):[-20,-10,0,10,20],('B','b'):[-200,-100,0,100,200]})df[df['A']给予In[37]:dfOut[37]:ABabab0-10-20-2001-11-10-10020200310310100412-120200这