草庐IT

sample_dataframe

全部标签

python - DataFrame中列之间的相关性

我对pandas很陌生,所以我想我做错了什么-我有一个数据框:ab00.50.7510.50.7520.50.7530.50.7540.50.75df.corr()给我:abaNaNNaNbNaNNaN但是np.correlate(df["a"],df["b"])给出:1.875这是为什么呢?我想为我的DataFrame获得相关矩阵,并认为corr()可以做到这一点(至少根据文档)。为什么返回NaN?正确的计算方法是什么?非常感谢! 最佳答案 np.correlate计算(未标准化)cross-correlation两个一维序列之间

python - 如何从对象为 datetime.time 类型的 Pandas DataFrame.Index 中添加/减去时间(小时、分钟等)?

我有一个索引只是datetime.time的DataFrame,并且DataFrame.Index和datetime.time中没有方法可以改变时间。datetime.time已替换,但仅适用于系列的个别项目?下面是使用的索引示例:In[526]:dfa.index[:5]Out[526]:Index([21:12:19,21:12:20,21:12:21,21:12:21,21:12:22],dtype='object')In[527]:type(dfa.index[0])Out[527]:datetime.time 最佳答案 L

python - 如何从对象为 datetime.time 类型的 Pandas DataFrame.Index 中添加/减去时间(小时、分钟等)?

我有一个索引只是datetime.time的DataFrame,并且DataFrame.Index和datetime.time中没有方法可以改变时间。datetime.time已替换,但仅适用于系列的个别项目?下面是使用的索引示例:In[526]:dfa.index[:5]Out[526]:Index([21:12:19,21:12:20,21:12:21,21:12:21,21:12:22],dtype='object')In[527]:type(dfa.index[0])Out[527]:datetime.time 最佳答案 L

python - 从 Pandas DataFrame 绘制条形图

假设我有一个如下所示的DataFrame:Hour|V1|V2|A1|A20|15|13|25|371|26|52|21|452|18|45|45|253|65|38|98|14我正在尝试创建一个条形图以按Hour比较列V1和V2。当我这样做时:importmatplotlib.pyplotaspltax=df.plot(kind='bar',title="Vcomp",figsize=(15,10),legend=True,fontsize=12)ax.set_xlabel("Hour",fontsize=12)ax.set_ylabel("V",fontsize=12)我得到一个带

python - 从 Pandas DataFrame 绘制条形图

假设我有一个如下所示的DataFrame:Hour|V1|V2|A1|A20|15|13|25|371|26|52|21|452|18|45|45|253|65|38|98|14我正在尝试创建一个条形图以按Hour比较列V1和V2。当我这样做时:importmatplotlib.pyplotaspltax=df.plot(kind='bar',title="Vcomp",figsize=(15,10),legend=True,fontsize=12)ax.set_xlabel("Hour",fontsize=12)ax.set_ylabel("V",fontsize=12)我得到一个带

python - 是否可以在不先列出列表的情况下将 Series 附加到 DataFrame 行?

我有一些数据正试图组织到Pandas中的DataFrame中。我试图使每一行成为Series并将其附加到DataFrame。我找到了一种方法,方法是将Series附加到空list然后转换Series的list到DataFrame例如DF=DataFrame([series1,series2],columns=series1.index)这个list到DataFrame的步骤似乎是多余的。我在这里查看了一些示例,但没有一个Series保留了Series中的Index标签以将它们用作列标签。列是id_names而行是type_names的路很长:是否可以在不先创建列表的情况下将Series

python - 是否可以在不先列出列表的情况下将 Series 附加到 DataFrame 行?

我有一些数据正试图组织到Pandas中的DataFrame中。我试图使每一行成为Series并将其附加到DataFrame。我找到了一种方法,方法是将Series附加到空list然后转换Series的list到DataFrame例如DF=DataFrame([series1,series2],columns=series1.index)这个list到DataFrame的步骤似乎是多余的。我在这里查看了一些示例,但没有一个Series保留了Series中的Index标签以将它们用作列标签。列是id_names而行是type_names的路很长:是否可以在不先创建列表的情况下将Series

python - 获取满足条件的 Pandas DataFrame 行的整数索引?

我有以下数据框:abcb21235456如您所见,列b用作索引。我想获得满足('b'==5)的行的序号,在本例中为1。被测试的列可以是索引列(如本例中的b)或常规列,例如我可能想找到满足('c'==6).的行的索引 最佳答案 使用Index.get_loc而是。重用@unutbu的设置代码,您将获得相同的结果。>>>importpandasaspd>>>importnumpyasnp>>>df=pd.DataFrame(np.arange(1,7).reshape(2,3),columns=list('abc'),index=pd.

python - 获取满足条件的 Pandas DataFrame 行的整数索引?

我有以下数据框:abcb21235456如您所见,列b用作索引。我想获得满足('b'==5)的行的序号,在本例中为1。被测试的列可以是索引列(如本例中的b)或常规列,例如我可能想找到满足('c'==6).的行的索引 最佳答案 使用Index.get_loc而是。重用@unutbu的设置代码,您将获得相同的结果。>>>importpandasaspd>>>importnumpyasnp>>>df=pd.DataFrame(np.arange(1,7).reshape(2,3),columns=list('abc'),index=pd.

python - 如何在 pandas DataFrame 中按列设置 dtypes

我想将一些数据带入pandasDataFrame,并且我想在导入时为每一列分配dtypes。我希望能够为具有许多不同列的较大数据集执行此操作,但是,例如:myarray=np.random.randint(0,5,size=(2,2))mydf=pd.DataFrame(myarray,columns=['a','b'],dtype=[float,int])mydf.dtypes结果:TypeError:datatypenotunderstood我尝试了其他一些方法,例如:mydf=pd.DataFrame(myarray,columns=['a','b'],dtype={'a':in