草庐IT

pandas-datareader

全部标签

python - Pandas Dataframe 到嵌套 JSON

我正在尝试将PandasDataframe转换为JSON对象。我的数据框包含以下格式的数据:studentdategradecourse0Student_12017-06-2593ENGLISH1Student_22017-06-2583ENGLISH2Student_12017-06-2593MATH3Student_22017-06-2583MATH4Student_12017-06-2690MATH5Student_22017-06-2685MATH6Student_12017-06-2696ENGLISH7Student_22017-06-2699ENGLISH我想将其转换为以

python - 我需要从 pandas DataFrame 对象中创建一个 python 列表对象或任何对象,将来自不同行的值片段分组

我的DataFrame在第一列有一个字符串,在第二列有一个数字:GEOSTRINGIDactivity9wydm2p01uk0fd2z210wydm86pg6r3jyrg211wydm2p01uk0fd2z212wydm80xfxm9j22v239wydm9w92j538xze440wydm8km72gbyuvf441wydm86pg6r3jyrg442wydm8mzt874p1v5443wydm8mzmpz5gkt8544wydm86pg6r3jyrg545wydm8w1q8bjfpcj546wydm8w1q8bjfpcj5我想做的是操纵这个DataFrame以获得一个包含字符串的列

python - 在 pandas to_html 中格式化输出数据

我使用pandas的to_html生成输出文件,当数据写入文件时,它们在小数点后有很多数字。pandas的to_htmlfloat_format方法可以限制数字,但是当我使用'float_format'时如下:DataFormat.to_html(header=True,index=False,na_rep='NaN',float_format='%10.2f')它引发了一个异常:typeError:'str'objectisnotcallable如何解决这个问题? 最佳答案 来自to_html文档:float_format:one

python - Pandas :.groupby().size() 和百分比

我有一个源自df.groupby().size()操作的DataFrame,看起来像这样:LocalizationRNAlevelcytoplasm1Non-expressed72Verylow133Low84Medium65Moderate86High27Veryhigh6cytoplasm&nucleus1Non-expressed52Verylow83Low24Medium105Moderate166High67Veryhigh5cytoplasm&nucleus&plasmamembrane1Non-expressed62Verylow33Low34Medium75Modera

python - 将 Pandas 中的各个列对齐到_latex

我正在使用pandasto_latex方法将数据帧转换为Latextabular。我没有看到更改生成的表格的对齐字段的选项。例如,我有一个如下所示的数据框:In[46]:dfOut[46]:NumberofdaysTuplesDistinctTuples16229700587413001632049759929302164153655992138216510256903149161665127647744116725425431171681269871288我的输出表如下所示:In[50]:printdf.to_latex(index=None)\begin{tabular}{lll}

python - 在 Pandas 中重命名 "None"值

这可能非常简单,但我就是找不到答案。我使用GeoPandas从形状文件导入数据。将其转换为pandasDataFrame。我有一个包含三个字母代码和None缺失数据值的对象字段。如何在pandas中将None更改为类似“vcv”的内容?我试过了sala.replace(None,"vcv")遇到这个错误2400"stringsorregularexpressions,you"2401"passeda"->2402"{0!r}".format(type(regex).__name__))2403returnself.replace(regex,value,inplace=inplace,

python - 如何在 Pandas 中读取带有行名的数据框的 CSV 文件

我有一个如下所示的CSV文件(tmp.csv):xyzbar0.550.550.0foo0.30.40.1qux0.00.35.55它是用Pandas以这种方式创建的:In[103]:df_dummyOut[103]:xyzbar0.550.550.00foo0.300.400.10qux0.000.305.55In[104]:df_dummy.to_csv("tmp.csv",sep="\t")我想做的是将该CSV读入相同的数据帧表示形式。我试过了,但没有给出我想要的:In[108]:pd.io.parsers.read_csv("tmp.csv",sep="\t")Out[108]

python - 用 Bokeh 绘制整个 pandas DataFrame

我想用Bokeh绘制整个pandasDataFrame。即,我正在寻找相当于第三行的Bokeh:importpandasaspdincome_df=pd.read_csv("income_2013_dollars.csv",sep='\t',thousands=',')income_df.plot(x="year")目前有办法做到这一点,还是我必须分别传递每个y值? 最佳答案 来自Bokeh项目维护者的注释:这个答案指的是一个过时且已弃用的API,该API早已从Bokeh中删除。有关使用现代且完全受支持的BokehAPI创建条形图的

python - ipython笔记本中的 Pandas 子图标题大小

我在ipython笔记本单元格中并排绘制了两个图。但是,我无法更改标题的大小。我可以通过添加参数fontsize=20来更改标签的大小。如何更改df和df2的标题。fig,axes=plt.subplots(ncols=2,figsize=(20,10))df.plot('barh',title='LegalCollectibleAnswerDistribution',fontsize=20,ax=axes[0])df2.plot(kind='pie',autopct='%1.0f%%',legend=False,title='LegalCollectibleAnswerDistrib

python - Pandas:如何在 DataFrame 中按行比较列表的列与 Pandas(不是 for 循环)?

数据框df=pd.DataFrame({'A':[['gener'],['gener'],['system'],['system'],['gutter'],['gutter'],['gutter'],['gutter'],['gutter'],['gutter'],['aluminum'],['aluminum'],['aluminum'],['aluminum'],['aluminum'],['aluminum'],['aluminum'],['aluminum'],['aluminum'],['aluminum','toledo']],'B':[['gutter'],['gutte