草庐IT

pandas-datareader

全部标签

python - Pandas 数据框绘图

我有这个PandasDataFrame这给了我这个:我该怎么办制作一个新人物,在图中添加标题“TitleHere”以某种方式创建一个映射,以便标签不是29,30等,而是说“第29周”、“第30周”等。将更大版本的图表保存到我的电脑(比如10x10英寸)我已经为此困惑了一个小时了! 最佳答案 importmatplotlib.pyplotasplt#1,4f=plt.figure(figsize=(10,10))#Changethesizeasnecessary#2dataframe.plot(ax=f.gca())#figure.g

python - 在 Pandas 中将列附加到 HDF 文件的框架

我正在处理CSV格式的大型数据集。我正在尝试逐列处理数据,然后将数据附加到HDF文件中的帧。所有这些都是使用Pandas完成的。我的动机是,虽然整个数据集比我的物理内存大得多,但列大小是可管理的。在稍后阶段,我将通过将列一一加载回内存并对其进行操作来执行特征逻辑回归。我可以制作一个新的HDF文件并用第一列制作一个新的框架:hdf_file=pandas.HDFStore('train_data.hdf')feature_column=pandas.read_csv('data.csv',usecols=[0])hdf_file.append('features',feature_col

python - 在 IPython Notebook 中显示所有 pandas 数据帧

我如何识别在当前笔记本session中创建的所有PandasDataFrames?像在SAS中看到工作库中的所有成员的东西是理想的。谢谢。 最佳答案 解决方案%whoDataFrame说明所有对象...seeingallthemembersintheWorklibrarywouldbeideal.In[1]:a=10b='abs'c=[1,2,3]%who显示所有使用过的名字:In[2]:%whoabc方便地作为列表:In[3]:%who_lsOut[3]:['a','b','c']或者作为具有数据类型的表:In[4]:%whosV

python - 从 pandas 列中删除非 ASCII 字符

一段时间以来,我一直在努力解决这个问题。我试图从DB_user列中删除非ASCII字符,并尝试用空格替换它们。但我不断收到一些错误。这是我的数据框的样子:+-----------------------------------------------------------|DB_usersourcecount|+-----------------------------------------------------------|???/"Ò|Z?)?]??C%??JA10||?D$ZGU;@D??_???T(?)B3||?Q`H??M'?Y??KTK$?Ù‹???ЩJL4??*?

python - 删除 Pandas 中的重复项,不包括一列

这看起来很简单,但我在互联网上找不到任何相关信息。我有一个如下所示的数据框:CityStateZipDateDescriptionEarlhamIA50072-10362014-10-10PostmarketAssurance:DevicesEarlhamIA50072-10362014-10-10Compliance:DevicesMadridIA50156-17482014-09-10DrugQualityAssurance如何消除与5列中的4列匹配的重复项?与Description不匹配的列。结果是CityStateZipDateDescriptionEarlhamIA50072

python - Pandas groupby 最大总和

我正在尝试在Pandas中一起使用groupby、nlargest和sum函数,但无法使其正常工作。StateCountyPopulationAlabamaa100Alabamab50Alabamac40Alabamad5Alabamae1...Wyominga.51180Wyomingb.51150Wyomingc.5156Wyomingd.515我想使用groupby按州选择,然后按人口获得前2个县。然后仅使用前2个县的人口数字来计算该州的总和。最后,我会得到一个包含州和人口(前2个县)的列表。我可以让groupby和nlargest正常工作,但是获取nlargest(2)的总和是

python - Pandas Dataframe 多索引合并

我想问一个关于在pandas中合并多索引数据框的问题,这是一个假设的场景:arrays=[['bar','bar','baz','baz','foo','foo','qux','qux'],['one','two','one','two','one','two','one','two']]tuples=list(zip(*arrays))index1=pd.MultiIndex.from_tuples(tuples,names=['first','second'])index2=pd.MultiIndex.from_tuples(tuples,names=['third','fourt

python - 使用 Pandas 将文本数据从请求对象转换为数据框

我正在使用请求创建一个.csv格式的对象。我怎样才能将该对象写入带有pandas的DataFrame?获取文本格式的请求对象:importrequestsimportpandasaspdurl=r'http://test.url'r=requests.get(url)r.text#thiswillreturnthedataastextincsvformat我试过了(没用):pd.read_csv(r.text)pd.DataFrame.from_csv(r.text) 最佳答案 试试这个importrequestsimportpan

python - 将 json 文件读取为 pandas 数据框?

我正在使用python3.6并尝试使用以下代码将json文件(350MB)下载为pandas数据帧。但是,我收到以下错误:data_json_str="["+",".join(data)+"]"TypeError:sequenceitem0:expectedstrinstance,bytesfound如何修复错误?importpandasaspd#readtheentirefileintoapythonarraywithopen('C:/Users/Alberto/nutrients.json','rb')asf:data=f.readlines()#removethetrailing

python - 将 Pandas 中的列索引重置为 0,1,2,3 ...?

如何将数据框列的索引重置为0、1、2、3、4?(为什么执行df.reset_index()不会重置列索引?)>>>data=data.drop(data.columns[[1,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19]],axis=1)>>>data=data.drop(data.index[[0,1]],axis=0)>>>print(data.head())0234202500292014600.00.00.00NaN3500292014600100.00.00.00NaN450029201460011202.00.00.00NaN>>>dat