Pandas-Datareader

python - 使用 Python 将 Pandas DataFrame 导出为 PDF 文件

在Pandas中为数据框生成PDF的有效方法是什么？最佳答案首先使用matplotlib绘制表格，然后生成pdfimportpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltfrommatplotlib.backends.backend_pdfimportPdfPagesdf=pd.DataFrame(np.random.random((10,3)),columns=("col1","col2","col3"))#https://stackoverflow.com/ques

python - 更改 pandas datetime64 列的时间组件

我有一个可以简化为的数据框:dateid002/04/201502:341106/04/201512:342209/04/201523:033312/04/201501:004415/04/201507:125521/04/201512:596629/04/201517:337704/05/201510:448806/05/201511:129910/05/201508:52101012/05/201514:19111119/05/201519:22121227/05/201522:31131301/06/201511:09141404/06/201512:57151510/06/20

datetime python 2015 00 12 pandas dataframe

python - 将 NumPy 数组与 pandas DataFrame 连接(加入)

我有一个包含10行和5列的pandas数据框以及一个由零组成的numpy矩阵np.zeros((10,3))。我想将numpy矩阵连接到pandas数据帧，但我想在将numpy数组连接到它之前从pandas数据帧中删除最后一列。所以我最终会得到一个包含10行和5-1+3=7列的矩阵。我想我可以用new_dataframe=pd.concat([original_dataframe,pd.DataFrame(np.zeros((10,3)),dtype=np.int)],axis=1,ignore_index=True)其中original_dataframe有10行和5列。如何在连接n

DataFrame python code section pandas numpy

python - 如何从 pandas DataFrame 生成 n 级分层 JSON？

是否有一种有效的方法来创建分层JSON(n层深)，其中父值是键而不是变量标签？即:{"2017-12-31":{"Junior":{"Electronics":{"A":{"sales":0.440755}},{"B":{"sales":-3.230951}}},...etc...},...etc...},...etc...1。我的测试DataFrame:colIndex=pd.MultiIndex.from_product([['NewYork','Paris'],['Electronics','Household'],['A','B','C'],['Junior','Senior'

DataFrame python 34 39 sales json pandas

python - pandas df 中当前唯一值的计数

我试图在pandasdf中返回count的unique值。它是每个行的累积计数。我的目标是合并一个函数来确定当前在任何时间点出现的值的数量。importpandasaspddf=pd.DataFrame({'A':['8:06:00','11:00:00','11:30:00','12:00:00','13:00:00','13:30:00','14:00:00','17:00:00'],'B':['ABC','ABC','DEF','XYZ','ABC','LMN','DEF','ABC'],'C':[1,2,1,1,3,1,2,4],})ABC08:06:00ABC1111:00:

python pandas code 39 00 count unique

python - 如何在pandas操作的网页上制作进度条

我已经在谷歌上搜索了一段时间，但无法找到执行此操作的方法。我有一个简单的Flask应用程序，它接受一个CSV文件，将其读入Pandas数据帧，将其转换并输出为一个新的CSV文件。我已经成功上传并使用HTML转换了它点击提交后，它会在后台运行一段时间的转换，并在完成后自动触发下载。获取result_df并触发下载的代码如下所示@app.route('/convert',methods=["POST"])defconvert(ifrequest.method=='POST':#Readuploadedfiletodfinput_csv_f=request.files['file']inpu

何在 python 34 progress code ajax pandas flask tqdm

python - 从 pandas MultiIndex 中删除一个级别

我想从MultiIndex中完全删除一个级别importpandasaspdtuples=[(0,100,1000),(0,100,1001),(0,100,1002),(1,101,1001)]index_3levels=pd.MultiIndex.from_tuples(tuples,names=["l1","l2","l3"])printindex_3levels.levels[Int64Index([0,1],dtype=int64),Int64Index([100,101],dtype=int64),Int64Index([1000,1001,1002],dtype=int6

MultiIndex 级别 code droplevel levels python pandas

python - 想要将 Pandas Dataframe 绘制为具有 log10 比例 x 轴的多个直方图

我在Pandas数据框中有float据。每列代表一个变量(它们有字符串名称)，每一行代表一组值(这些行有不重要的整数名称)。>>>printdata0kppawr23kppaspyd13.31238713.26604022.7752020.1000003100.000000100.0000004100.00000039.437420517.01715033.019040...我想为每一列绘制直方图。我取得的最佳结果是使用dataframe的hist方法:data.hist(bins=20)但我希望每个直方图的x轴都在log10范围内。并且bins也在log10规模上，但这很容易使用bi

Dataframe python code data log pandas matplotlib histogram logarithm

python - Pandas 数据框条件 .mean() 取决于特定列中的值

我正在尝试创建一个新列，它返回同一df中现有列的值的平均值。但是，应根据其他三个列中的分组来计算平均值。Out[184]:YEARdaytypehourtypescenariooption_value02015SATof_h00.13449912015SUNof_h163.01925022015WDof_h252.11351632015WDpk_h343.12651342015SATof_h456.431392当“YEAR”、“daytype”和“hourtype”相似时，我基本上想要一个新列“mean”来计算“optionvalue”的平均值。我尝试了以下方法但没有成功......I

取决于取决 39 2015 of_h python pandas conditional mean

python - 如何将字典附加到 Pandas 数据框？

我有一组包含json文件的url和一个空的pandas数据框，其中包含代表jsnon文件属性的列。并非所有json文件都具有pandas数据框中的所有属性。我需要做的是从json文件中创建字典，然后将每个字典作为新行附加到pandas数据框中，如果json文件没有与数据框中的列匹配的属性，则必须是填空。我设法创建字典:importurllib2importjsonurl="https://cws01.worldstores.co.uk/api/product.php?product_sku=ULST:7BIS01CF"data=urllib2.urlopen(url).read()da

python Pandas data code section json for-loop dictionary