pyhton_Pandas

python - groupby 上的 pandas concat 数组

我有一个DataFrame，它是由groupbywith创建的:agg_df=df.groupby(['X','Y','Z']).agg({'amount':np.sum,'ID':pd.Series.unique,})在我对agg_df应用一些过滤后，我想连接IDagg_df=agg_df.groupby(['X','Y']).agg({#Zisnotiningroupbynow'amount':np.sum,'ID':pd.Series.unique,})但我在第二个'ID':pd.Series.unique处遇到错误:ValueError:Functiondoesnotreduc

groupby python code 39 pre pandas

python - 从对象到字符串的 pandas dtype 转换

我有一个csv文件，其中有几列是数字，几列是字符串。当我尝试myDF.dtypes时，它将所有字符串列显示为object。here之前有人问过相关问题关于为什么这样做。是否可以将dtype从对象重铸为字符串？另外，一般来说，有什么简单的方法可以将dtype从int64和float64重铸为int32和float32并保存数据的大小(在内存中/磁盘上)？最佳答案所有字符串都表示为可变长度(这是objectdtype所持有的)。如果你愿意，你可以做series.astype('S32')；但如果您随后将其存储在DataFrame中或

python pandas code section dtype

python - 使用 Python 将 Pandas DataFrame 导出为 PDF 文件

在Pandas中为数据框生成PDF的有效方法是什么？最佳答案首先使用matplotlib绘制表格，然后生成pdfimportpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltfrommatplotlib.backends.backend_pdfimportPdfPagesdf=pd.DataFrame(np.random.random((10,3)),columns=("col1","col2","col3"))#https://stackoverflow.com/ques

DataFrame python section stackoverflow matplotlib pandas pdf reportlab

python - 更改 pandas datetime64 列的时间组件

我有一个可以简化为的数据框:dateid002/04/201502:341106/04/201512:342209/04/201523:033312/04/201501:004415/04/201507:125521/04/201512:596629/04/201517:337704/05/201510:448806/05/201511:129910/05/201508:52101012/05/201514:19111119/05/201519:22121227/05/201522:31131301/06/201511:09141404/06/201512:57151510/06/20

datetime python 2015 00 12 pandas dataframe

python - 将 NumPy 数组与 pandas DataFrame 连接(加入)

我有一个包含10行和5列的pandas数据框以及一个由零组成的numpy矩阵np.zeros((10,3))。我想将numpy矩阵连接到pandas数据帧，但我想在将numpy数组连接到它之前从pandas数据帧中删除最后一列。所以我最终会得到一个包含10行和5-1+3=7列的矩阵。我想我可以用new_dataframe=pd.concat([original_dataframe,pd.DataFrame(np.zeros((10,3)),dtype=np.int)],axis=1,ignore_index=True)其中original_dataframe有10行和5列。如何在连接n

DataFrame python code section pandas numpy

python - 如何从 pandas DataFrame 生成 n 级分层 JSON？

是否有一种有效的方法来创建分层JSON(n层深)，其中父值是键而不是变量标签？即:{"2017-12-31":{"Junior":{"Electronics":{"A":{"sales":0.440755}},{"B":{"sales":-3.230951}}},...etc...},...etc...},...etc...1。我的测试DataFrame:colIndex=pd.MultiIndex.from_product([['NewYork','Paris'],['Electronics','Household'],['A','B','C'],['Junior','Senior'

DataFrame python 34 39 sales json pandas

python - pandas df 中当前唯一值的计数

我试图在pandasdf中返回count的unique值。它是每个行的累积计数。我的目标是合并一个函数来确定当前在任何时间点出现的值的数量。importpandasaspddf=pd.DataFrame({'A':['8:06:00','11:00:00','11:30:00','12:00:00','13:00:00','13:30:00','14:00:00','17:00:00'],'B':['ABC','ABC','DEF','XYZ','ABC','LMN','DEF','ABC'],'C':[1,2,1,1,3,1,2,4],})ABC08:06:00ABC1111:00:

python pandas code 39 00 count unique

python - 如何在pandas操作的网页上制作进度条

我已经在谷歌上搜索了一段时间，但无法找到执行此操作的方法。我有一个简单的Flask应用程序，它接受一个CSV文件，将其读入Pandas数据帧，将其转换并输出为一个新的CSV文件。我已经成功上传并使用HTML转换了它点击提交后，它会在后台运行一段时间的转换，并在完成后自动触发下载。获取result_df并触发下载的代码如下所示@app.route('/convert',methods=["POST"])defconvert(ifrequest.method=='POST':#Readuploadedfiletodfinput_csv_f=request.files['file']inpu

何在 python 34 progress code ajax pandas flask tqdm

python - 从 pandas MultiIndex 中删除一个级别

我想从MultiIndex中完全删除一个级别importpandasaspdtuples=[(0,100,1000),(0,100,1001),(0,100,1002),(1,101,1001)]index_3levels=pd.MultiIndex.from_tuples(tuples,names=["l1","l2","l3"])printindex_3levels.levels[Int64Index([0,1],dtype=int64),Int64Index([100,101],dtype=int64),Int64Index([1000,1001,1002],dtype=int6

MultiIndex 级别 code droplevel levels python pandas

python - 想要将 Pandas Dataframe 绘制为具有 log10 比例 x 轴的多个直方图

我在Pandas数据框中有float据。每列代表一个变量(它们有字符串名称)，每一行代表一组值(这些行有不重要的整数名称)。>>>printdata0kppawr23kppaspyd13.31238713.26604022.7752020.1000003100.000000100.0000004100.00000039.437420517.01715033.019040...我想为每一列绘制直方图。我取得的最佳结果是使用dataframe的hist方法:data.hist(bins=20)但我希望每个直方图的x轴都在log10范围内。并且bins也在log10规模上，但这很容易使用bi

Dataframe python code data log pandas matplotlib histogram logarithm

85 86 878889 90 91