Pandas-Datareader

Python Pandas 数据框读取 excel 表中的精确指定范围

我有很多不同的表格(以及Excel工作表中的其他非结构化数据)..我需要从Excel工作表“数据”的“Sheet2”创建一个超出范围“A3:D20”的数据框。我遇到过向下钻取到工作表级别的所有示例，但没有遇到如何从精确范围中选择它的示例。importopenpyxlimportpandasaspdwb=openpyxl.load_workbook('data.xlsx')sheet=wb.get_sheet_by_name('Sheet2')range=['A3':'D20']#一旦我得到这个，我打算在A列中查找数据并在B列中找到它的对应值。编辑1:我意识到openpyxl花费的时间太

Python Pandas code li section excel

Python Pandas - 如何通过 describe 函数计算 25 个百分位数

对于数据框中的给定数据集，当我应用describe函数时，我得到了基本统计数据，包括最小值、最大值、25%、50%等。例如:data_1=pd.DataFrame({'One':[4,6,8,10]},columns=['One'])data_1.describe()输出是:Onecount4.000000mean7.000000std2.581989min4.00000025%5.50000050%7.00000075%8.500000max10.000000我的问题是:计算25%的数学公式是什么？1)据我所知，是:formula=percentile*n(nisnumberofva

数计 describe code section pre python pandas percentile

python - 在 Pandas 数据框中将字符串 2.90K 转换为 2900 或将 5.2M 转换为 5200000

在处理pandas数据框内的数据方面需要一些帮助。欢迎任何帮助。我有CSV格式的OHCLV数据。我已将文件加载到Pandas数据框中。如何将体积列从2.90K转换为2900或将5.2M转换为5200000。该列可以包含以千为单位的K和以百万为单位的M。importpandasaspdfile_path='/home/fatjoe/UCHM.csv'df=pd.read_csv(file_path,parse_dates=[0],index_col=0)df.columns=["closing_price","opening_price","high_price","low_price"

5200000 python 39 section price pandas dataframe

python - 分组条形图 Pandas

我在pandasDataFrame中有一个名为df的表:+--------+------------+-------------+----------+------------+-----------+|avg_views|avg_orders|max_views|max_orders|min_views|min_orders|+---------+------------+-------------+----------+------------+-----------+|23|123|135|500|3|1|+---------+------------+-------------

条形 python section code pandas matplotlib grouped-bar-chart

python - 使用 Pandas 读取带有多个标题的 Excel 工作表

我有一个包含多个标题的Excel工作表，例如:_____________________________________________________________________________|_____|Header1|Header2|Header3|ColX|ColY|ColA|ColB|ColC|ColD||ColD|ColE|ColF|ColG||ColH|ColI|ColJ|ColDK|1|ds|5|6|9|10|.......................................2|dh|..................................

python Pandas code Header excel dataframe

python - Pandas Dataframes 到 MultiIndex Dataframe 的字典

我有一个PandasDataframes的字典，比如说d={A:pd.DataFrame([[0,1,2],[2,2,4]),B:pd.DataFrame([[1,1,1],[2,2,2]}我想将其更改为这样的MultiIndexDataFrame:A00,1,212,2,4B01,1,112,2,2 最佳答案使用pd.concat在字典值上，将keys参数设置为字典键:df=pd.concat(d.values(),keys=d.keys())结果输出:012A00121224B01111222

Dataframes MultiIndex code section pre python pandas

python - 为 Pandas 数据框中的两列创建邻接矩阵

我有以下形式的数据框:indexName_AName_B0AdamBen1ChrisDavid2AdamChris3BenChris我想获取Name_A和Name_B的邻接矩阵，即:AdamBenChrisDavidAdam0110Ben0010Chris0001David0000解决这个问题的最pythonic/可扩展的方法是什么？编辑:另外，我知道如果Adam,Ben行在数据集中，那么在其他某个点，Ben,Adam也将在数据集中。最佳答案您可以使用crosstab然后reindex通过union列和索引值:df=pd.cro

邻接 python code pandas section dataframe

python - 绘制多个散点图 Pandas

我认为有很多关于绘制多个图表的问题，但不是专门针对这种情况，如下所示。pandas文档说要“重复绘图方法”以在单个轴上绘制多个列组。但是，这对于3个或更多列组如何工作？例如，如果我们定义第三列:bx=df.plot(kind='scatter',x='a',y='f',color='Green',label='f')这个bx会被传递到哪里？此外，如果绘图是同一张图，x轴不应该始终为“a”或“c”吗？但文档有2个不同的x轴:'a'和'c' 最佳答案 Wherewouldthisbxbepassedinto?您应该重复第二次调用plot

python Pandas 39 code section matplotlib scatter-plot

Python Pandas 根据标题值匹配 Vlookup 列

我有以下数据框df:Customer_ID|2015|2016|2017|Year_joined_mailingABC56102015BCD6732016DEF10452017GHI87102016我想查找客户在加入邮寄列表那一年的值(value)并将其保存在新列中。输出将是:Customer_ID|2015|2016|2017|Year_joined_mailing|Purchases_1st_yearABC561020155BCD67320167DEF104520175GHI891020169我在python中找到了一些匹配vlookup的解决方案，但没有一个会使用其他列的标题。

Vlookup Python code Year_joined_mailing 2016 pandas match lookup

python - 如何保存用 'pandas.DataFrame.plot' 创建的图像？

这个问题在这里已经有了答案:Savingplots(AxesSubPlot)generatedfrompythonpandaswithmatplotlib'ssavefig(6个答案)saveapandas.Serieshistogramplottofile(4个答案)关闭2年前。当尝试从“pandas.core.series.Series”对象保存使用“pandas.DataFrame.plot”创建的绘图图像时:%matplotlibinlinetype(class_counts)#pandas.core.series.Seriesclass_counts.plot(kind='b

amp DataFrame section pandas class python plot

75 76 777879 80 81