panda_草庐IT

python - 使用多个分隔符将文本导入 Pandas

我有一些看起来像这样的数据:cstuffcmoreheadercbegindata11:.512:6.513:5.3我想将它导入到一个3列的数据框中，例如列a,b,c1,1,0.5etc我一直在尝试将数据读入为在“:”上拆分的2列，然后在“”上拆分第一列。但是我觉得这很烦人。有没有更好的方法直接在导入时进行整理？目前:data1=pd.read_csv(file_loc,skiprows=3,delimiter=':',names=['AB','C'])data2=pd.DataFrame(data1.AB.str.split('',1).tolist(),names=['A','B'

python Pandas 39 section code import csv

python - 如何规范化 Pandas 数据框中一系列列中的数据

假设我有一个pandas数据框surveyData:我想通过执行以下操作来规范化每列中的数据:surveyData_norm=(surveyData-surveyData.mean())/(surveyData.max()-surveyData.min())如果我的数据表只包含我想要规范化的列，这会很好地工作。但是，我有一些包含字符串数据的列，例如:NameStateGenderAgeIncomeHeightSamCAM131000070BobAZM212500055TomFLM3010000045我只想规范化年龄、收入和高度列，但由于名称状态和性别列中的字符串数据，我的上述方法不起作

python Pandas section surveyData code

python - 如何规范化 Pandas 数据框中一系列列中的数据

假设我有一个pandas数据框surveyData:我想通过执行以下操作来规范化每列中的数据:surveyData_norm=(surveyData-surveyData.mean())/(surveyData.max()-surveyData.min())如果我的数据表只包含我想要规范化的列，这会很好地工作。但是，我有一些包含字符串数据的列，例如:NameStateGenderAgeIncomeHeightSamCAM131000070BobAZM212500055TomFLM3010000045我只想规范化年龄、收入和高度列，但由于名称状态和性别列中的字符串数据，我的上述方法不起作

python Pandas section surveyData code

python - Pandas :条形图 xtick 频率

我想为pandasDataFrame对象创建一个简单的条形图。然而，图表上的xtick似乎过于细化，而如果我将绘图更改为折线图，xtick会进行优化以便更好地查看。我想知道是否可以将相同的折线图xtick频率带入条形图？谢谢。locks.plot(kind='bar',y='SUM')编辑结果图: 最佳答案您可以通过每nticks设置一个来减少thicks的数量，执行如下操作:n=10ax=locks.plot(kind='bar',y='SUM')ticks=ax.xaxis.get_ticklocs()ticklabels=[

条形 python section ticklabels matplotlib plot pandas

python - Pandas :条形图 xtick 频率

我想为pandasDataFrame对象创建一个简单的条形图。然而，图表上的xtick似乎过于细化，而如果我将绘图更改为折线图，xtick会进行优化以便更好地查看。我想知道是否可以将相同的折线图xtick频率带入条形图？谢谢。locks.plot(kind='bar',y='SUM')编辑结果图: 最佳答案您可以通过每nticks设置一个来减少thicks的数量，执行如下操作:n=10ax=locks.plot(kind='bar',y='SUM')ticks=ax.xaxis.get_ticklocs()ticklabels=[

条形 python section ticklabels matplotlib plot pandas

python - pandas.DataFrame 中一列的反向累积总和

我有一个pandasDataFrame，其中一个bool列按另一列排序，需要计算bool列的反向累积和，即从当前行到底部的真实值的数量。例子In[13]:df=pd.DataFrame({'A':[True]*3+[False]*5,'B':np.random.rand(8)})In[15]:df=df.sort_values('B')In[16]:dfOut[16]:AB6False0.0377102True0.3154144False0.3324807False0.4455053False0.5801561True0.7415515False0.7969440True0.81756

反向 DataFrame code False 39 python pandas reverse

python - pandas.DataFrame 中一列的反向累积总和

我有一个pandasDataFrame，其中一个bool列按另一列排序，需要计算bool列的反向累积和，即从当前行到底部的真实值的数量。例子In[13]:df=pd.DataFrame({'A':[True]*3+[False]*5,'B':np.random.rand(8)})In[15]:df=df.sort_values('B')In[16]:dfOut[16]:AB6False0.0377102True0.3154144False0.3324807False0.4455053False0.5801561True0.7415515False0.7969440True0.81756

反向 DataFrame code False 39 python pandas reverse

python - 使用 python 和 pandas 将 OHLC 股票数据转换为不同的时间范围

有人可以用Pandas为我指出关于OHLC数据时间范围转换的正确方向吗？？我正在尝试做的是在给定具有较短时间范围的数据的情况下，为较高时间范围的数据构建一个Dataframe。例如，假设我有以下一分钟(M1)数据:OpenHighLowCloseVolumeDate1999-01-0410:22:001.18011.18191.18011.181741999-01-0410:23:001.18171.18181.18041.1814181999-01-0410:24:001.18171.18171.18021.1806121999-01-0410:25:001.18071.18151.

股票数 python 39 code High stock pandas

python - 使用 python 和 pandas 将 OHLC 股票数据转换为不同的时间范围

有人可以用Pandas为我指出关于OHLC数据时间范围转换的正确方向吗？？我正在尝试做的是在给定具有较短时间范围的数据的情况下，为较高时间范围的数据构建一个Dataframe。例如，假设我有以下一分钟(M1)数据:OpenHighLowCloseVolumeDate1999-01-0410:22:001.18011.18191.18011.181741999-01-0410:23:001.18171.18181.18041.1814181999-01-0410:24:001.18171.18171.18021.1806121999-01-0410:25:001.18071.18151.

股票数 python 39 code High stock pandas

python - 将 pandas DataFrame 列扩展为多行

如果我有一个DataFrame这样:pd.DataFrame({"name":"John","days":[[1,3,5,7]]})给出这个结构:daysname0[1,3,5,7]John如何展开成下面的？daysname01John13John25John37John 最佳答案您可以使用df.itertuples遍历每一行，并使用列表理解将数据reshape为所需的形式:importpandasaspddf=pd.DataFrame({"name":["John","Eric"],"days":[[1,3,5,7],[2,4]

多行展为 code DataFrame days python pandas