pyhton_Pandas_草庐IT

python - 如何判断 Pandas 数据框中的列是否属于日期时间类型？如何判断列是否为数字？

我正在尝试根据它们是否属于日期类型来过滤pandas数据框中的列。我可以找出哪些是，但随后必须解析该输出或手动选择列。我想自动选择日期列。这是我到目前为止的示例-在这种情况下我只想选择“date_col”列。importpandasaspddf=pd.DataFrame([['Feb-2017',1,2],['Mar-2017',1,2],['Apr-2017',1,2],['May-2017',1,2]],columns=['date_str','col1','col2'])df['date_col']=pd.to_datetime(df['date_str'])df.dtypes输

为数 python code datetime section pandas numpy dataframe

python - 如何判断 Pandas 数据框中的列是否属于日期时间类型？如何判断列是否为数字？

我正在尝试根据它们是否属于日期类型来过滤pandas数据框中的列。我可以找出哪些是，但随后必须解析该输出或手动选择列。我想自动选择日期列。这是我到目前为止的示例-在这种情况下我只想选择“date_col”列。importpandasaspddf=pd.DataFrame([['Feb-2017',1,2],['Mar-2017',1,2],['Apr-2017',1,2],['May-2017',1,2]],columns=['date_str','col1','col2'])df['date_col']=pd.to_datetime(df['date_str'])df.dtypes输

为数 python code datetime section pandas numpy dataframe

python - 如何对 Pandas 的多索引进行分组？

下面是我的数据框。我进行了一些转换以创建类别列并删除了它派生的原始列。现在我需要做一个分组来删除重复项，例如Love和Fashion可以通过groupby求和来汇总。df.colunms=array([category,clicks,revenue,date,impressions,size],dtype=object)df.values=[[Love00.368232013-11-04380300x250][Love183474.815222013-11-04374242300x250][Fashion00.194342013-11-04197300x250][Fashion918.

多索引进 39 2013 300 python pandas dataframe pandas-groupby multi-index

python - 如何对 Pandas 的多索引进行分组？

下面是我的数据框。我进行了一些转换以创建类别列并删除了它派生的原始列。现在我需要做一个分组来删除重复项，例如Love和Fashion可以通过groupby求和来汇总。df.colunms=array([category,clicks,revenue,date,impressions,size],dtype=object)df.values=[[Love00.368232013-11-04380300x250][Love183474.815222013-11-04374242300x250][Fashion00.194342013-11-04197300x250][Fashion918.

多索引进 39 2013 300 python pandas dataframe pandas-groupby multi-index

python - 应用于每一列的 Pandas value_counts

我有一个dataframe，其中包含来自外部源(csv文件)的大量列(≈30)，但其中有几个没有值或始终相同。因此，我想快速查看每列的value_counts，我该怎么做？例如Id,temp,name134,null,mark222,null,mark334,null,mark会返回一个对象说明编号:34->2、22->1温度:空->3姓名:标记->3所以我会知道temp是无关紧要的，name也不有趣(总是一样的) 最佳答案对于数据框，df=pd.DataFrame(data=[[34,'null','mark'],[22,'nu

value_counts python code section 39 pandas dataframe

python - 应用于每一列的 Pandas value_counts

我有一个dataframe，其中包含来自外部源(csv文件)的大量列(≈30)，但其中有几个没有值或始终相同。因此，我想快速查看每列的value_counts，我该怎么做？例如Id,temp,name134,null,mark222,null,mark334,null,mark会返回一个对象说明编号:34->2、22->1温度:空->3姓名:标记->3所以我会知道temp是无关紧要的，name也不有趣(总是一样的) 最佳答案对于数据框，df=pd.DataFrame(data=[[34,'null','mark'],[22,'nu

value_counts python code section 39 pandas dataframe

python - 使用多个分隔符将文本导入 Pandas

我有一些看起来像这样的数据:cstuffcmoreheadercbegindata11:.512:6.513:5.3我想将它导入到一个3列的数据框中，例如列a,b,c1,1,0.5etc我一直在尝试将数据读入为在“:”上拆分的2列，然后在“”上拆分第一列。但是我觉得这很烦人。有没有更好的方法直接在导入时进行整理？目前:data1=pd.read_csv(file_loc,skiprows=3,delimiter=':',names=['AB','C'])data2=pd.DataFrame(data1.AB.str.split('',1).tolist(),names=['A','B'

python Pandas 39 section code import csv

python - 使用多个分隔符将文本导入 Pandas

我有一些看起来像这样的数据:cstuffcmoreheadercbegindata11:.512:6.513:5.3我想将它导入到一个3列的数据框中，例如列a,b,c1,1,0.5etc我一直在尝试将数据读入为在“:”上拆分的2列，然后在“”上拆分第一列。但是我觉得这很烦人。有没有更好的方法直接在导入时进行整理？目前:data1=pd.read_csv(file_loc,skiprows=3,delimiter=':',names=['AB','C'])data2=pd.DataFrame(data1.AB.str.split('',1).tolist(),names=['A','B'

python Pandas 39 section code import csv

python - 如何规范化 Pandas 数据框中一系列列中的数据

假设我有一个pandas数据框surveyData:我想通过执行以下操作来规范化每列中的数据:surveyData_norm=(surveyData-surveyData.mean())/(surveyData.max()-surveyData.min())如果我的数据表只包含我想要规范化的列，这会很好地工作。但是，我有一些包含字符串数据的列，例如:NameStateGenderAgeIncomeHeightSamCAM131000070BobAZM212500055TomFLM3010000045我只想规范化年龄、收入和高度列，但由于名称状态和性别列中的字符串数据，我的上述方法不起作

python Pandas section surveyData code

python - 如何规范化 Pandas 数据框中一系列列中的数据

假设我有一个pandas数据框surveyData:我想通过执行以下操作来规范化每列中的数据:surveyData_norm=(surveyData-surveyData.mean())/(surveyData.max()-surveyData.min())如果我的数据表只包含我想要规范化的列，这会很好地工作。但是，我有一些包含字符串数据的列，例如:NameStateGenderAgeIncomeHeightSamCAM131000070BobAZM212500055TomFLM3010000045我只想规范化年龄、收入和高度列，但由于名称状态和性别列中的字符串数据，我的上述方法不起作

python Pandas section surveyData code