草庐IT

dataframe

全部标签

python - 如何在 Pandas 数据框中查找哪些列包含任何 NaN 值

给定一个pandas数据框,其中包含分散在各处的可能NaN值:问题:如何确定哪些列包含NaN值?特别是,我可以获得包含NaN的列名列表吗? 最佳答案 更新:使用Pandas0.22.0较新的Pandas版本具有新方法'DataFrame.isna()'和'DataFrame.notna()'In[71]:dfOut[71]:abc0NaN7.0010.0NaN422.0NaN431.07.0041.03.0957.04.0962.06.0979.06.0483.00.0999.00.01In[72]:df.isna().any()O

python - 如何在 Pandas 数据框中查找哪些列包含任何 NaN 值

给定一个pandas数据框,其中包含分散在各处的可能NaN值:问题:如何确定哪些列包含NaN值?特别是,我可以获得包含NaN的列名列表吗? 最佳答案 更新:使用Pandas0.22.0较新的Pandas版本具有新方法'DataFrame.isna()'和'DataFrame.notna()'In[71]:dfOut[71]:abc0NaN7.0010.0NaN422.0NaN431.07.0041.03.0957.04.0962.06.0979.06.0483.00.0999.00.01In[72]:df.isna().any()O

python - Pandas 数据框fillna()只有一些列到位

我试图在Pandas数据框中只为某些列子集填充0值。当我这样做时:importpandasaspddf=pd.DataFrame(data={'a':[1,2,3,None],'b':[4,5,None,6],'c':[None,None,7,8]})printdfdf.fillna(value=0,inplace=True)printdf输出:abc01.04.0NaN12.05.0NaN23.0NaN7.03NaN6.08.0abc01.04.00.012.05.00.023.00.07.030.06.08.0它将每个None替换为0。我想要做的是,只替换a和b列中的Nones,而

python - Pandas 数据框fillna()只有一些列到位

我试图在Pandas数据框中只为某些列子集填充0值。当我这样做时:importpandasaspddf=pd.DataFrame(data={'a':[1,2,3,None],'b':[4,5,None,6],'c':[None,None,7,8]})printdfdf.fillna(value=0,inplace=True)printdf输出:abc01.04.0NaN12.05.0NaN23.0NaN7.03NaN6.08.0abc01.04.00.012.05.00.023.00.07.030.06.08.0它将每个None替换为0。我想要做的是,只替换a和b列中的Nones,而

python - 如何从 Pandas 数据框中过滤包含字符串模式的行

这个问题在这里已经有了答案:FilterpandasDataFramebysubstringcriteria(17个回答)关闭3年前。假设我们在PythonPandas中有一个如下所示的数据框:df=pd.DataFrame({'vals':[1,2,3,4],'ids':[u'aball',u'bball',u'cnut',u'fball']})或者,以表格形式:idsvalsaball1bball2cnut3fball4如何过滤包含关键字“ball”的行?例如,输出应该是:idsvalsaball1bball2fball4 最佳答案

python - 如何从 Pandas 数据框中过滤包含字符串模式的行

这个问题在这里已经有了答案:FilterpandasDataFramebysubstringcriteria(17个回答)关闭3年前。假设我们在PythonPandas中有一个如下所示的数据框:df=pd.DataFrame({'vals':[1,2,3,4],'ids':[u'aball',u'bball',u'cnut',u'fball']})或者,以表格形式:idsvalsaball1bball2cnut3fball4如何过滤包含关键字“ball”的行?例如,输出应该是:idsvalsaball1bball2fball4 最佳答案

python - 替换 pandas DataFrame 中的列值

我正在尝试替换数据框一列中的值。列('female')仅包含值'female'和'male'。我尝试了以下方法:w['female']['female']='1'w['female']['male']='0'但收到与之前结果完全相同的副本。理想情况下,我希望得到一些类似于以下循环元素的输出。ifw['female']=='female':w['female']='1';else:w['female']='0';我查看了问题文档(http://pandas.pydata.org/pandas-docs/stable/gotchas.html),但无法弄清楚为什么什么也没发生。任何帮助将不

python - 替换 pandas DataFrame 中的列值

我正在尝试替换数据框一列中的值。列('female')仅包含值'female'和'male'。我尝试了以下方法:w['female']['female']='1'w['female']['male']='0'但收到与之前结果完全相同的副本。理想情况下,我希望得到一些类似于以下循环元素的输出。ifw['female']=='female':w['female']='1';else:w['female']='0';我查看了问题文档(http://pandas.pydata.org/pandas-docs/stable/gotchas.html),但无法弄清楚为什么什么也没发生。任何帮助将不

python - 按日期过滤 Pandas DataFrame

我有一个带有“日期”列的PandasDataFrame。现在我需要过滤掉DataFrame中日期在接下来两个月之外的所有行。本质上,我只需要保留接下来两个月内的行。实现这一目标的最佳方法是什么? 最佳答案 如果日期列是索引,则使用.loc进行基于标签的索引或使用.iloc进行位置索引。例如:df.loc['2014-01-01':'2014-02-01']在此处查看详细信息http://pandas.pydata.org/pandas-docs/stable/dsintro.html#indexing-selection如果该列不是

python - 按日期过滤 Pandas DataFrame

我有一个带有“日期”列的PandasDataFrame。现在我需要过滤掉DataFrame中日期在接下来两个月之外的所有行。本质上,我只需要保留接下来两个月内的行。实现这一目标的最佳方法是什么? 最佳答案 如果日期列是索引,则使用.loc进行基于标签的索引或使用.iloc进行位置索引。例如:df.loc['2014-01-01':'2014-02-01']在此处查看详细信息http://pandas.pydata.org/pandas-docs/stable/dsintro.html#indexing-selection如果该列不是