草庐IT

sample_dataframe

全部标签

python - 如何将 pandas DataFrame 表保存为 png

我构建了一个pandas的结果数据框。该数据框充当表格。有MultiIndexed列,每一行代表一个名称,即创建DataFrame时index=['name1','name2',...]。我想显示此表并将其保存为png(或任何图形格式)。目前,我能得到的最接近的是将它转换为html,但我想要一个png。似乎有人问过类似的问题,例如HowtosavethePandasdataframe/seriesdataasafigure?但是,标记的解决方案将数据框转换为线图(而不是表格),而另一个解决方案依赖于PySide,我想远离它,因为我无法在linux上安装它。我希望此代码易于移植。我真的希

python - 使用 iloc 为 pandas DataFrame 中的特定单元格设置值

我有一个类似于this的问题和this.不同的是我必须逐行选择,因为我不知道索引。我想做类似df.iloc[0,'COL_NAME']=x的事情,但iloc不允许这种访问。如果我这样做df.iloc[0]['COL_NAME']=x就会出现关于链式索引的警告。 最佳答案 对于混合位置和索引,使用.ix。但是你需要确保你的索引不是整数,否则会造成困惑。df.ix[0,'COL_NAME']=x更新:或者,试试df.iloc[0,df.columns.get_loc('COL_NAME')]=x例子:importpandasaspdim

python - 使用 iloc 为 pandas DataFrame 中的特定单元格设置值

我有一个类似于this的问题和this.不同的是我必须逐行选择,因为我不知道索引。我想做类似df.iloc[0,'COL_NAME']=x的事情,但iloc不允许这种访问。如果我这样做df.iloc[0]['COL_NAME']=x就会出现关于链式索引的警告。 最佳答案 对于混合位置和索引,使用.ix。但是你需要确保你的索引不是整数,否则会造成困惑。df.ix[0,'COL_NAME']=x更新:或者,试试df.iloc[0,df.columns.get_loc('COL_NAME')]=x例子:importpandasaspdim

python - Pandas 使用startswith从Dataframe中选择

这可行(使用Pandas12开发版)table2=table[table['SUBDIVISION']=='INVERNESS']然后我意识到我需要使用“开始于”来选择字段,因为我错过了一堆。因此,根据Pandas文档,我尽我所能地尝试了criteria=table['SUBDIVISION'].map(lambdax:x.startswith('INVERNESS'))table2=table[criteria]得到AttributeError:'float'objecthasnoattribute'startswith'所以我尝试了另一种结果相同的语法table[[x.starts

python - Pandas 使用startswith从Dataframe中选择

这可行(使用Pandas12开发版)table2=table[table['SUBDIVISION']=='INVERNESS']然后我意识到我需要使用“开始于”来选择字段,因为我错过了一堆。因此,根据Pandas文档,我尽我所能地尝试了criteria=table['SUBDIVISION'].map(lambdax:x.startswith('INVERNESS'))table2=table[criteria]得到AttributeError:'float'objecthasnoattribute'startswith'所以我尝试了另一种结果相同的语法table[[x.starts

python - 从具有相似索引的其他 DataFrame 的列中创建 pandas DataFrame

我有2个DataFramesdf1和df2具有相同的列名['a','b','c']并按日期索引。日期索引可以具有相似的值。我想创建一个DataFramedf3,其中仅包含['c']列中的数据,分别重命名为'df1'和'df2'并具有正确的日期索引。我的问题是我无法正确合并索引。df1=pd.DataFrame(np.random.randn(5,3),index=pd.date_range('01/02/2014',periods=5,freq='D'),columns=['a','b','c'])df2=pd.DataFrame(np.random.randn(8,3),index=

python - 从具有相似索引的其他 DataFrame 的列中创建 pandas DataFrame

我有2个DataFramesdf1和df2具有相同的列名['a','b','c']并按日期索引。日期索引可以具有相似的值。我想创建一个DataFramedf3,其中仅包含['c']列中的数据,分别重命名为'df1'和'df2'并具有正确的日期索引。我的问题是我无法正确合并索引。df1=pd.DataFrame(np.random.randn(5,3),index=pd.date_range('01/02/2014',periods=5,freq='D'),columns=['a','b','c'])df2=pd.DataFrame(np.random.randn(8,3),index=

python - 如何获取包含特定 dtype 的 pandas.DataFrame 列

我正在使用df.columns.values来制作列名列表,然后我会对其进行迭代并制作图表等...但是当我设置它时,我忽略了df中的非数字列。现在,我宁愿不要简单地从df(或它的副本)中删除这些列。相反,我想找到一种巧妙的方法将它们从列名列表中删除。现在我有:names=df.columns.values我想要达到的行为类似于:names=df.columns.values(column_type=float64)有什么巧妙的方法可以做到这一点吗?我想我可以复制df,然后在执行columns.values之前删除那些非数字列,但这让我觉得很笨重。欢迎任何意见/建议。谢谢。

python - 如何获取包含特定 dtype 的 pandas.DataFrame 列

我正在使用df.columns.values来制作列名列表,然后我会对其进行迭代并制作图表等...但是当我设置它时,我忽略了df中的非数字列。现在,我宁愿不要简单地从df(或它的副本)中删除这些列。相反,我想找到一种巧妙的方法将它们从列名列表中删除。现在我有:names=df.columns.values我想要达到的行为类似于:names=df.columns.values(column_type=float64)有什么巧妙的方法可以做到这一点吗?我想我可以复制df,然后在执行columns.values之前删除那些非数字列,但这让我觉得很笨重。欢迎任何意见/建议。谢谢。

python - 如何在保留列顺序的同时创建 DataFrame?

如何在保持列顺序的同时从多个numpy数组、Pandas系列或PandasDataFrame创建一个DataFrame?例如,我有这两个numpy数组,我想将它们组合成一个PandasDataFrame。foo=np.array([1,2,3])bar=np.array([4,5,6])如果我这样做,bar列会排在第一位,因为dict不保留顺序。pd.DataFrame({'foo':pd.Series(foo),'bar':pd.Series(bar)})barfoo041152263我可以这样做,但是当我需要组合许多变量时会变得乏味。pd.DataFrame({'foo':pd.S