草庐IT

Dataframe

全部标签

python - 如何按特定月份/日期过滤日期数据框?

所以我的代码如下:df['Dates'][df['Dates'].index.month==11]我正在做一个测试,看看我是否可以过滤月份,以便它只显示11月的日期,但这没有用。它给了我以下错误:AttributeError:'Int64Index'objecthasnoattribute'month'。如果我这样做printtype(df['Dates'][0])然后我得到类“pandas.tslib.Timestamp”,这让我相信存储在数据框中的对象类型是时间戳对象。(我不确定'Int64Index'来自哪里......因为之前的错误)我想要做的是:dataframe列包含从20

python - 在 Pandas DATAFRAME 中移动列

我已将数据从csv文件读取到一个由25000多行和15列组成的数据框中,我需要将所有行(包括最左边的->索引)向右移动一列,以便我得到一个空索引并能够用整数填充它。然而,列的名称应该留在同一个地方。所以,基本上我需要将除列名以外的所有内容都向右移动一个位置。我试图重新索引它,但出现错误:ValueError:cannotreindexfromaduplicateaxis有什么办法吗? 最佳答案 在pandas中,您只能在右侧创建一列,除非您在两个数据框之间进行连接。然后您可以根据自己的喜好重新排列。importpandasaspdd

python - 如何一次检测和删除 pandas 数据帧每一列中的异常值?

这个问题在这里已经有了答案:DetectandexcludeoutliersinapandasDataFrame(18个答案)关闭12个月前。我有一个包含六列的pandas数据框,我知道每列中都有一些异常值。所以我有这两行代码,它们几乎可以做我想做的事情。但它只从数据框的一列中删除异常值。那么,如果我想从每一列中一起删除异常值怎么办?df=pd.DataFrame({'stlines':np.random.normal(size=533)})df=df[np.abs(df.stlines-df.stlines.mean())执行此操作的优雅方法是什么?

python - 检查数据框列中的所有值是否相同

我想快速轻松地检查counts的所有列值在数据框中是否相同:在:importpandasaspdd={'names':['Jim','Ted','Mal','Ted'],'counts':[3,4,3,3]}pd.DataFrame(data=d)输出:namescounts0Jim31Ted42Mal33Ted3我只想要一个简单的条件,即如果所有计数=相同的值然后print('True')。有没有快速的方法来做到这一点? 最佳答案 一种有效的方法是将第一个值与其余值进行比较,然后使用all:defis_unique(s):a=s.

python - 在 Python 中的 Pandas 中实现 R scale 函数?

R的scale函数在pandas中的有效等价物是什么?例如newdf用Pandas写的?有没有使用transform的优雅方式? 最佳答案 缩放在机器学习任务中很常见,因此在scikit-learn的preprocessing模块中实现。您可以将pandasDataFrame传递给它的scale方法。唯一的“问题”是返回的对象不再是DataFrame,而是一个numpy数组;如果您想将其传递给机器学习模型(例如SVM或逻辑回归),这通常不是真正的问题。如果您想保留DataFrame,则需要一些解决方法:fromsklearn.pre

python - 来自 Pandas DataFrame 的基本 Matplotlib 散点图

如何制作DataFrame中列与该DataFrame索引的基本散点图?我正在使用python2.7。importnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltdataframe['Col'].plot()plt.show()这显示了根据我的DataFrame索引中的值(在本例中为日期)绘制的“Col”折线图。但是如何绘制散点图而不是折线图?我试过了plt.scatter(dataframe['Col'])plt.show()但是scatter()需要2个参数。那么如何将系列dataframe['Col']和我的数据帧索引传递到

python pandas 添加前导零以使所有月份均为 2 位数字

如何添加前导零,以便至少有两位数。WeekproductquantityMonth0201301coke1.511201302fanta1.722201304coke3.653201306sprite2.4104201308pepsi2.912即将上面的数据框转换为以下内容:WeekproductquantityMonth0201301coke1.5011201302fanta1.7022201304coke3.6053201306sprite2.4104201308pepsi2.912 最佳答案 使用Series的map()方法和

python - DataFrame 在函数内部修改

我遇到了以前从未观察到的函数内部数据框修改问题。有没有一种方法可以处理这个问题,以便不修改初始数据框。In[30]:deftest(df):df['tt']=np.nanreturndfIn[31]:dff=pd.DataFrame(data=[])In[32]:dffOut[32]:EmptyDataFrameColumns:[]Index:[]In[33]:df=test(dff)In[34]:dffOut[34]:EmptyDataFrameColumns:[tt]Index:[] 最佳答案 deftest(df):df=df

【pandas小技巧】--DataFrame的显示样式

上一篇介绍了DataFrame的显示参数,主要是对DataFrame中值进行调整。本篇介绍DataFrame的显示样式的调整,显示样式主要是对表格本身的调整,比如颜色,通过颜色可以突出显示重要的值,观察数据时可以更加高效的获取主要信息。下面介绍一些针对单个数据和批量数据的样式调整方式,让DataFrame的数据信息更加的一目了然。1.多列显示格式每个DataFrame都有个style属性,通过这个属性可以来调整显示的样式。下面的示例,一次调整多个类型的列的显示。importpandasaspddf=pd.DataFrame({"日期":["2022-10-01","2022-11-11","2

python - 通过 id 列表过滤 pandas 数据框

我有一个pandas数据框,其中包含用户ID的“subscriber_id”列表和一些其他信息。我只想选择不在给定列表A中的订阅者。因此,如果我们的数据框包含订阅者[1,2,3,4,5]的信息,而我的排除列表是[2,4,5],我现在应该得到一个包含[1,3]信息的数据框我试过如下使用面具:temp=df.mask(lambdax:x['subscriber_id']不在订阅者中)但没有运气!我确信notin是有效的Python语法,因为我在如下列表中对其进行了测试:c=[1,2,3,4,5]if5notinc:print'YAY'>>YAY过滤数据框的任何建议或替代方法?