草庐IT

dataframe

全部标签

python Pandas : DataFrame filter negative values

我想知道如何删除列中包含负值的所有索引。我正在使用PandasDataFrames。DocumentationPandasDataFrame格式:Myid-valuecol1-valuecol2-valuecol3-...valuecol30所以我的DataFrame叫做data我知道如何为1列执行此操作:data2=data.index[data['valuecol1']>0]data3=data.ix[data3]所以我只得到valuecol1>0的id,我怎样才能做一些and声明?valuecol1&&valuecol2&&valuecol3&&...&&valuecol30>0

python - matlab数据文件到pandas DataFrame

这个问题在这里已经有了答案:Read.matfilesinPython(15个答案)关闭5年前。有没有一种标准的方法可以将matlab.mat(matlab格式的数据)文件转换为PandaDataFrame?我知道使用scipy.io可以解决问题,但我想知道是否有一种直接的方法可以做到这一点。

python - 如何从 Pandas 数据框中的当前行中减去前一行并将其应用于每一行;不使用循环?

我正在使用Python3.5,并且正在使用pandas。我已经从yahoofinance加载了股票数据并将文件保存到csv。我的DataFrames从csv加载这些数据。这是我的DataFrame的csv文件的十行副本DateOpenHighLowCloseVolumeAdjClose1990-04-1226.87500026.87500026.62526.6256100250.5760361990-04-1626.50000026.75000026.37526.750500251.7524491990-04-1726.75000026.87500026.75026.875230025

python - 在 RandomForestRegressor 中得到连续不支持的错误

我只是想做一个简单的RandomForestRegressor示例。但是在测试准确性时我得到了这个错误/Users/noppanit/anaconda/lib/python2.7/site-packages/sklearn/metrics/classification.pycinaccuracy_score(y_true,y_pred,normalize,sample_weight)177178#Computeaccuracyforeachpossiblerepresentation-->179y_type,y_true,y_pred=_check_targets(y_true,y_p

python - 计算每行的字数

我正在尝试在DataFrame中创建一个新列,其中包含相应行的字数。我正在寻找单词总数,而不是每个不同单词的频率。我以为会有一种简单/快速的方法来完成这项常见任务,但在谷歌搜索并阅读了一些SO帖子(1、2、3、4)后,我被卡住了。我已经尝试了链接的SO帖子中提出的解决方案,但返回了很多属性错误。words=df['col'].split()df['totalwords']=len(words)结果AttributeError:'Series'objecthasnoattribute'split'和f=lambdax:len(x["col"].split())-1df['totalwor

Python Pandas Dataframe 按组中的最大值选择行

我有一个通过df.pivot创建的数据框:typestartendF_Typeto_dateA20150908143000345316B20150908140300NaN48020150908140600NaN12020150908143000107438803C20150908140100NaN171520150908140200NaN106220150908141000NaN14520150908141500418NaN20150908141800NaN4502015090814290019731499201509081430001952216659D201509081430004

python - Pandas DataFrame 将多个列值堆叠到单个列中

假设以下DataFrame:key.0key.1key.2topic1abcdefghi82xabxcdxef9如何将所有key.*列的值组合成一个“key”列,该列与对应于key.*列的主题值相关联?这是我想要的结果:topickey18abc28def38ghi49xab59xcd69xef请注意,key.N列的数量在某些外部N上是可变的。 最佳答案 你可以融化你的数据框:>>>keys=[cforcindfifc.startswith('key.')]>>>pd.melt(df,id_vars='topic',value_va

python - Panda 的 DataFrame - 重命名多个同名列

我在df中有几个名称相同的列。我需要重命名它们,但问题是df.rename方法以相同的方式重命名它们。如何将以下blah(s)重命名为blah1、blah4、blah5?df=pd.DataFrame(np.arange(2*5).reshape(2,5))df.columns=['blah','blah2','blah3','blah','blah']df#blahblah2blah3blahblah#001234#156789这是使用df.rename方法时发生的情况:df.rename(columns={'blah':'blah1'})#blah1blah2blah3blah1b

python - Pandas - 根据索引替换值

如果我像这样创建一个数据框:importpandasaspd,numpyasnpdf=pd.DataFrame(np.random.randint(0,100,size=(100,2)),columns=list('AB'))例如,如何将A列中的条目更改为第0-15行中的数字16?换句话说,如何完全根据索引替换单元格? 最佳答案 使用loc:df.loc[0:15,'A']=16print(df)AB0164511652169731658416265168761651716178163991673101694111669121657

python - 从python中的数据框行获取最大值

这个问题在这里已经有了答案:Findthemaxoftwoormorecolumnswithpandas(4个答案)Howtoselectmaxandminvalueinarowforselectedcolumns(2个答案)关闭5年前。这是我的数据框dfabc1.220.12.11.13.20.21.98.83.37.80.12我正在尝试从数据帧的每一行中获取最大值,我期待这样的输出max_value23.28.87.8这是我试过的df[len(df.columns)].argmax()我没有得到正确的输出,任何帮助将不胜感激。谢谢