dataframe

python Pandas : Getting the locations of a value in dataframe

假设我有以下数据框:'a''b'000110201301有没有办法获取存在特定值的索引/列值？例如，类似于以下内容:values=df.search(1)将有values=[(1,'a'),(2,'b'),(3,'b')]。最佳答案 df[df==1].stack().index.tolist()产量[(1,'a'),(2,'b'),(3,'b')] 关于pythonPandas:Gettingthelocationsofavalueindataframe，我们在StackOverfl

python数据框转换多种日期时间格式

我有一个像这样的pandas.dataframe(“col”列有两种格式):colval'12/1/2013'value1'1/22/201412:00:01AM'value2'12/10/2013'value3'12/31/2013'value4我想将它们转换成日期时间，我正在考虑使用:test_df['col']=test_df['col'].map(lambdax:datetime.strptime(x,'%m/%d/%Y'))test_df['col']=test_df['col'].map(lambdax:datetime.strptime(x,'%m/%d/%Y%H:%M%

多种 python 39 datetime section pandas dataframe

python - 在 Pandas Dataframe 中删除具有低标准偏差的列

有没有办法不用写for循环就可以做到这一点？假设我们有以下数据:d={'A':{-1:0.19052041339798062,0:-0.0052531481871952871,1:-0.0022017467720961644,2:-0.051109629013311737,3:0.18569441222621336},'B':{-1:0.029181417300734112,0:-0.0031021862533310743,1:-0.014358516787430284,2:0.0046386615308068877,3:0.056676322314857898},'C':{-1:0.

Dataframe python code section 39 pandas

python - 使用 Python 的高效滚动修剪均值

用Python计算滚动(又名移动窗口)修剪均值的最有效方法是什么？例如，对于50K行的数据集和50的窗口大小，对于每一行我需要取最后50行，删除顶部和底部的3个值(窗口大小的5%，四舍五入),并得到剩余44个值的平均值。目前，我正在对每一行进行切片以获取窗口，对窗口进行排序，然后切片以修剪它。它的工作速度很慢，但必须有更有效的方法。示例[10,12,8,13,7,18,19,9,15,14]#datausedforexample,inrealitsa50klinesdf对于5的窗口大小。对于每一行，我们查看最后5行，对它们进行排序并丢弃1个顶部和1个底部行(5%的5=0.25，四舍五入

python data mean rolling pandas numpy dataframe moving-average

python - DataFrame.drop_duplicates 和 DataFrame.drop 不删除行

我已将csv读入pandas数据框，它有五列。某些行仅在第二列中具有重复值，我想从数据框中删除这些行，但drop和drop_duplicates都不起作用。这是我的实现:#ReadCSVdf=pd.read_csv(data_path,header=0,names=['a','b','c','d','e'])printSeries(df.b)dropRows=[]#Sanitizethedatatogetridofduplicatesforindx,valinenumerate(df.b):#forallthevaluesif(indx==0):#skipfirstindxcontin

DataFrame drop drop_duplicates duplicates python pandas

python - 用两列的 groupby 的第一行构建新列 - Pandas

我正在尝试构建一个新列，如果它是列“type”的元素第一次具有列“xx”的特定值，则该列的值为1，并在中给出0的值任何其他情况。我正在使用的原始数据框(df)是:idx=[np.array(['Jan-18','Jan-18','Feb-18','Mar-18','Mar-18','Mar-18','Apr-18','Apr-18','May-18','Jun-18','Jun-18','Jun-18','Jul-18','Aug-18','Aug-18','Sep-18','Sep-18','Oct-18','Oct-18','Oct-18','Nov-18','Dec-18','D

groupby python 39 2018 1000 pandas dataframe

python - 在 Panda Dataframe 中附加 bool 列

我正在学习pandas，但在这里遇到了这个问题。我创建了一个数据框来跟踪所有用户以及他们做某事的次数。为了更好地理解问题，我创建了这个示例:importpandasaspddata=[{'username':'me','bought_apples':2,'bought_pears':0},{'username':'you','bought_apples':1,'bought_pears':1}]df=pd.DataFrame(data)df['bought_something']=df['bought_apples']>0ordf['bought_pears']>0在最后一行中，我想添

Dataframe python bought 39 code pandas ipython-notebook

python - pandas.Series() 使用 DataFrame 列创建返回 NaN 数据条目

我正在尝试使用简化后的代码将数据帧转换为系列:dates=['2016-1-{}'.format(i)foriinrange(1,21)]values=[iforiinrange(20)]data={'Date':dates,'Value':values}df=pd.DataFrame(data)df['Date']=pd.to_datetime(df['Date'])ts=pd.Series(df['Value'],index=df['Date'])print(ts)然而，打印输出看起来像这样:Date2016-01-01NaN2016-01-02NaN2016-01-03NaN20

条目 DataFrame 2016 code 01 python python-3.x pandas time-series

python - 使用 Pandas 重命名数据框列中的元素

使用Pandas:df=pd.DataFrame({'n':['d','a','b','c','c','a','d','b'],'v':[1,2,1,2,2,1,1,1]})如何重命名df.n中的元素，使a更改为x、b到y，c到w和d到z，导致:nv0z11x22y13w2... 最佳答案您可以将替换值的字典传递到系列replace中方法:In[11]:df['n'].replace({'a':'x','b':'y','c':'w','d':'z'})Out[11]:0z1x2y3w4w5x6z7yName:n,dtype:obj

命名 python 39 code section pandas dataframe rename

python - 删除 Pandas 系列中的空列表

我有一个像下面这样的长系列:series=pd.Series([[(1,2)],[(3,5)],[],[(3,5)]])In[151]:seriesOut[151]:0[(1,2)]1[(3,5)]2[]3[(3,5)]dtype:object我想删除所有带有空列表的条目。出于某种原因，bool索引不起作用。以下测试都给出相同的错误:series==[[(1,2)]]series==[(1,2)]ValueError:Arraysweredifferentlengths:4vs1这很奇怪，因为在下面的简单示例中，索引的工作方式与上面的一样:In[146]:pd.Series([1,2,

python Pandas code section series list dataframe

29 30 313233 34 35