alter_column

Python Pandas : Add a column to my dataframe that counts a variable

我有一个这样的数据框“gt”:orggrouporg11org21org32org43org53org63我想将列“count”添加到gt数据框以计算组的成员数，预期结果如下:orggroupcountorg112org212org321org433org533org633我知道如何对组中的一项进行计数，但不知道如何使所有组项的计数重复，这是我使用的代码:gtcounts=gt.groupby('group').count()有人可以帮忙吗？最佳答案调用transform这将返回一个与原始df对齐的Series:In[223]:

python - Pandas 数据帧 : apply function to all columns

我可以在df的任何列上使用.map(func)，例如:df=DataFrame({'a':[1,2,3,4,5,6],'b':[2,3,4,5,6,7]})df['a']=df['a'].map(lambdax:x>1)我也可以:df['a'],df['b']=df['a'].map(lambdax:x>1),df['b'].map(lambdax:x>1)是否有更Pythonic的方式将函数应用于所有列或整个框架(没有循环)？最佳答案如果我没听错，您正在寻找applymap方法。>>>printdfABC0-1001-43-1

function columns False section code python dataframe pandas

python - Django 模型 (1054, "Unknown column in ' 字段列表'")

不知道为什么会弹出这个错误。这是我创建的模型-fromdjango.dbimportmodelsfromdjango.contrib.auth.modelsimportUserclassShows(models.Model):showid=models.CharField(max_length=10,unique=True,db_index=True)name=models.CharField(max_length=256,db_index=True)aka=models.CharField(max_length=256,db_index=True)score=models.Float

amp Unknown models section django python django-models

python - Alembic:IntegrityError:添加不可为空的列时出现 "column contains null values"

我正在向现有表中添加一列。这个新列是nullable=False。op.add_column('mytable',sa.Column('mycolumn',sa.String(),nullable=False))当我运行迁移时，它会提示:sqlalchemy.exc.IntegrityError:column"mycolumn"containsnullvalues 最佳答案这是因为您现有的数据在该新列上没有任何值，即null。从而导致所述错误。添加不可为空的列时，您必须决定为现有数据赋予什么值好的，那么现有数据应该只有这个新列的“

时出 IntegrityError code server_default section python sqlalchemy alembic

python - 对 pandas DataFrame 中的列进行 .str.split() 操作后获取最后一个 "column"

我在PandasDataFrame中有一个列，我想将其拆分为一个空格。DataFrame.str.split('')的拆分很简单，但我无法从最后一个条目创建新列。当我.str.split()列时，我得到一个数组列表，但我不知道如何操作它来为我的DataFrame获取一个新列。这是一个例子。列中的每个条目都包含“符号数据价格”，我想拆分价格(最终在一半的情况下删除“p”...或“c”)。importpandasaspdtemp=pd.DataFrame({'ticker':['spx5/25/2001p500','spx5/25/2001p600','spx5/25/2001p700']

DataFrame amp 39 code section python string pandas split

python - Pandas Dataframe : split column into multiple columns, 右对齐不一致的单元格条目

我有一个pandas数据框，其中有一列名为“城市、州、国家/地区”。我想将此列分成三个新列，“City”、“State”和“Country”。0HUN1ESP2GBR3ESP4FRA5ID,USA6GA,USA7Hoboken,NJ,USA8NJ,USA9AUS将列拆分为三列已经很简单了:location_df=df['City,State,Country'].apply(lambdax:pd.Series(x.split(',')))但是，这会创建左对齐的数据:0120HUNNaNNaN1ESPNaNNaN2GBRNaNNaN3ESPNaNNaN4FRANaNNaN5IDUSANaN

条目 Dataframe NaN USA section python split pandas

Python Pandas : Group datetime column into hour and minute aggregations

这似乎是相当简单的，但经过将近一整天后，我还没有找到解决方案。我已经用read_csv加载了我的数据框，并且很容易将日期和时间列解析、组合和索引到一列中，但现在我希望能够根据小时和分钟分组来reshape和执行计算，类似于你可以在excel支点。我知道如何重新采样到小时或分钟，但它维护与每个小时/分钟相关的日期部分，而我只想将数据集聚合到小时和分钟，类似于在excel数据透视表中分组并选择“小时”和“分钟”，但不选择其他任何内容。任何帮助将不胜感激。最佳答案不能吗，df是你的DataFrame:times=pd.to_datet

aggregations datetime section code 中分 python date pandas

python - Pandas DataFrame : replace all values in a column, 基于条件

我有一个简单的DataFrame，如下所示:我想从“第一季”列中选择所有值，并将超过1990年的值替换为1。在此示例中，只有巴尔的摩乌鸦队会将1996年替换为1(保持其余数据不变)。我用过以下:df.loc[(df['FirstSeason']>1990)]=1但是，它将该行中的所有值替换为1，而不仅仅是“第一季”列中的值。如何仅替换该列中的值？最佳答案您需要选择该列:In[41]:df.loc[df['FirstSeason']>1990,'FirstSeason']=1dfOut[41]:TeamFirstSeasonTot

DataFrame replace code section Season python pandas

python - Pandas 加入问题 : columns overlap but no suffix specified

我有以下数据框:print(df_a)mukeyDIPI01000003514110000054414210000064414310000074313410000084313print(df_b)mukeyniccdcd0190236411902376219023873190239441902407当我尝试加入这些数据框时:join_df=df_a.join(df_b,on='mukey',how='left')我得到错误:***ValueError:columnsoverlapbutnosuffixspecified:Index([u'mukey'],dtype='object')为

specified columns code NaN mukey python join pandas

python - Pandas 数据帧 : replace nan values with average of columns

我有一个PandasDataFrame，其中大部分填充了实数，但其中也有一些nan值。如何将nan替换为它们所在列的平均值？这个问题与这个问题非常相似:numpyarray:replacenanvalueswithaverageofcolumns但不幸的是，那里给出的解决方案不适用于pandasDataFrame。最佳答案您可以简单地使用DataFrame.fillna直接填写nan的:In[27]:dfOut[27]:ABC0-0.1669190.979728-0.6329551-0.297953-0.912674-1.365

average columns code section DataFrame python pandas nan

103 104 105106107 108 109