一列_草庐IT

python - 如何从 Pandas 中的另一列中减去字符串类型列的值

我有一个这样的数据框dfcol1col2col3AblackberryblackBgreenapplegreenCredwinered我想从col2值中减去col3值，结果看起来像df1col1col2col3AberryblackBapplegreenCwinered如何使用pandas有效地做到这一点最佳答案将listcomprehension与replace和split结合使用:df['col2']=[a.replace(b,'').strip()fora,binzip(df['col2'],df['col3'])]pri

python Pandas 39 col code dataframe

Python Pandas 使用另一列删除子字符串

我试过四处搜索，但找不到一个简单的方法来做到这一点，所以我希望你的专业知识能有所帮助。我有一个包含两列的Pandas数据框importnumpyasnpimportpandasaspdpd.options.display.width=1000testing=pd.DataFrame({'NAME':['FIRST',np.nan,'NAME2','NAME3','NAME4','NAME5','NAME6'],'FULL_NAME':['FIRSTLAST',np.nan,'FIRSTLAST','FIRSTNAME3','FIRSTNAME4LAST','ANOTHERNAME','

Python Pandas NAME 39 FIRST string replace series

python - 从查询结果中获取一列的值列表

我有一个User模型，用户可以使用相同的名称。我想获取所有具有给定名称的用户的电子邮件地址。但是，我必须对查询结果执行result[0].email以获取一行的电子邮件。我可以用for循环来做到这一点，但是有没有一种方法可以只获取一个字段的列表而不必每次都这样做？my_result=db.session.query(my_table).filter_by(name=name)emails=[]forrinmy_result:emails.append(r.email) 最佳答案不，没有真正解决SQLAlchemy查询返回字典列表这

python 从 section code email sqlalchemy

python - 清理一列字符串并添加新列的更有效方法

我有一个数据框df，其中包含列['metric_type','metric_value']。对于每一行，我想确保我有一个名称等于'metric_type'且该列的值等于'metric_value'的列。我的一个问题是'metric_type'有我想去掉的虚假空格。考虑数据框df:df=pd.DataFrame([['a',1],['b',2],['c',3]],columns=['metric_type','metric_value'])print(df)metric_typemetric_value0a11b22c3请注意，'metric_type'的每个值在不同的地方都有空格。我创

python 清理 metric code metric_type pandas apply

python - Django - 查询给出一列不等于同一模型中另一列的行

我的模型有3个字段classTable(models.Model):in_time=models.DateTimeField(null=True,blank=True)actual_time=models.DateTimeField(null=True,blank=True)我想以这种方式获取结果:select*fromTablewherein_time>'2013-12-3100:00:00'andin_time!=actual_time谁能帮我完成这个result=Table.objects.filter(in_time__gte='2013-12-3100:00:00')

不等 python section time in_time django django-models django-queryset

python - 如何在 Pandas 中创建新列，并有条件重复另一列的值？

我是Python的初学者，我有一个看起来像这样的大DataFrame:importpandasaspddf=pd.DataFrame({'Total':[10,10,10,10,10,10,10,10,10,10],\'Type':['Child','Boy','Girl','Senior','','','','','',''],\'Count':[4,5,1,0,'','','','','','']})df[["Total","Type","Count"]]df输出:TotalTypeCount010Child4110Boy5210Girl1310Senior041051061071

中创何在 39 10 code python pandas dataframe

python - 如果另一列中的相应值也为 NaN，则将一列中的所有值设置为 NaN

目标是通过将一列中的所有值设置为NaN来维护两列之间的关系。具有以下数据框:df=pd.DataFrame({'a':[np.nan,2,np.nan,4],'b':[11,12,13,14]})ab0NaN1112122NaN133414维护从a列到b列的关系，其中更新所有NaN值导致:ab0NaNNaN12122NaNNaN3414实现所需行为的一种方法是:df.b.where(~df.a.isnull(),np.nan)有没有其他方法可以维持这样的关系？最佳答案您可以在NaN行上使用mask。In[366]:df.mask

NaN 相应 code section python pandas dataframe updating

python - 删除 Pandas 中的重复项，不包括一列

这看起来很简单，但我在互联网上找不到任何相关信息。我有一个如下所示的数据框:CityStateZipDateDescriptionEarlhamIA50072-10362014-10-10PostmarketAssurance:DevicesEarlhamIA50072-10362014-10-10Compliance:DevicesMadridIA50156-17482014-09-10DrugQualityAssurance如何消除与5列中的4列匹配的重复项？与Description不匹配的列。结果是CityStateZipDateDescriptionEarlhamIA50072

python Pandas code section Description

python - Matplotlib:pcolor() 不绘制最后一行和最后一列？

似乎PCOLOR正在砍掉我数据集的最后一行和最后一列。打印下面zi的形状显示它是(22,22)，如我所料，但显示的面积为21x21平方...知道为什么没有绘制最后一行和最后一列吗？defpcolor_probs(x,y,z,x_str,y_str,t_str):xi=np.arange(min(x),max(x)+1,1)yi=np.arange(min(y),max(y)+1,1)zi=griddata(x,y,z,xi,yi)printnp.shape(xi),np.shape(yi),np.shape(zi)#fixNANszi=np.asarray(zi)foriinrange

Matplotlib python horizontal vertical shape

python - Pandas :一列基于另一列的箱线图

假设我有一个如下所示的数据框:my_dataframe:AgeGroup031A124A225A336A450NaN527A649A724A863A925A1065A1167A1259A13NaNB1430B1519B1657B1762B1830B1950B2042B2145C2259C2328C2437C2529C我想绘制每个组(A、B、C)的年龄箱线图。请注意，我在数据框中有一些NaN值。我如何在Pandas中执行此操作？最佳答案第一次看错了，所以给出了直方图的答案……把它记在下面。对于箱线图，代码是:bp=df.boxpl

python Pandas section code pre matplotlib