列名称

python - 如何将列名转换为 pandas 中的列值 - python

df=pd.DataFrame(index=['x','y'],data={'a':[1,2],'b':[3,4]})如何将列名转换为列值？这是我想要的输出c1c2x1ax3by2ay4b 最佳答案您可以使用:print(df.T.unstack().reset_index(level=1,name='c1').rename(columns={'level_1':'c2'})[['c1','c2']])c1c2x1ax3by2ay4b或者:print(df.stack().reset_index(level=1,name='c1'

列名 python 39 section code pandas

python - 根据列名拆分 Pandas 数据框

有没有办法根据列名拆分pandas数据框？例如，考虑数据框具有以下列df=['A_x','B_x','C_x','A_y','B_y','C_y']我想创建两个数据帧X=['A_x','B_x','C_x']和Y=['A_y','B_y','C_y'].我知道有可能这样做:d={'A':df.A_x,'B':df.B_x,'C':df.B_x}X=pd.DataFrame(data=d)但这并不理想，因为在我的例子中，我在df中有2200列。有没有更优雅的解决方案？最佳答案你可以使用df.filter(regex=...):im

列名 python code section pandas

python - Pandas - 在 applymap 期间获取每个元素的行和列名称

我正在尝试比较一个字符串列表的相似性，并在pandas数据框中获取结果以供检查；所以我使用一个列表作为索引，另一个作为列列表。然后我想计算它们的“Levenshtein相似度”(一个比较两个词之间相似度的函数)。我尝试在每个单元格上使用applymap来做到这一点，并将单元格索引与单元格列进行比较。我怎么能那样做？或者更简单的替代方案？things=['car','bike','sidewalk','eatery']action=['walking','caring','biking','eating']matrix=pd.DataFrame(index=things,columns=

列名 applymap matrix code index python pandas

python - 通过列名和工作表名称获取列数据

有没有办法使用pythonxlrd访问特定工作表中列中的所有行。例如:workbook=xlrd.open_workbook('ESCdata.xlsx',on_demand=True)sheet=workbook.sheet['sheetname']arrayofvalues=sheet['columnname']还是必须自己创建字典？Excel非常大，所以我希望避免遍历所有列名/工作表最佳答案是的，您正在寻找col_values()工作表方法。而不是arrayofvalues=sheet['columnname']你需要做的

列名 python code section arrayofvalues excel xlrd

python - 替换 pandas df 列名称中的字符串

我在pandas中有一个数据框，列名为“string_string”，我试图通过删除“_”和以下字符串来重命名它们。比如我想把“12527_AC9E5”改成“12527”。我尝试使用各种替换选项，并且可以替换字符串的特定部分(例如，我可以替换所有“_”)，但是当我引入通配符时，我没有达到预期的结果。下面是一些我认为可行但行不通的方法。如果我删除它们起作用的通配符(即，它们替换_)。df=df.rename(columns=lambdax:x.sub('_.+',''))df.columns=df.columns.str.replace('_.+','')感谢任何帮助

列名 python section columns 39 regex

python - 展平多索引 Pandas 数据框，其中列名成为值

假设我有以下数据框:importpandasaspddf=pd.DataFrame(data={'Status':['green','green','red','blue','red','yellow','black'],'Group':['A','A','B','C','A','B','C'],'City':['Toronto','Montreal','Vancouver','Toronto','Edmonton','Winnipeg','Windsor'],'Sales':[13,6,16,8,4,3,1]})df.drop('Status',axis=1,inplace=True

多索展平 39 Vancouver Toronto python pandas

python - 将列名称映射到随机森林特征重要性

我正在尝试绘制随机森林模型的特征重要性并将每个特征重要性映射回原始系数。我设法创建了一个显示重要性的图，并使用原始变量名称作为标签，但现在它按照变量名称在数据集中的顺序(而不是按重要性顺序)对变量名称进行排序。我如何按照功能重要性对它们进行排序？谢谢!我的代码是:importances=brf.feature_importances_std=np.std([tree.feature_importances_fortreeinbrf.estimators_],axis=0)indices=np.argsort(importances)[::-1]#Printthefeatureranki

列名重要性 importances feature section python pandas

python - 从 hdf 文件中获取列名(标题)

我想知道如何获取hdf文件的列名(似乎存储在hdfheader中)；例如，一个文件可能有名为[a,b,c,d]的列，而另一个文件有[a,b,c]列，而另一个文件有[b,e,r,z]列；我想找出哪些有哪些。非常感谢任何帮助! 最佳答案要在python之外执行此操作，您可以使用h5dump通过像h5dump--headermy.hdf5这样的东西在python中你可以使用h5py例如，这是我访问HDF-EOS5文件的字段名称的方式:>>>importh5py>>>f=h5py.File('/tmp/temp.hdf','r')>>>f

列名 python 34 3072 39 pandas hdf5 hdfstore

python - 如何在两个数据框中查找相同的列名并组合匹配的列

我想遍历两个数据框的列名，找到具有相同列名的列，并将它们组合起来创建一个新的数据框。我试图在for循环中编写一个if-else条件，但它不起作用。具体来说，我有两个这样的数据框:df1=pd.DataFrame({'A':{'2019Q1':1,'2019Q2':2,'2019Q3':3},'B':{'2019Q1':1,'2019Q2':3,'2019Q3':5},'C':{'2019Q1':2,'2019Q2':4,'2019Q3':6}})df2=pd.DataFrame({'A':{'2019Q1':4,'2019Q2':5,'2019Q3':6},'B':{'2019Q1':

列名何在 39 2019 section python pandas loops

python - 如何在具有相同列名的 sqlalchemy 查询中加入不同的表？

表格的描述是:License:id,customer_id,product_id,expires_atCustomer:id,nameProduct:id,name我是这样查询的:result=session.\query(License.id,License.customer_id,License.product_id,License.status,License.expires_at,\Customer.name,\Product.name).\#somefilteringonthosecolumns(JOINconditions)all()我希望连接的表包含:License.id

中加列名 code name section python mysql sql join sqlalchemy

43 44 454647 48 49