列名称

python - 在 pandas 数据框中设置列名 from_dict with orient = 'index'

我已经看过这个问题:pandascreatenamedcolumnsindataframefromdict.但是，我的示例略有不同。我有一本字典:my_dict={'key1':[1,2,3]，'key2':[4,5,6]，'key3':[7,8,9]}然后我创建了一个pandas数据框:df=pd.DataFrame.from_dict(my_dict,orient='index')，它是面向行的。但是，当编写columns=['one','two','three']时，出现错误，如上面的链接所示。如何命名它们？最佳答案有什么

中设列名 section dict code python dictionary key

Python Pandas - 具有不同列的 Concat 数据框忽略列名

我有两个pandas.DataFrames我想将其合二为一。数据框具有相同数量的列，顺序相同，但具有不同语言的列标题。如何有效地组合这些数据框？df_gerindexDatumZahl1Zahl201-1-171212-1-1734df_ukindexDateNo1No201-1-175612-1-1778desiredoutputindexDatumZahl1Zahl201-1-171212-1-173421-1-175632-1-1778到目前为止，我想到的唯一方法是重命名列标题，然后使用pd.concat([df_ger,df_uk],axis=0,ignore_index=Tr

同列列名 code index pandas python dataframe concat

python - 以编程方式将列名添加到 numpy ndarray

我正在尝试将列名添加到numpyndarray，然后按名称选择列。但它不起作用。我无法确定问题是在我添加名称时出现，还是在稍后尝试调用它们时出现。这是我的代码。data=np.genfromtxt(csv_file,delimiter=',',dtype=np.float,skip_header=1)#Addheaderscsv_names=[s.strip('"')forsinfile(csv_file,'r').readline().strip().split(',')]data=data.astype(np.dtype([(n,'float64')fornincsv_names]

列名 ndarray code section data python arrays numpy multidimensional-array

python - Pandas:引用列名，不区分大小写

使用PandasDataFrame，假设我在csv文件中有一堆列，我希望能够通过不区分大小写的名称访问其中的任何一个.importpandasaspddf=pd.read_csv(path_to_csv,delimiter=",")df2=df["Size"]实际的列名是"Size"。我该怎么做才能使df2=df["sIZE"]也被接受？最佳答案你可以调用str.lower在列上:In[12]:df=pd.DataFrame(columns=['Size','COLOUR','caTegory'])df.columnsOut[1

列名 python code section 39 pandas case-insensitive

python pandas 通过列名列表从数据框中选择列

我有一个包含很多列的数据框。现在我只想选择某些列。我已将要选择的列的所有名称保存到Python列表中，现在我想根据此列表过滤我的数据框。我一直在努力:df_new=df[[list]]其中列表包含我要选择的所有列名。但是我得到了错误:TypeError:unhashabletype:'list'这方面有什么帮助吗？最佳答案你可以删除一个[]:df_new=df[list]最好使用其他名称作为list，例如L:df_new=df[L]它看起来像工作，我只尝试简化它:L=[]forxindf.columns:ifnot"_"inx[

列名中选 code section pre python pandas dataframe

python - 如何将 VectorAssembler 输出的特征映射回 Spark ML 中的列名？

我正在尝试在PySpark中运行线性回归，我想创建一个表，其中包含汇总统计信息，例如数据集中每一列的系数、P值和t值。但是，为了训练线性回归模型，我必须使用Spark的VectorAssembler创建一个特征向量，现在对于每一行我都有一个特征向量和目标列。当我尝试访问Spark的内置回归汇总统计信息时，他们为我提供了每个统计信息的非常原始的数字列表，并且无法知道哪个属性对应于哪个值，这很难手动找出大量的列。如何将这些值映射回列名称？例如，我的当前输出是这样的:Coefficients:[-187.807832407,-187.058926726,85.1716641376,10595

列名 VectorAssembler code 34 pre python apache-spark machine-learning pyspark apache-spark-ml

python - 如何在 Pandas 中连接两个具有不同列名的数据框？ - Python

df1=pd.DataFrame({'a':[1,2,3],'x':[4,5,6],'y':[7,8,9]})df2=pd.DataFrame({'b':[10,11,12],'x':[13,14,15],'y':[16,17,18]})我正在尝试使用df1中的键合并两个数据帧。我想我应该为此使用pd.merge，但我如何告诉pandas将值放在df2的b列中df1的a列。这是我要实现的输出:axy014712582369310131641114175121518 最佳答案只需使用concat和renamedf2的列，因此它对齐:

列名何在 code section 39 python pandas merge

python - 堆叠 pandas DataFrame 时设置列名

当堆叠一个pandasDataFrame时，返回一个Series。通常在我堆叠一个DataFrame之后，我将它转换回一个DataFrame。但是，来自堆叠数据的默认名称使得重命名列有点麻烦。我正在寻找的是一种更简单/内置的方法，可以在堆叠后为列提供合理的名称。例如，对于以下DataFrame:In[64]:df=pd.DataFrame({'id':[1,2,3],...:'date':['2015-09-31']*3,...:'value':[100,95,42],...:'value2':[200,57,27]}).set_index(['id','date'])In[65]:d

列名堆叠 value code 2015 python pandas

python - 将列名从 int 转换为 pandas 中的字符串

我有一个包含混合列名的pandas数据框:1,2,3,4,5,'类'当我将此数据帧保存到h5file时，它说性能会因混合类型而受到影响。如何在pandas中将整数转换为字符串？最佳答案您可以简单地使用df.columns=df.columns.astype(str):In[26]:df=pd.DataFrame(np.random.random((3,6)),columns=[1,2,3,4,5,'Class'])In[27]:dfOut[27]:12345Class00.7734230.8650910.6149560.21

列名 python class 39 section pandas

python - 为通过 groupby 应用结果设置列名称

这是一个相当微不足道的问题，但它触发了我的强制症，在过去的半小时里我一直没能找到合适的解决方案。作为背景，我希望为DataFrame中的每个组计算一个值(我们称之为F)，该值源自现有DataFrame中不同列的聚合度量。这是我正在尝试做的一个玩具示例:importpandasaspdimportnumpyasnpdf=pd.DataFrame({'A':['X','Y','X','Y','Y','Y','Y','X','Y','X'],'B':['N','N','N','M','N','M','M','N','M','N'],'C':[69,83,28,25,11,31,14,37,1

列名 groupby 39 section code python pandas

46 47 484950 51 52