草庐IT

列名称

全部标签

python - Pandas - 使用其他列值作为列名选择列

我有一个包含一列的数据框,我们称它为“名称”。“名称”具有其他列的名称。我想添加一个新列,每一行的值都基于该“名称”列中包含的列名。例子:输入数据框:pd.DataFrame.from_dict({"a":[1,2,3,4],"b":[-1,-2,-3,-4],"names":['a','b','a','b']})a|b|names|---|---|----|1|-1|'a'|2|-2|'b'|3|-3|'a'|4|-4|'b'|输出数据框:pd.DataFrame.from_dict({"a":[1,2,3,4],"b":[-1,-2,-3,-4],"names":['a','b',

python - 使用pymssql从查询结果中获取列名

有没有办法从pymssql结果中获取列名?如果我指定as_dict=True我会得到一个字典,它确实包含所有列标题,但因为它是一个字典,所以它们没有排序。 最佳答案 pymssql声称支持PythonDB-API,因此您应该能够从光标对象中获取.description属性。.descriptionThisread-onlyattributeisasequenceof7-itemsequences.Eachofthesesequencescontainsinformationdescribingoneresultcolumn:(nam

python - 使用重复的列名重命名 Pandas 数据框中的列?

我有一个dfX,其中的列名称重复:In[77]:X_ROut[77]:dollarsdollars00.70850.5000我想重命名它以便我有:In[77]:X_ROut[77]:RetailCost00.70850.5000使用Pandas重命名功能确实有效:X_R.rename(index=str,columns={"dollars":"Retail","dollars":"Cost"})只给我两个名为Cost的列。在这种情况下如何重命名列? 最佳答案 这是一个动态的解决方案:In[59]:dfOut[59]:axxxz062

python - 使用列名 reshape 长到宽

您好,我在reshape我的df时遇到了问题。我有:NetflixTVDVD0.10.20.30.120.50.150.40.60.80.50.410.410.2我想将我的df转换为:Netflix[0.1,0.12,0.4]TV[0.2,0.5,0.6,0.5,0.41,0.2]DVD[0.3,0.15,0.8,0.41]不确定stack()或pivot()如何在这种df上工作。任何帮助表示赞赏。 最佳答案 堆栈堆叠在reshape数组时丢弃空值df.stack().groupby(level=1).agg(list)DVD[0.

python - 如何为 Scipy 的 csr_matrix 指定行名和列名?

我不知道这是否可能,这可能是一个幼稚的问题,但我如何将R的rownames()和colnames()设置为scipy.sparse.csr.csr_matrix?我看到my_matrix.dtype.names在这里不起作用,而且我找不到这种稀疏矩阵的任何“索引”等价物...此外,由于一些Unresolved问题...非常感谢您的帮助, 最佳答案 您必须单独维护名称,因为scipy的稀疏格式都不支持命名索引。这可能看起来像:foo=csr_matrix(...)row_names=np.array(...)col_names=np.

python - Rabbitmq mgmt 上显示未知队列名称。使用 celery 时

我只创建了下表中Rabbitmq管理Webui中显示的最后2个队列名称:表的其余部分有类似哈希的队列,我不知道:1-Whocreatedthem?(Iknowitiscelery,butwhichprocess,task,etc.)2-Whytheyarecreated,andwhattheyarecreatedfor?.我注意到,当推送的消息数量增加时,那些类似哈希的消息的数量也会增加。 最佳答案 当使用celery时,Rabbitmq被用作默认的结果后端,同时也用于存储失败的错误信息任务(引发异常)。每个新任务都会在服务器上创建

python - 如何在更改列名时正确读取 Pandas 中的 csv

绝对基础的read_csv问题。我在csv文件中有如下所示的数据-Date,OpenPrice,HighPrice,LowPrice,ClosePrice,WAP,No.ofShares,No.ofTrades,TotalTurnover(Rs.),DeliverableQuantity,%Deli.QtytoTradedQty,SpreadHigh-Low,SpreadClose-Open28-February-2015,2270.00,2310.00,2258.00,2294.85,2279.192067772602217319,73422,8043,167342840.00,11

python - Pandas:如何删除以 nan 作为列名的多列?

根据标题,这是一个可重现的示例:raw_data={'x':['this','that','this','that','this'],np.nan:[np.nan,np.nan,np.nan,np.nan,np.nan],'y':[np.nan,np.nan,np.nan,np.nan,np.nan],np.nan:[np.nan,np.nan,np.nan,np.nan,np.nan]}df=pd.DataFrame(raw_data,columns=['x',np.nan,'y',np.nan])dfxNaNyNaN0thisNaNNaNNaN1thatNaNNaNNaN2this

python - 基于 DataFrame 列名称的彩色 seaborn 箱线图

我想创建一个箱线图列表,其框的颜色取决于我用作输入的pandas.DataFrame列的名称。列名称包含指示实验条件的字符串,我希望箱线图的框基于该条件着色。我这样做是为了制作箱线图:sns.boxplot(data=data.dropna(),orient="h")plt.show()这会创建一个包含正确名称的箱线图的漂亮列表。现在,我想为名称中包含“prog+,DMSO+”的每个箱线图赋予红色,其余部分为蓝色。我尝试创建一个字典,其中列名作为键,颜色作为值:color={}forcolumnindata.columns:if'prog+,DMSO+'incolumn:color[c

python - Pandas pivot_table 列名称

对于这样的数据框:d={'id':[1,1,1,2,2],'Month':[1,2,3,1,3],'Value':[12,23,15,45,34],'Cost':[124,214,1234,1324,234]}df=pd.DataFrame(d)CostMonthValueid012411211214223121234315131324145242343342我应用pivot_tabledf2=pd.pivot_table(df,values=['Value','Cost'],index=['id'],columns=['Month'],aggfunc=np.sum,fill_valu