Dataframe

python - 将 pandas 数据框从行 reshape 为列

我正在尝试reshape我的数据。乍一看，这听起来像是转置，但实际上不是。我尝试了熔化、堆叠/取消堆叠、连接等。用例我希望每个独特的个人只有一行，并将所有工作历史记录在列中。对于客户而言，跨行阅读信息比逐列阅读更容易。这是数据:importpandasaspdimportnumpyasnpdata1={'Name':["Joe","Joe","Joe","Jane","Jane"],'Job':["Analyst","Manager","Director","Analyst","Manager"],'JobEffDate':["1/1/2015","1/1/2016","7/1/201

python - 将函数应用于 pandas Python 中的每一行时出现数据转换错误

我在python中的pandas中有一个数据框，类似于这样的东西-contest_login_countcontest_participation_countipn_ratio0110.0000001330.0833332330.0000003330.06666745130.1028045230.4074076130.0000007120.000000853910.2641519120.000000现在我想对这个数据帧的每一行应用一个函数函数是这样写的-deffindCluster(clusterModel,data):returnclusterModel.predict(data)我

行时 python code section pre function pandas dataframe apply

python - 如何使用字典对 DataFrame 进行子集化？

比如说，我给出了一个DataFrame，其中大部分列都是分类数据。>data.head()agerisksexsmoking028nomaleno158nofemaleno227nomaleyes326nomaleno429yesfemaleyes我想通过这些分类变量的键值对字典对这些数据进行子集化。tmp={'risk':'no','smoking':'yes','sex':'female'}因此，我想要以下子集。data[(data.risk=='no')&(data.smoking=='yes')&(data.sex=='female')]我想做的是:data[tmp]执行此操作

DataFrame python 39 female code pandas categorical-data

python - 完全相同的文本字符串不匹配

我在数据框title和store中有两列，其中包含我想对数据框进行子集化的文本字符串:In[84]:2631coffee‑matesugarfreefrench...jet.com2633nestlecoffeematenaturalbliss...jet.com2634coffee‑mateliquidcoffeecreamer,...jet.com3085coffee‑matehazelnut...jet.com当我尝试时:df[(df.title.str.contains('coffee-mate'))&(df.store.str.contains('jet.com'))]我得到

python 完全 code coffee mate string pandas dataframe character-encoding

python - 向 Pandas 数据框添加多索引并保持当前索引

我正在尝试合并来自不同参与者的时间过程数据。我迭代地为每个参与者提取一个数据框，并在循环结束时将它们连接起来。在连接之前，我想将参与者的ID添加到附加索引中。这看起来非常简单，但我找不到关于这个问题的任何信息:(我想转这个col0111.12NaN进入:colID0111.12NaN我知道我可以创建一个新索引，例如:multindex=[np.array(ID*len(data)),np.array(np.arange(len(data)))]但那是没有尽头的不雅，而且-看到我在半小时内以高频测量-甚至会变得有点慢:/我想提一下，我最近发现我的问题与thisotherquestion重

多索 python code section pre pandas dataframe multi-index

python - 将包含值列表的字典转换为数据框

我花了一段时间查看SO，似乎我遇到了一个独特的问题。我有一个字典，如下所示:dict={123:[2,4],234:[6,8],...}我想将这个包含值列表的字典转换为如下所示的3列数据框:time,value1,value2123,2,4234,6,8...我可以跑:pandas.DataFrame(dict)但这会生成以下内容:123,234,...2,6,...4,8,...可能是一个简单的修复，但我仍在挑选Pandas 最佳答案您可以按照levi的建议对数据进行预处理，也可以在创建数据框后对其进行转置。testdict={

为数 python section code pre list dictionary pandas dataframe

python通过列表创建一个包含一行的数据框

在python中，假设我有一个列表[1,2,3,...,100]，我想使用这个列表创建一个数据框，它只有一行，行值是列表。执行此操作最快且优雅的方法是什么？最佳答案将列表作为列表参数传递给data:In[11]:l=range(1,100)pd.DataFrame(data=[l])Out[11]:0123456789...8990919293949596\012345678910...9091929394959697979809899[1rowsx99columns]您可以将列名称作为参数传递给DataFrame构造函数或直接

python 通过 section code DataFrame list pandas

python - 如何获得两个数据框的交集？

我有两个格式相似的数据框:df1=DataFrame({'a':[0,1,2,3,4],'b':['q','r','s','t','u']})df1ab00q11r22s33t44udf2=DataFrame({'a':[4,3,2,1,999],'b':['u','r','s','t','u']})df2ab04u13r22s31t4999u我想获得一个新的数据框，其中的行同时出现在这两个数据中(忽略索引)。所以上面的例子给出了一个dataframeab04u12s我如何得到这个路口？最佳答案你可以只执行merge,这将使用所

python 如何 39 section code pandas dataframe

python - 在 Pandas 数据框中的列子集中查找具有非零值的行

我有一个包含4列字符串和其他整数的数据框。现在我需要找出那些数据行，其中至少一列是非零值(或>0)。manwra,sahAyaH,T7,0,0,0,0,Tmanwra,akriti,T5,0,0,1,0,Kawma,prabrtih,B6,0,1,1,0,S我的输出应该是manwra,akriti,T5,0,0,1,0,Kawma,prabrtih,B6,0,1,1,0,S我尝试了以下方法来获得答案。字符串值位于第0、1、2和-1列(最后一列)。KT[KT.ix[:,3:-2]!=0]我收到的输出是NaN,NaNNaN,NaN,NaN,NaN,NaN,NaNNaN,NaN,NaN,Na

列子 python NaN code False pandas dataframe

python - 意外类型 : <class 'pyspark.sql.types.DataTypeSingleton' > when casting to Int on a ApacheSpark Dataframe

尝试将StringType转换为pyspark数据帧上的IntType时出现错误:joint=aggregates.join(df_data_3,aggregates.year==df_data_3.year)joint2=joint.filter(joint.CountyCode==999).filter(joint.CropName=='WOOL')\.select(aggregates.year,'Production')\.withColumn("ProductionTmp",df_data_3.Production.cast(IntegerType))\.drop("Prod

amp DataTypeSingleton code Production 34 python apache-spark dataframe pyspark apache-spark-sql

34 35 363738 39 40