Dataframe

python - 删除列值类型为字符串 Pandas 的行

我有一个Pandas数据框。我的专栏之一应该只是花车。当我尝试将该列转换为float时，系统提醒我其中有字符串。我想删除此列中的值为字符串的所有行... 最佳答案将convert_objects与参数convert_numeric=True结合使用，这会将任何非数值强制转换为NaN:In[24]:df=pd.DataFrame({'a':[0.1,0.5,'jasdh',9.0]})dfOut[24]:a00.110.52jasdh39In[27]:df.convert_objects(convert_numeric=True)O

python - 如何按唯一组拆分数据框并保存到 csv

我有一个pandas数据框，我想对其进行迭代。我的数据框的一个简化示例:chrstartendGeneValueMoreDatachr1123123HAPPY41.13.4chr1125129HAPPY45.94.5chr1140145HAPPY39.34.1chr1342355SAD34.29.0chr1360361SAD44.38.1chr1390399SAD29.07.2chr1400411SAD35.66.5chr1462470LEG20.02.7我想遍历每个独特的基因并创建一个名为:forGeneindf:##thisiswhereIneedthemosthelpOutFil

python csv chr1 chr code pandas dataframe

python - 如何根据 PySpark 中的数组值进行过滤？

我的架构:|--Canonical_URL:string(nullable=true)|--Certifications:array(nullable=true)||--element:struct(containsNull=true)|||--Certification_Authority:string(nullable=true)|||--End:string(nullable=true)|||--License:string(nullable=true)|||--Start:string(nullable=true)|||--Title:string(nullable=true)

PySpark python code vendorTags 34 apache-spark dataframe apache-spark-sql

python - Pandas:创建数据框而不按字母顺序自动排序列名

我正在创建一个初始pandas数据框来存储从其他代码生成的结果:例如result=pd.DataFrame({'date':datelist,'total':[0]*len(datelist),'TT':[0]*len(datelist)})使用datelist预定义列表。然后其他代码会为每个date输出一些total和TT的数字，我将把它存储在result中数据框。所以我希望第一列是date，第二列是total，第三列是TT。但是，pandas会在创建时自动将其按字母顺序重新排序为TT、date、total。虽然之后我可以再次手动重新排序，但我想知道是否有更简单的方法一步完成。我觉得

列名 python code datelist 39 pandas dataframe

Python:如何将 .mean 的特定列添加到数据框

如何将b和c的方法添加到我的数据框中？我尝试了合并，但它似乎没有用。所以我想用df.groupBy('date').mean()的结果将两个额外的列b_mean和c_mean添加到我的数据框中数据框abcdate023511591123711我有以下代码importpandasaspda=[{'date':1,'a':2,'b':3,'c':5},{'date':1,'a':5,'b':9,'c':1},{'date':1,'a':3,'b':7,'c':1}]df=pd.DataFrame(a)x=df.groupby('date').mean()编辑:期望的输出如下df.group

Python mean 39 code pandas dataframe

python - 在python中将字典转换为排序字典

我想在python中将字典转换为排序的字典data=pandas.read_csv('D:\myfile.csv')forcolname,dtypeindata.dtypes.to_dict().iteritems():ifdtype=='object':printcolnamecount=data[colname].value_counts()d=dict((str(k),int(v))fork,vincount.iteritems())f=dict(sorted(d.iteritems(),key=lambdaitem:item[1],reverse=True)[:5])print

python 字典 39 code gt pandas dataframe sorteddictionary

python - PANDAS 从 df 删除一系列行

我想从数据框的底部删除m行。它是整数索引(有孔)。如何才能做到这一点？Pandas==0.10.1python==2.7.3 最佳答案使用切片选择你想要的部分:df[:-m]如果你想删除一些中间行，你可以使用drop:df.drop(df.index[3:5]) 关于python-PANDAS从df删除一系列行，我们在StackOverflow上找到一个类似的问题： https://stackoverflow.com/questions/15703283/

python PANDAS section code stackoverflow dataframe

python - 从数据库中的表中获取数据

我想从postgresql数据库中提取数据并在脚本中使用该数据(以数据帧格式)。这是我的初步尝试:frompandasimportDataFrameimportpsycopg2conn=psycopg2.connect(host=host_address,database=name_of_database,user=user_name,password=user_password)cur=conn.cursor()cur.execute("SELECT*FROM%s;"%name_of_table)the_data=cur.fetchall()colnames=[desc[0]ford

python 中 code import section postgresql pandas dataframe psycopg2

python - 使用 openpyxl 将 pandas 数据框复制到 excel

我在模板文件中保存了一些复杂的格式，我需要将pandas数据帧中的数据保存到其中。问题是当我使用pd.to_excel保存到此工作表时，pandas会覆盖格式。有没有办法以某种方式将df中的值“粘贴”到工作表中？我正在使用Pandas0.17importopenpyxlimportpandasaspdwb=openpyxl.load_workbook('H:/template.xlsx')sheet=wb.get_sheet_by_name('spam')sheet.title='dfdata'wb.save('H:/df_out.xlsx')xlr=pd.ExcelWriter('d

openpyxl python section pandas dataframe clipboard

python - 从数据框中删除反向重复项

我有一个包含两列的数据框，A和B。A和B的顺序在此上下文中并不重要；例如，我认为(0,50)和(50,0)是重复的。在pandas中，什么是从数据框中删除这些重复项的有效方法？importpandasaspd#Initialdataframe.data=pd.DataFrame({'A':[0,10,11,21,22,35,5,50],'B':[50,22,35,5,10,11,21,0]})dataAB005011022211353215422105351165217500#Desiredoutputwith"duplicates"removed.data2=pd.DataFrame

反向 python code section duplicates pandas dataframe

41 42 434445 46 47