草庐IT

add_column

全部标签

python - 值错误 : DataFrame index must be unique for orient ='columns'

我将许多数据框合并成一个更大的数据框,pd.concat(dfs,axis=0)然后我可以不将它转储到json(Pdb)df.to_json()***ValueError:DataFrameindexmustbeuniquefororient='columns'.我该如何解决? 最佳答案 该错误表明您的数据帧索引具有非唯一(重复)值。由于您似乎没有使用索引,因此您可以创建一个新索引:df.reset_index(inplace=True)或df.reset_index(drop=True,inplace=True)如果你想删除之前的

python - igraph:有属性时如何使用add_edges?

如果我需要在igraph中创建一个图并添加一堆边,但边具有关联的属性怎么办?看起来.add_edges只能获取没有属性的边列表,所以我一直在用.add_edge一个一个地添加它们 最佳答案 graph.add_edge('A','B',weight=20)这里A和B是节点的名字 关于python-igraph:有属性时如何使用add_edges?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/que

python - PySpark:TypeError: 'Column' 对象不可调用

我正在从HDFS加载数据,我想按特定变量过滤这些数据。但不知何故Column.isin命令不起作用。它抛出这个错误:TypeError:'Column'objectisnotcallablefrompyspark.sql.functionsimportudf,colvariables=('852-PI-769','812-HC-037','852-PC-571-OUT')df=sqlContext.read.option("mergeSchema","true").parquet("parameters.parquet")same_var=col("Variable").isin(va

python Pandas : Add column to grouped DataFrame with method chaining

首先让我说我是pandas的新手。我正在尝试在DataFrame中创建一个新列。我能够按照我的示例中所示执行此操作。但我想通过链接方法来做到这一点,所以我不必分配新变量。首先让我展示一下我想要实现的目标,以及到目前为止我做了什么:In[1]:importnumpyasnpfrompandasimportSeries,DataFrameimportpandasaspdIn[2]:np.random.seed(10)df=pd.DataFrame(np.random.randint(1,5,size=(10,3)),columns=list('ABC'))dfOut[2]:ABC22141

python - 合并 Pandas 中的 2 个数据帧 : join on some columns, 总结其他

我想合并特定列(key1,key2)上的两个数据框,并求和另一列(value)的值。>>>df1=pd.DataFrame({'key1':range(4),'key2':range(4),'value':range(4)})key1key2value0000111122223333>>>df2=pd.DataFrame({'key1':range(2,6),'key2':range(2,6),'noise':range(2,6),'value':range(10,14)})key1key2noisevalue022210133311244412355513我想要这样的结果:key1k

python - Pandas 数据框 : add & remove prefix/suffix from all cell values of entire dataframe

要为数据框添加前缀/后缀,我通常会执行以下操作。比如添加后缀'@',df=df.astype(str)+'@'这基本上为所有单元格值附加了一个'@'。我想知道如何去掉这个后缀。pandas.DataFrame类是否有直接从整个DataFrame中删除特定前缀/后缀字符的方法?我试过在使用rstrip('@')时遍历行(作为系列),如下所示:forindexinrange(df.shape[0]):row=df.iloc[index]row=row.str.rstrip('@')现在,为了从这个系列中制作数据框,new_df=pd.DataFrame(columns=list(df))n

python - PyQt : removing QTreeView columns

我正在使用带有QFileSystemModel的QTreeView。它显示我不需要的列,如大小、类型、修改日期。如何从View中删除它们?我在模型或View中找不到任何removeColumn。 最佳答案 获取QHeaderView通过在其上调用header()来隐藏TreeView,headerview知道列并可以通过hideSection隐藏它们. 关于python-PyQt:removingQTreeViewcolumns,我们在StackOverflow上找到一个类似的问题:

python - 计算 H2o 中的 MAPE : Error: Provided column type POSIXct is unknown

按照我回答的问题:RorPython-loopthetestdata-Predictionvalidationnext24hours(96valueseachday)我想使用H2o包预测第二天。您可以在上面的相同链接中找到我的数据集的详细说明。H2o中的数据维度不同。所以,做出预测后,我要计算MAPE我必须将训练和测试数据更改为H2o格式train_h2o上面的代码适用于日前的“Non-H2o”预测验证,它计算每一天的MAPE。我尝试将H2o预测模型转换为正常格式,但根据:https://stackoverflow.com/a/39221269/9341589,这是不可能的。对H2O进

python - SQL炼金术ORM : modify the columns returned from a query

如果我有一个SQLAlchemyORM查询:admin_users=Session.query(User).filter_by(is_admin=True)是否可以修改该查询返回的列?例如,我只能选择User.id列,并在子查询中使用它:admin_email_addresses=Session.query(EmailAddress)\.filter(EmailAddress.user_id.in_(admin_users.select_columns(User.id))注意:.values()方法将不起作用,因为它执行查询并返回可迭代的结果(例如,EmailAddress.user_

python - 完整性错误 : null value in column "city_id " violates not-null constraint

我两个模型:classCity(models.Model):name=models.CharField(max_length=50)country=models.OneToOneField(Country)def__unicode__(self):returnself.nameclassUserProfile(models.Model):user=models.OneToOneField(User)city=models.OneToOneField(City)当我同步数据库并创建管理员用户时:IntegrityError:nullvalueincolumn"city_id"violat