草庐IT

show-columns

全部标签

python - 为什么 plt.show() 显示一个额外的空白数字

我使用python2.7并尝试绘制一个简单的百分位数bat图。我得到了我想要的图形,问题是,使用它时,当使用plt.show()我得到一个额外的空白图像,我尝试了plt.close()、plt.clf()和plt.figure()来创建一个干净的plt对象,这是我的函数:importmatplotlib.pyplotaspltplt.grid(True)data=zip(*percentiles)data=[list(i)foriindata]tick_range=data[0]ticks=[str(i)+"%"foriintick_range]tick_range=[x+2.5for

python - 导入文本文件 : No Columns to parse from file

我正在尝试从sys.stdin获取输入。这是一个用于hadoop的mapreducer程序。输入文件为txt格式。数据集预览:19624238812509491863023891717742223771878887116244512880606923166346188639759629847448841828061152652881171488253465589162846730545138863248176863883603013622572879372434286101458797811252002225876042340210403891035994224293888104457

python - Pandas 数据框 : how to count the number of 1 rows in a binary column?

我有以下Pandas数据框:importpandasaspdimportnumpyasnpdf=pd.DataFrame({"first_column":[0,0,0,1,1,1,0,0,1,1,0,0,0,0,1,1,1,1,1,0,0]})>>>dffirst_column00102031415160708191100110120130141151161171181190200first_column是0和1的二进制列。有连续的“集群”,它们总是成对出现,至少有两个。我的目标是创建一个“计算”每组行数的列:>>>dffirst_columncounts000100200313413

python - 值错误 : DataFrame index must be unique for orient ='columns'

我将许多数据框合并成一个更大的数据框,pd.concat(dfs,axis=0)然后我可以不将它转储到json(Pdb)df.to_json()***ValueError:DataFrameindexmustbeuniquefororient='columns'.我该如何解决? 最佳答案 该错误表明您的数据帧索引具有非唯一(重复)值。由于您似乎没有使用索引,因此您可以创建一个新索引:df.reset_index(inplace=True)或df.reset_index(drop=True,inplace=True)如果你想删除之前的

python - matplotlib show() 方法不打开窗口

我正在使用mac,当我使用matplotlib执行以下操作时:importmatplotlib.pyplotaspltimportmatplotlib.mlabasmlabimportpylabasP...plt.plot(x,y)plt.show()因此,plt.show不会打开窗口或任何东西,而plt.savefig可以正常工作。可能是什么问题? 最佳答案 Pyplot只会弹出一个图形窗口,如果matplotlib.rcParams['interactive']==True这种情况如果你:之前在您的脚本中调用过plt.ion()

python - 为什么 'pip show' 或 'pip list' 对我不起作用?

Python的pip正在为我安装和更新包,但似乎不支持一些记录的命令(至少在OS10.8.2和Python2.7上运行1.2.1。2).当我尝试piplist或pipshow我明白了Usage:pipCOMMAND[OPTIONS]Nocommandbythenamepip(maybeyoumeant"pipinstall")这些命令是否尚未实现(尽管已记录在案)? 最佳答案 您正在寻找的新功能是最近的——它们在1.2.1.post1中,但不在1.2.1中,您可能正在查看的文档(http://www.pip-installer.or

python - PySpark:TypeError: 'Column' 对象不可调用

我正在从HDFS加载数据,我想按特定变量过滤这些数据。但不知何故Column.isin命令不起作用。它抛出这个错误:TypeError:'Column'objectisnotcallablefrompyspark.sql.functionsimportudf,colvariables=('852-PI-769','812-HC-037','852-PC-571-OUT')df=sqlContext.read.option("mergeSchema","true").parquet("parameters.parquet")same_var=col("Variable").isin(va

python Pandas : Add column to grouped DataFrame with method chaining

首先让我说我是pandas的新手。我正在尝试在DataFrame中创建一个新列。我能够按照我的示例中所示执行此操作。但我想通过链接方法来做到这一点,所以我不必分配新变量。首先让我展示一下我想要实现的目标,以及到目前为止我做了什么:In[1]:importnumpyasnpfrompandasimportSeries,DataFrameimportpandasaspdIn[2]:np.random.seed(10)df=pd.DataFrame(np.random.randint(1,5,size=(10,3)),columns=list('ABC'))dfOut[2]:ABC22141

python - matplotlib 图形在 show() 和 savefig() 之间消失

我在字典中保留了一组对数字的引用,以便以后需要时可以保存它们。如果调用show()命令并先查看它们,我很烦恼保存的数字是空白的。由于show()命令block并且我没有使用类似spyder的解释器,因此我必须在到达savefig()之前关闭图形figures['myfig_1']=figure()...figures['myfig_n']=figure()...#show()#disablingthismakestheproblemgoawayprint"Saving:"forfiginfigures:figure(figures[fig].number)savefig(fig)pri

python - 合并 Pandas 中的 2 个数据帧 : join on some columns, 总结其他

我想合并特定列(key1,key2)上的两个数据框,并求和另一列(value)的值。>>>df1=pd.DataFrame({'key1':range(4),'key2':range(4),'value':range(4)})key1key2value0000111122223333>>>df2=pd.DataFrame({'key1':range(2,6),'key2':range(2,6),'noise':range(2,6),'value':range(10,14)})key1key2noisevalue022210133311244412355513我想要这样的结果:key1k