草庐IT

num_rows

全部标签

python - 我们如何在 Python openpyxl 包中使用 iter_rows()?

我在Python(Canopy)中使用openpyxl包来使用excel文件。我们在这个链接中有这个教程:LINKyoucanalsousetheopenpyxl.worksheet.Worksheet.iter_rows()method:>>>tuple(ws.iter_rows('A1:C2'))((,,),(,,))>>>forrowinws.iter_rows('A1:C2'):...forcellinrow:...printcell我们如何在python中导入openpyxl.worksheet.Worksheet.iter_rows()方法?我使用了这段代码:importo

python - 如何从 'pyspark.sql.types.Row' 获取所有列/属性名称?

我正在使用Spark1.4.1版的PythonAPI。我的行对象看起来像这样:row_info=Row(name=Tim,age=5,is_subscribed=false)我怎样才能得到对象属性的列表?类似于:["name","age","is_subscribed"] 最佳答案 如果您不关心顺序,您可以简单地从dict中提取这些:list(row_info.asDict())否则我知道的唯一选择是直接使用__fields__:row_info.__fields__ 关于python-

python - Pandas 数据框 : ValueError: num must be 1 <= num <= 0, 不是 1

我在尝试绘制pandasdataframe时遇到以下错误:ValueError:nummustbe1代码:importmatplotlib.pyplotaspltnames=['buying','maint','doors','persons','lug_boot','safety']custom=pd.DataFrame(x_train)//onlyaportionofthecsvcustom.columns=namescustom.hist()plt.show()我尝试再次从csv读取文件,但我得到了完全相同的错误。编辑:printx_train输出:[[0.00.00.00.00

python - Pandas 数据框 : How to print single row horizontally?

DataFrame的单行并排打印值,即column_name然后是columne_value在一行中,下一行包含下一个column_name和columne_value。例如下面的代码importpandasaspddf=pd.DataFrame([[100,200,300],[400,500,600]])forindex,rowindf.iterrows():#otheroperationsgoeshere....printrow第一行的输出为010012002300Name:0,dtype:int64有没有办法水平打印每一行并忽略数据类型名称?第一行示例:012100200300

python - Num day to Name day 与 Pandas

如果我使用这个函数pd.DatetimeIndex(dfTrain['datetime']).weekday我得到了日期,但是我找不到任何给出日期名称的函数...所以我需要将0转换为星期一,将1转换为星期二,依此类推。这是我的数据框的示例:datetimeseasonholidayworkingdayweathertempatemphumiditywindspeedcount02011-01-0100:00:0010019.8414.395810.00001612011-01-0101:00:0010019.0213.635800.00004022011-01-0102:00:0010

python - 从 scipy CSR 稀疏矩阵访问值、列索引和 row_ptr 数据

我有一个大矩阵,我想将其转换为稀疏CSR格式。当我这样做时:importscipyasspKs=sp.sparse.csr_matrix(A)printKsA是稠密的,我得到(0,0)-2116689024.0(0,1)394620032.0(0,2)-588142656.0(0,12)1567432448.0(0,14)-36273164.0(0,24)233332608.0(0,25)23677192.0(0,26)-315783392.0(0,45)157961968.0(0,46)173632816.0等...我可以使用以下方法获取行索引、列索引和值的向量:Knz=Ks.non

python - 将 mkl_set_num_threads 与 numpy 一起使用

我正尝试像这样使用mkl_set_num_threads设置numpy计算的线程数importnumpyimportctypesmkl_rt=ctypes.CDLL('libmkl_rt.so')mkl_rt.mkl_set_num_threads(4)但我一直遇到段错误:ProgramreceivedsignalSIGSEGV,Segmentationfault.0x00002aaab34d7561inmkl_set_num_threads__()from/../libmkl_intel_lp64.so获取线程数没问题:printmkl_rt.mkl_get_max_threads(

python - Pandas 数据框 : How to natively get minimum across range of rows and columns

我有一个看起来与此类似但有10,000行和500列的PandasDataFrame。对于每一行,我想找到3天前15:00到今天13:30之间的最小值。有没有一些原生的numpy方法可以快速做到这一点?我的目标是能够通过说“3天前15:00到0天前(也就是今天)13:30的最小值是多少?”来获得每一行的最小值?对于这个特定的例子,最后两行的答案是:2011-01-092481.222011-01-102481.22我目前的做法是这样的:1.Gettheearliestrow(onlythevaluesafterthestarttime)2.Getthemiddlerows3.Getthe

python - 如何在不使用 num2word 库的情况下将数字转换为单词?

我需要将1-99中的数字转换为单词。这是我到目前为止得到的:num2words1={1:'One',2:'Two',3:'Three',4:'Four',5:'Five',\6:'Six',7:'Seven',8:'Eight',9:'Nine',10:'Ten',\11:'Eleven',12:'Twelve',13:'Thirteen',14:'Fourteen',\15:'Fifteen',16:'Sixteen',17:'Seventeen',18:'Eighteen',19:'Nineteen'}num2words2=['Twenty','Thirty','Forty','F

python - Pandas 数据框 : Replacing NaN with row average

我正在尝试学习Pandas,但我一直对以下内容感到困惑。我想用行平均值替换DataFrame中的NaN。因此,像df.fillna(df.mean(axis=1))这样的东西应该可以工作,但由于某种原因它对我来说失败了。我错过了什么,我在做什么有问题吗?是因为没有实现吗?见linkhereimportpandasaspdimportnumpyasnp​pd.__version__Out[44]:'0.15.2'In[45]:df=pd.DataFrame()df['c1']=[1,2,3]df['c2']=[4,5,6]df['c3']=[7,np.nan,9]dfOut[45]:c1