草庐IT

fit_generator

全部标签

python - Sklearn 将 fit() 参数传递给管道中的 xgboost

类似于Howtopassaparametertoonlyonepartofapipelineobjectinscikitlearn?我只想将参数传递给管道的一部分。通常,它应该像这样正常工作:estimator=XGBClassifier()pipeline=Pipeline([('clf',estimator)])并像这样执行pipeline.fit(X_train,y_train,clf__early_stopping_rounds=20)但它失败了:/usr/local/lib/python3.5/site-packages/sklearn/pipeline.pyinfit(se

python - 安装工具 : How to make sure file generated by packed code be deleted by pip

我有一个名为main.py的简单代码,它在其中生成一个文件夹和一个文件:importosdefmain():path=os.path.join(os.path.dirname(__file__),'folder')ifnotos.path.isdir(path):os.mkdir(path)withopen(os.path.join(path,'file.txt'),'w+')asf:f.write('something')if__name__=='__main__':main()如果这个脚本在文件夹中运行,那么结构应该是这样的:.├──main.py└──folder└──file.

python - 没有位置参数的 scipy.stats.expon.fit()

我正在使用scipy.stats.expon.fit(data)对我的数据进行指数分布拟合。这似乎返回了两个我期望的值。文档online似乎没有说明fit()返回什么,但查看源代码,我猜它既是位置参数又是比例参数。能不能在拟合的时候把location参数固定为0? 最佳答案 在调用expon.fit时,使用floc=0:In[5]:data=expon.rvs(0,1.5,1000)In[6]:loc,scale=expon.fit(data,floc=0)In[7]:scaleOut[7]:1.4878030368336586In

python - 为什么 sklearn LatentDirichletAllocation 的 fit 和 partial_fit 返回不同的结果?

奇怪的是,fit和partial_fit的代码似乎完全一样。您可以在以下链接中查看代码:https://github.com/scikit-learn/scikit-learn/blob/c957249/sklearn/decomposition/online_lda.py#L478 最佳答案 不完全相同的代码;partial_fit使用total_samples:"total_samples:整数,可选(默认值=1e6)文档总数。仅在partial_fit方法中使用。”https://github.com/scikit-learn

python - 何时使用 "property"内置 : auxiliary functions and generators

我最近发现了Python的propertybuilt-in,它将类方法的getter和setter伪装成类的属性。我现在很想以我非常确定不合适的方式使用它。如果类A有一个属性_x,您希望限制其允许值,那么使用property关键字显然是正确的做法;即,它将取代可能用C++编写的getX()和setX()构造。但是还有什么地方适合将函数设为属性呢?例如,如果您有classVertex(object):def__init__(self):self.x=0.0self.y=1.0classPolygon(object):def__init__(self,list_of_vertices):s

python - 类型错误 : 'generator' object has no attribute '__getitem__'

我写了一个应该返回字典的生成函数。但是,当我尝试打印一个字段时,出现以下错误printrow2['SearchDate']TypeError:'generator'objecthasnoattribute'__getitem__'这是我的代码fromcsvimportDictReaderimportpandasaspdimportnumpyasnpdefgenSearch(SearchInfo):forrow2inDictReader(open(SearchInfo)):yieldrow2train='minitrain.csv'SearchInfo='SearchInfo.csv'r

python - 使用 curve_fit 拟合数据

我是scipy和matplotlib的新手,我一直在尝试使函数适应数据。ScipyCookbook中的第一个示例效果非常好,但是当我尝试从文件中读取点时,我给出的初始系数(下面的p0)似乎从未真正改变过,协方差矩阵始终是INF。我试过在一行之后拟合数据,但无济于事。我导入数据的方式有问题吗?如果可以,是否有更好的方法?importmatplotlib.pyplotaspltfromscipy.optimizeimportcurve_fitimportscipyassywithopen('data.dat')asf:noms=f.readline().split('\t')dtipus=

python - Keras model.fit() 与 tf.dataset API + validation_data

所以我通过以下代码让我的keras模型与tf.Dataset一起工作:#Initializebatchgenerators(returnstf.Dataset)batch_train=build_features.get_train_batches(batch_size=batch_size)#CreateTensorFlowIteratorobjectiterator=batch_train.make_one_shot_iterator()dataset_inputs,dataset_labels=iterator.get_next()#CreateModellogits=.....

python - 计数矢量器 : Vocabulary wasn't fitted

我实例化了一个sklearn.feature_extraction.text.CountVectorizer通过vocabulary参数传递一个词汇表来对象,但我得到一个sklearn.utils.validation.NotFittedError:CountVectorizer-Vocabularywasn'tfitted.错误消息。为什么?例子:importsklearn.feature_extractionimportnumpyasnpimportpickle#Savethevocabularyngram_size=1dictionary_filepath='my_unigram

python - 试图从 scipy powerlaw fit 中获得合理的值(value)

我正在尝试从我一直在运行的模拟代码中拟合一些数据,以便找出幂律相关性。当我绘制线性拟合时,数据拟合得不是很好。这是我用来拟合数据的python脚本:#!/usr/bin/envpythonfromscipyimportoptimizeimportnumpyxdata=[0.00010851,0.00021701,0.00043403,0.00086806,0.00173611,0.00347222]ydata=[29.56241016,29.82245508,25.33930469,19.97075977,12.61276074,7.12695312]fitfunc=lambdap,x