草庐IT

Pipeline

全部标签

java - 网络 : back propogate pressure in channel handler pipeline to slow down sender

我正在使用netty开发应用程序,它将通过TCP监听特定端口。一旦接收到字节,我就有了一个带有业务逻辑的管道来运行接收到的字节。该管道由多个channel处理程序组成,如header解码器、应用程序级碎片处理程序等。在管道的末端,一旦消息被处理,管道中的最后一个处理程序(比如BufferWriter)会将处理过的消息放入阻塞队列。这个阻塞队列就像缓冲区,而BufferWriter就像生产者。请注意,此阻塞队列在所有channel之间共享。因此,应用程序收到的所有数据都将写入单个队列。还有另一个预定的执行程序服务将作为此缓冲区的使用者。这个消费者是周期性的任务,它以一定的时间间隔运行,从

iOS Metal : Unable to create compute pipeline state with function

我正在尝试使用iOSMetalFramework在GPU上制作一个简单的数独应用程序。我按照这篇博文的说明操作:http://memkite.com/blog/2014/12/15/data-parallel-programming-with-metal-and-swift-for-iphoneipad-gpu/我在这里对我的代码进行版本控制:https://github.com/mateuszbuda/Sudoku(在写这个问题时HEAD是提交c3e06e0)我在调用时遇到了错误newComputePipelineStateWithFunction那是在ViewController中

java - 如何将模型从 ML Pipeline 保存到 S3 或 HDFS?

我正在尝试保存MLPipeline生成的数千个模型。如答案中所示here,模型可以保存如下:importjava.io._defsaveModel(name:String,model:PipelineModel)={valoos=newObjectOutputStream(newFileOutputStream(s"/some/path/$name"))oos.writeObject(model)oos.close}schools.zip(bySchoolArrayModels).foreach{case(name,model)=>saveModel(name,Model)}我已经尝试

python - sklearn : use Pipeline in a RandomizedSearchCV?

我希望能够在sklearn的RandomizedSearchCV构造中使用管道。但是现在我认为只支持估算器。这是我希望能够执行的操作的示例:importnumpyasnpfromsklearn.grid_searchimportRandomizedSearchCVfromsklearn.datasetsimportload_digitsfromsklearn.svmimportSVCfromsklearn.preprocessingimportStandardScalerfromsklearn.pipelineimportPipeline#getsomedatairis=load_di

python - 属性错误 : lower not found; using a Pipeline with a CountVectorizer in scikit-learn

我有这样一个语料库:X_train=[['thisisandummyexample']['inrealitythislineisverylong']...['hereisalasttextinthetrainingset']]和一些标签:y_train=[1,5,...,3]我想按如下方式使用Pipeline和GridSearch:pipeline=Pipeline([('vect',CountVectorizer()),('tfidf',TfidfTransformer()),('reg',SGDRegressor())])parameters={'vect__max_df':(0.

python - 如何在 Sklearn Pipeline 中进行 Onehotencoding

我正在尝试对我的Pandas数据框的分类变量进行oneHotEncode,其中包括分类变量和连续变量。我意识到这可以使用pandas.get_dummies()函数轻松完成,但我需要使用管道以便稍后生成PMML文件。这是创建映射器的代码。我想要编码的分类变量存储在名为“dummies”的列表中。fromsklearn_pandasimportDataFrameMapperfromsklearn.preprocessingimportOneHotEncoderfromsklearn.preprocessingimportLabelEncodermapper=DataFrameMapper

python - 如何在 scikit-learn 的 `pipeline` 中使用自定义特征选择函数

假设我想通过交叉验证和使用pipeline类比较包含n>2个特征的特定(监督)数据集的不同降维方法。例如,如果我想试验PCA与LDA,我可以这样做:fromsklearn.cross_validationimportcross_val_score,KFoldfromsklearn.pipelineimportPipelinefromsklearn.naive_bayesimportGaussianNBfromsklearn.preprocessingimportStandardScalerfromsklearn.ldaimportLDAfromsklearn.decomposition

python - 从 S3 开始的 Luigi Pipeline

我的初始文件在AWSS3中.有人可以指出我需要如何在LuigiTask中设置它吗??我查看了文档并找到了luigi.S3但我不清楚该怎么做,然后我在网上搜索并只获得来自mortar-luigi的链接。并在luigi之上实现。更新按照为@matagus提供的示例(我也按照建议创建了~/.boto文件):#coding:utf-8importluigifromluigi.s3importS3Target,S3ClientclassMyS3File(luigi.ExternalTask):defoutput(self):returnS3Target('s3://my-bucket/19170

python - sklearn pipeline - 如何对不同的列应用不同的转换

我对sklearn中的管道很陌生,我遇到了这个问题:我有一个混合了文本和数字的数据集,即某些列只有文本,其余列有整数(或float)。我想知道是否可以构建一个管道,例如在文本特征上调用LabelEncoder()并在数字列上调用MinMaxScaler()。我在网络上看到的示例主要指向在整个数据集上使用LabelEncoder(),而不是在选定的列上使用。这可能吗?如果是这样,将不胜感激。 最佳答案 我通常采用的方法是使用FeatureUnion,使用FunctionTransformer提取相关列。重要提示:您必须使用def定义您

python - 从 sklearn 中的 Pipeline 对象返回系数

我用RandomizedSearchCV安装了一个Pipeline对象pipe_sgd=Pipeline([('scl',StandardScaler()),('clf',SGDClassifier(n_jobs=-1))])param_dist_sgd={'clf__loss':['log'],'clf__penalty':[None,'l1','l2','elasticnet'],'clf__alpha':np.linspace(0.15,0.35),'clf__n_iter':[3,5,7]}sgd_randomized_pipe=RandomizedSearchCV(estim