草庐IT

indexOfStratifiedSplits

全部标签

python - 在 Spark ML 中创建自定义交叉验证

我不熟悉Spark和PySpark数据框以及机器学习。如何为ML库创建自定义交叉验证。例如,我想改变训练折叠的形成方式,例如分层拆分。这是我当前的代码numFolds=10predictions=[]lr=LogisticRegression()\.setFeaturesCol("features")\.setLabelCol('label')#GridsearchonLRmodellrparamGrid=ParamGridBuilder()\.addGrid(lr.regParam,[0.01,0.1,0.5,1.0,2.0])\.addGrid(lr.elasticNetParam