草庐IT

SciKit-Learn

全部标签

python - 如何让 SVM 很好地处理 scikit-learn 中的缺失数据?

我正在使用scikit-learn进行一些数据分析,我的数据集有一些缺失值(由NA表示)。我用genfromtxt和dtype='f8'加载数据,然后开始训练我的分类器。RandomForestClassifier和GradientBoostingClassifier对象的分类很好,但使用sklearn.svm中的SVC会导致以下错误:probas=classifiers[i].fit(train[traincv],target[traincv]).predict_proba(train[testcv])File"C:\Python27\lib\site-packages\sklear

python - 如何让 SVM 很好地处理 scikit-learn 中的缺失数据?

我正在使用scikit-learn进行一些数据分析,我的数据集有一些缺失值(由NA表示)。我用genfromtxt和dtype='f8'加载数据,然后开始训练我的分类器。RandomForestClassifier和GradientBoostingClassifier对象的分类很好,但使用sklearn.svm中的SVC会导致以下错误:probas=classifiers[i].fit(train[traincv],target[traincv]).predict_proba(train[testcv])File"C:\Python27\lib\site-packages\sklear

python - 在多个程序中正确使用 Scikit 的 LabelEncoder

我手头的基本任务是a)读取一些制表符分隔的数据。b)做一些基本的预处理c)对于每个分类列,使用LabelEncoder创建一个映射。这有点像这样mapper={}#ConvertingCategoricalDataforxincategorical_list:mapper[x]=preprocessing.LabelEncoder()forxincategorical_list:df[x]=mapper[x].fit_transform(df.__getattr__(x))其中df是pandas数据框,categorical_list是需要转换的列标题列表。d)训练分类器并使用pick

python - 在多个程序中正确使用 Scikit 的 LabelEncoder

我手头的基本任务是a)读取一些制表符分隔的数据。b)做一些基本的预处理c)对于每个分类列,使用LabelEncoder创建一个映射。这有点像这样mapper={}#ConvertingCategoricalDataforxincategorical_list:mapper[x]=preprocessing.LabelEncoder()forxincategorical_list:df[x]=mapper[x].fit_transform(df.__getattr__(x))其中df是pandas数据框,categorical_list是需要转换的列标题列表。d)训练分类器并使用pick

python - 将 scipy 稀疏 csr 转换为 Pandas ?

我用过sklearn.preprocessing.OneHotEncoder要转换一些数据,输出是scipy.sparse.csr.csr_matrix如何将其与其他列一起合并回原始数据框?我尝试使用pd.concat但我得到了TypeError:cannotconcatenateanon-NDFrameobject谢谢 最佳答案 如果A是csr_matrix,可以使用.toarray()(还有产生numpymatrix的.todense(),它也适用于DataFrame构造函数):df=pd.DataFrame(A.toarray

python - 将 scipy 稀疏 csr 转换为 Pandas ?

我用过sklearn.preprocessing.OneHotEncoder要转换一些数据,输出是scipy.sparse.csr.csr_matrix如何将其与其他列一起合并回原始数据框?我尝试使用pd.concat但我得到了TypeError:cannotconcatenateanon-NDFrameobject谢谢 最佳答案 如果A是csr_matrix,可以使用.toarray()(还有产生numpymatrix的.todense(),它也适用于DataFrame构造函数):df=pd.DataFrame(A.toarray

python - 将 dict 传递给 scikit learn estimator

我试图将模型参数作为dict传递给Scikit-learn估计器,但没有运气。它似乎只是将我的dict嵌套到参数之一中。例如:params={'copy_X':True,'fit_intercept':False,'normalize':True}lr=LinearRegression(params)给我:LinearRegression(copy_X=True,fit_intercept={'copy_X':True,'fit_intercept':False,'normalize':True},normalize=False)另外,我创建了一个函数来迭代字典,并可以创建一个字符串,

python - 将 dict 传递给 scikit learn estimator

我试图将模型参数作为dict传递给Scikit-learn估计器,但没有运气。它似乎只是将我的dict嵌套到参数之一中。例如:params={'copy_X':True,'fit_intercept':False,'normalize':True}lr=LinearRegression(params)给我:LinearRegression(copy_X=True,fit_intercept={'copy_X':True,'fit_intercept':False,'normalize':True},normalize=False)另外,我创建了一个函数来迭代字典,并可以创建一个字符串,

python - scikit-learn 和 sklearn 的区别

在OSX10.11.6和python2.7.10上,我需要从sklearn流形导入。我安装了numpy1.8Orc1、scipy.13Ob1和scikit-learn0.17.1。我使用pip安装sklearn(0.0),但是当我尝试从sklearn流形导入时,我得到以下信息:Traceback(mostrecentcalllast):File"",line1,inFile"/Library/Python/2.7/site-packages/sklearn/init.py",line57,infrom.baseimportcloneFile"/Library/Python/2.7/si

python - scikit-learn 和 sklearn 的区别

在OSX10.11.6和python2.7.10上,我需要从sklearn流形导入。我安装了numpy1.8Orc1、scipy.13Ob1和scikit-learn0.17.1。我使用pip安装sklearn(0.0),但是当我尝试从sklearn流形导入时,我得到以下信息:Traceback(mostrecentcalllast):File"",line1,inFile"/Library/Python/2.7/site-packages/sklearn/init.py",line57,infrom.baseimportcloneFile"/Library/Python/2.7/si