草庐IT

machine-learning-model

全部标签

深入理解机器学习——概率图模型(Probabilistic Graphical Model):马尔可夫随机场(Markov Random Field,MRF)

分类目录:《深入理解机器学习》总目录马尔可夫随机场(MarkovRandomField,MRF)是典型的马尔可夫网,这是一种著名的无向图模型,图中每个结点表示一个或一组变量,结点之间的边表示两个变量之间的依赖关系。马尔可夫随机场有一组势函数(PotentialFunctions),亦称“因子”(Factor),这是定义在变量子集上的非负实函数,主要用于定义概率分布函数。上图显示出一个简单的马尔可夫随机场,对于图中结点的一个子集,若其中任意两结点间都有边连接,则称该结点子集为一个“团”(Clique),若在一个团中加入另外任何一个结点都不再形成团,则称该团为“极大团(MaximalClique)

python - scikit 中的规范化学习 linear_model

如果在sklearn.linear_model中的任何线性模型中将归一化参数设置为True,是否会在评分步骤中应用归一化?例如:fromsklearnimportlinear_modelfromsklearn.datasetsimportload_bostona=load_boston()l=linear_model.ElasticNet(normalize=False)l.fit(a["data"][:400],a["target"][:400])printl.score(a["data"][400:],a["target"][400:])#0.24192774524694727l=

python - 无法在 scikit-learn 中导入 sklearn.model_selection

我正在尝试导入sklearn.model_selection。我尝试重新安装scikit-learn和anaconda,但仍然无法正常工作。这是我收到的错误信息:ImportErrorTraceback(mostrecentcalllast)in()4get_ipython().magic(u'matplotlibinline')5#fromsklearn.model_selectionimporttrain_test_split---->6importsklearn.model_selection/Users/Lu/anaconda/lib/python2.7/site-packag

python - 如何在 Scikit-Learn 的随机森林分类器中设置子样本大小?特别是对于不平衡数据

目前,我正在Sklearn中为我的不平衡数据实现RandomForestClassifier。我不太清楚RF在Sklearn中究竟是如何工作的。以下是我的担忧:根据文档,似乎没有办法为每个树学习器设置子样本大小(即小于原始数据大小)。但实际上,在随机森林算法中,我们需要得到每棵树的样本子集和特征子集。我不确定我们能否通过Sklearn实现这一目标?如果是,如何?下面是Sklearn中对RandomForestClassifier的描述。“随机森林是一种元估计器,它在数据集的各种子样本上拟合多个决策树分类器,并使用平均来提高预测准确性和控制过度拟合。子样本大小为始终与原始输入样本大小相同

python - 如何调试 model.fit() 中的 Tensorflow 段错误?

我正在尝试运行KerasMINSTexample在Geforce2080上使用tensorflow-gpu。我的环境是Linux系统上的Anaconda。我正在从命令行pythonsession运行未修改的示例。我得到以下输出:UsingTensorFlowbackend.Devicemapping:/job:localhost/replica:0/task:0/device:GPU:0->device:0,name:GeForceRTX2080,pcibusid:0000:01:00.0,computecapability:7.5x_trainshape:(60000,28,28,1

python - scikit-learn,将特征添加到向量化的文档集

我从scikit-learn开始,我正在尝试将一组文档转换为我可以应用聚类和分类的格式。我已经看到了有关矢量化方法的详细信息,以及用于加载文件和索引其词汇表的tfidf转换。但是,我有每个文档的额外元数据,例如作者、负责的部门、主题列表等。如何向向量化函数生成的每个文档向量添加特征? 最佳答案 您可以使用DictVectorizer获取额外的分类数据,然后使用scipy.sparse.hstack将它们结合起来。 关于python-scikit-learn,将特征添加到向量化的文档集,我

点云补全综述 Comprehensive Review of Deep Learning-Based 3D Point Clouds Completion Processing and Analys

点云补全(点云完成)综述(PointCloudsCompletion)By人工智能社区www.studyai.comComprehensiveReviewofDeepLearning-Based3DPointCloudsCompletionProcessingandAnalysisBenFei,WeidongYang,WenmingChen,ZhijunLi,YikangLi,TaoMa,XingHu,LipengMahttps://arxiv.org/abs/2203.03311摘要(Abstract)点云补全是由部分点云产生的一个生成和估计问题,在三维计算机视觉的应用中起着至关重要的作用。

python - 如何有效地序列化 scikit-learn 分类器

序列化scikit-learn分类器的最有效方法是什么?我目前正在使用Python的标准Pickle模块来序列化textclassifier,但这会导致pickle大得惊人。序列化的对象可以是100MB甚至更大,这看起来太大了并且需要一段时间来生成和存储。我用Weka做过类似的工作,等效的序列化分类器通常只有几MB。scikit-learn是否可能在pickle中缓存训练数据或其他无关信息?如果是这样,我怎样才能加快和减少序列化scikit-learn分类器的大小?classifier=Pipeline([('vectorizer',CountVectorizer(ngram_rang

python - 在 scikit-learn 中查找和利用来自 PCA 的特征值和特征向量

我一直在使用在scikit-learn中实现的PCA。但是,我想找到拟合训练数据集后产生的特征值和特征向量。文档中没有提及两者。其次,这些特征值和特征向量本身是否可以用作分类目的的特征? 最佳答案 我在这里假设特征向量是指协方差矩阵的特征向量。假设您在p维空间中有n个数据点,X是您的点的pxn矩阵,那么主成分的方向是协方差矩阵XXT的特征向量。您可以通过访问PCA对象的components_属性从sklearn获取这些特征向量的方向。这可以按如下方式完成:fromsklearn.decompositionimportPCAimpor

python - 使用 django 在 python 中将 Model.Objects.all() 转换为 JSON

我有一个相同模型类型的对象列表。我想遍历此列表并创建一个JSON发回。我尝试了一些东西,比如2-dim数组,谷歌,......但是找不到这样的东西?虽然我认为这并不困难。我现在的代码是:defget_cashflows(request):response_data={}cashflow_set=Cashflow.objects.all();i=0;foreincashflow_set.iterator():c=Cashflow(value=e.value,date=str(e.date));response_data[i]=c;returnHttpResponse(json.dumps