草庐IT

machine-learning-model

全部标签

【scikit-learn基础】--『监督学习』之 均值聚类

聚类算法属于无监督学习,其中最常见的是均值聚类,scikit-learn中,有两种常用的均值聚类算法:一种是有名的K-means(也就是K-均值)聚类算法,这个算法几乎是学习聚类必会提到的算法;另一个是均值偏移聚类,它与K-means各有千秋,只是针对的应用场景不太一样,但是知名度远不如K-Means。本篇介绍如何在scikit-learn中使用这两种算法。1.算法概述1.1.K-MeansK-means算法起源于1967年,由JamesMacQueen和J.B.Hartigan提出。它的基本原理是是将n个点划分为K个集群,使得每个点都属于离其最近的均值(中心点)对应的集群。K-Means算法

iOS Model 和 ViewController 之间的通信

我正在基于Apple提供的Master-View模板开发一个应用程序(它由两个ViewControllers,MasterViewController和DetailViewController组成)。我已经添加了一个模型来与我的服务器进行通信。但是,当我的模型从服务器接收到消息时,它需要调用MasterViewController或DetailViewController类中的方法。我该怎么做?非常感谢所有帮助。 最佳答案 您可以从模型中触发通知,这些通知由主视图Controller和详细ViewController处理。在模型中:

《RAPL: A Relation-Aware Prototype Learning Approach for Few-Shot Document-Level Relation Extraction》阅读笔记

代码 原文地址 预备知识:1.什么是元学习(MetaLearning)?元学习或者叫做“学会学习”(Learningtolearn),它是要“学会如何学习”,即利用以往的知识经验来指导新任务的学习,具有学会学习的能力。由于元学习可帮助模型在少量样本下快速学习,从元学习的使用角度看,人们也称之为少次学习(Few-ShotLearning)。 2.什么是基于度量的元学习(Metric-based meta-learning)?基于度量的元学习将相似性学习和元学习相结合,学习训练过的相似任务的经验,从而加快新任务的完成。Guo等人将注意机制与集成学习方法相结合,形成了基于度量的元学习模型。 标记文档

《RAPL: A Relation-Aware Prototype Learning Approach for Few-Shot Document-Level Relation Extraction》阅读笔记

代码 原文地址 预备知识:1.什么是元学习(MetaLearning)?元学习或者叫做“学会学习”(Learningtolearn),它是要“学会如何学习”,即利用以往的知识经验来指导新任务的学习,具有学会学习的能力。由于元学习可帮助模型在少量样本下快速学习,从元学习的使用角度看,人们也称之为少次学习(Few-ShotLearning)。 2.什么是基于度量的元学习(Metric-based meta-learning)?基于度量的元学习将相似性学习和元学习相结合,学习训练过的相似任务的经验,从而加快新任务的完成。Guo等人将注意机制与集成学习方法相结合,形成了基于度量的元学习模型。 标记文档

【scikit-learn基础】--『监督学习』之 支持向量机分类

支持向量机也是一种既可以处理分类问题,也可以处理回归问题的算法。关于支持向量机在回归问题上的应用,请参考:TODO支持向量机分类广泛应用于图像识别、文本分类、生物信息学(例如基因分类)、手写数字识别等领域。1.算法概述支持向量机的主要思想是找到一个超平面,将不同类别的样本最大化地分隔开。超平面的位置由支持向量决定,它们是离分隔边界最近的数据点。对于二分类问题,SVM寻找一个超平面,使得正例和支持向量到超平面的距离之和等于反例和支持向量到超平面的距离之和。如果这个等式不成立,SVM将寻找一个更远离等式中不利样本的超平面。下面的示例,演示了支持向量机分类算法在图像识别上的应用。2.创建样本数据这次

论文阅读笔记Binary Code Summarization: Benchmarking ChatGPT/GPT-4 and Other Large Language Models

摘要二进制代码总结,虽然对于理解代码语义非常有价值,但由于其劳动密集的特性,具有挑战性。本研究深入探讨了大型语言模型(LLMs)在理解二进制代码方面的潜力。为此,作者提出了BinSum,一个包含超过557,000个二进制函数的全面基准和数据集,并引入了一种新颖的提示合成和优化方法。为了更准确地衡量LLM的性能,作者还提出了一种超越传统精确匹配方法的新语义相似度度量。作者对知名LLM进行了广泛评估,包括ChatGPT、GPT-4、Llama2和CodeLlama,揭示了10个关键见解。此评估生成了40亿推理令牌,总费用为11,418美元,使用了873个NVIDIAA100GPU小时。作者的发现突

【论文精读】HAMMER: Learning Entropy Maps to Create Accurate 3D Models in Multi-View Stereo

今天读一篇WACV2024上MVS的文章,作者来自格拉茨技术大学。文章链接:点击前往Abstract为了减少在深度图融合点云参数调整上的实验负担,可以学习基于entropy的filteringmask进而根据两个视角的几何验证来重建三维模型。并且,提出的网络计算开销不大,训练只需要6GB,测试时,3.6GB即可处理1920*1024的图片,性能也和sota很接近。1IntroductionMVS问题当中,尽管输出首先是深度图,但当今最常见的基准测试是评估点云,即3D模型而不是深度图。虽然深度图的创建是由神经网络处理的,但点云仍然通过检查几何和光度一致性以经典方式生成。photometricma

Scikit-Learn:基本PCA混乱

我正在尝试使用Scikit-Learn在数据集上执行PCA。我目前有2,208行和53,741列(功能)。因此,我想使用PCA降低该数据集的维度。我正在跟进Hands-OnMachineLearningwithSciKit-LearnandTensorFlow:fromsklearn.decompositionimportPCApca=PCA(n_components=0.95)X_reduced=pca.fit_transform(X)据我了解,这应该减少列数,以便它们总共解释我数据集中的95%的差异。现在我想看看留下了多少个功能(列)X_reduced:X_reduced.shape(22

102、X^3 : Large-Scale 3D Generative Modeling using Sparse Voxel Hierarchies

简介官网 Nvidia2023提出的一种新的生成模型,可生成具有任意属性的高分辨率稀疏3D体素网格,以前馈方式生成数百万体素,最细有效分辨率高达102431024^310243,而无需耗时的test-time优化,使用一种分层体素潜扩散模型,使用建立在高效VDB数据结构上的自定义框架,以从粗到细的方式生成逐步更高的分辨率网格。XCube在100m×100m规模的大型户外场景中的有效性,体素大小小至10cm。实现流程 目标是学习一个以稀疏体素层次表示的大规模3D场景的生成模型,由L层由粗到细的体素网格组成G={G1,⋅,GL}G=\{G_1,\cdot,G_L\}G={G1​,⋅,GL​}及其相

【云原生技术】云计算与网络:云服务器CVM(Cloud Virtual Machine)简介

云服务器CVM(CloudVirtualMachine)简介一、简介1、特点2、应用场景二、使用示例1.Web服务和应用托管2.大数据处理和分析3.开发和测试环境4.弹性扩展和灾难恢复5.游戏服务器和实时计算7.阿里巴巴集团8.腾讯9.百度10.字节跳动11.网易12.小米总结一、简介云服务器CVM(CloudVirtualMachine)是一种在云计算环境中提供的虚拟服务器。它们是基于虚拟化技术的服务器,用户可以通过云服务提供商的平台远程访问和管理这些虚拟机。CVM通常作为云计算服务的一个重要组成部分,提供了灵活、可扩展的计算资源。以下是云服务器CVM的一些关键特点:1、特点虚拟化技术:CV