unsupervised-learning

【论文阅读】【剪枝】Learning Efficient Convolutional Networks through Network Slimming

摘要深度卷积神经网络（CNN）在许多实际应用中的部署在很大程度上受到其高计算成本的阻碍。在本文中，我们提出了一种新的神经网络学习方案，以同时1）减小模型大小；2）减少运行时内存占用；以及3）在不损害精度的情况下减少计算操作的数量。这是通过以简单但有效的方式在网络中实施通道级稀疏性来实现的。与许多现有方法不同，所提出的方法直接适用于现代CNN架构，为训练过程引入了最小开销，并且不需要用于生成模型的专用软件/硬件加速器。我们称我们的方法为网络瘦身，它将宽网络和大网络作为输入模型，但在训练过程中，不重要的通道会被自动识别并在之后进行修剪，从而生成具有相当精度的瘦而紧凑的模型

剪枝 Convolutional xff0c xff xff0 深度学习人工智能

论文阅读：Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

前言要弄清MAML怎么做，为什么这么做，就要看懂这两张图。先说MAML**在做什么？**它是打着Mate-Learing的旗号干的是few-shotmulti-taskLearning的事情。具体而言就是想训练一个模型能够使用很少的新样本，快速适应新的任务。定义问题我们定义一个模型fff,输入xxx输出aaa。-定义每一个Task-TTT包含一个损失函数LLL,一个原始观察q(x1)q(x_1)q(x1),一个状态转移分布q(x1∣xt,at)q(x_1|x_t,a_t)q(x1∣xt,at)以及集长度HHH。在监督任务中H=1(也就是说当前的a只和当前的x有关)。元学习方法介绍元学习

Model-Agnostic Meta-Learning span class style 论文阅读

论文阅读：DIN-SQL: Decomposed In-Context Learning of Text-to-SQL withSelf-Correction

NL2SQL是将自然语言转化为SQL的任务，该任务隶属于NLP的子任务，NL2SQL在AIGC时代之前，以seq2seq、BERT等系列的模型在NL2SQL的主流数据集上取得了不错的效果，2022年底，ChatGPT爆火，凭借LLM强大的逻辑推理、上下文学习、情景联系等特点，按理说LLM应该可以超过seq2seq、BERT等系列的模型，但是使用少样本、零样本提示方法用LLM解决NL2SQL问题效果却比不上之前的模型。今天分享的这篇来自NLP顶级会议的论文解决了这个问题：如何改进Prompt让LLM超越之前的方法，并让LLM在Spider数据集上霸榜。论文原文链接：[2304.11015]DIN

withSelf-Correction Text-to-SQL xff0c xff xff0 论文阅读

【论文笔记】Guided Skill Learning and Abstraction for Long-Horizon Manipulation

【论文笔记】GuidedSkillLearningandAbstractionforLong-HorizonManipulation更多笔记（在耕）：这里文章目录【论文笔记】GuidedSkillLearningandAbstractionforLong-HorizonManipulationAbstractI.INTRODUCTIONII.RELATEDWORKTAMPandLearningforTAMP.CurriculumforRL.StateandActionAbstractions.HierarchicalModelinginRobotLearning.III.METHODA.Bac

Long-Horizon Manipulation span class style 论文阅读

Reinforcement Learning with Code 【Code 2. Tabular Sarsa】

ReinforcementLearningwithCode【Code2.TabularSarsa】ThisnoterecordshowtheauthorbegintolearnRL.Boththeoreticalunderstandingandcodepracticearepresented.ManymaterialarereferencedsuchasZhaoShiyu’sMathematicalFoundationofReinforcementLearning.ThiscodereferstoMofan’sreinforcementlearningcourse.文章目录Reinforcem

Code Reinforcement span class token 机器学习学习算法

论文阅读-Neighbor Contrastive Learning on Learnable Graph Augmentation(AAAI2023)

人为设计的图增强，可能会破坏原始图的拓扑结构，同时相邻节点被视为负节点，因此被推离锚点很远。然而，这与网络的同质性假设是矛盾的，即连接的节点通常属于同一类，并且应该彼此接近。本文提出了一种端到端的自动GCL方法，称为NCLA，将邻居对比学习应用于可学习图增强。方案通过多头图注意力机制自动学习具有自适应拓扑结构的多个图增强视图，可以在不需要先验领域知识的情况下兼容各种图数据集。此外，设计了一种允许每个锚点有多个正信号的邻居对比损失。大量实验表明，当标签非常有限时，NCLA在自监督GCL上产生了最先进的节点分类性能，甚至超过了监督GC

Augmentation Contrastive xff0c xff0 xff 论文阅读

AlpacaFarm: A Simulation Framework for Methods that Learn from Human Feedback

本文是LLM系列文章，针对《》的翻译。AlpacaFarm:从人类反馈中学习方法的模拟框架摘要1引言2背景与问题描述3构造AlpacaFarm4验证AlpacaFarm模拟器5AlpacaFarm的基准参考方法6相关工作7不足和未来方向摘要像ChatGPT这样的大型语言模型由于能够很好地遵循用户指令而被广泛采用。开发这些LLM涉及一个复杂但鲜为人知的工作流程，需要通过人工反馈进行训练。复制和理解此指令跟随过程面临三大挑战：数据收集成本高、缺乏可靠的评估以及缺乏参考方法实现。我们通过AlpacaFarm解决了这些挑战，该模拟器能够以低成本进行研究和开发，从反馈中学习。首先，我们设计LLM提示来模

AlpacaFarm Simulation xff0c xff0 人工智能语言模型

python - 无法在 scikit-learn 中导入 sklearn.model_selection

我正在尝试导入sklearn.model_selection。我尝试重新安装scikit-learn和anaconda，但仍然无法正常工作。这是我收到的错误信息:ImportErrorTraceback(mostrecentcalllast)in()4get_ipython().magic(u'matplotlibinline')5#fromsklearn.model_selectionimporttrain_test_split---->6importsklearn.model_selection/Users/Lu/anaconda/lib/python2.7/site-packag

中导 model_selection import from sklearn python scikit-learn

python - 如何在 Scikit-Learn 的随机森林分类器中设置子样本大小？特别是对于不平衡数据

目前，我正在Sklearn中为我的不平衡数据实现RandomForestClassifier。我不太清楚RF在Sklearn中究竟是如何工作的。以下是我的担忧:根据文档，似乎没有办法为每个树学习器设置子样本大小(即小于原始数据大小)。但实际上，在随机森林算法中，我们需要得到每棵树的样本子集和特征子集。我不确定我们能否通过Sklearn实现这一目标？如果是，如何？下面是Sklearn中对RandomForestClassifier的描述。“随机森林是一种元估计器，它在数据集的各种子样本上拟合多个决策树分类器，并使用平均来提高预测准确性和控制过度拟合。子样本大小为始终与原始输入样本大小相同

中设别是 samples section code python scikit-learn random-forest

python - scikit-learn，将特征添加到向量化的文档集

我从scikit-learn开始，我正在尝试将一组文档转换为我可以应用聚类和分类的格式。我已经看到了有关矢量化方法的详细信息，以及用于加载文件和索引其词汇表的tfidf转换。但是，我有每个文档的额外元数据，例如作者、负责的部门、主题列表等。如何向向量化函数生成的每个文档向量添加特征？最佳答案您可以使用DictVectorizer获取额外的分类数据，然后使用scipy.sparse.hstack将它们结合起来。关于python-scikit-learn，将特征添加到向量化的文档集，我

scikit-learn python section scipy stackoverflow machine-learning nlp

25 26 272829 30 31