learning_topic

DUET: Cross-Modal Semantic Grounding for Contrastive Zero-Shot Learning论文阅读

文章目录摘要1.问题的提出引出当前研究的不足与问题属性不平衡问题属性共现问题解决方案2.数据集和模型构建数据集传统的零样本学习范式v.s.DUET学习范式DUET模型总览属性级别对比学习==正负样本解释：==3.结果分析VIT-basedvisiontransformerencoder.消融研究消融研究解释4.结论与启示结论总结启发PLMs的潜在语义知识引入多模态，跨模态整合细粒度角度考虑原文链接：https://ojs.aaai.org/index.php/AAAI/article/view/25114/24886该论文设计了一种新的零样本学习范式，通过迁移语言模型中的先验语义知识，与视觉模

【scikit-learn基础】--『监督学习』之谱聚类

谱聚类算法基于图论，它的起源可以追溯到早期的图分割文献。不过，直至近年来，受益于计算机计算能力的提升，谱聚类算法才得到了广泛的研究和关注。谱聚类被广泛应用于图像分割、社交网络分析、推荐系统、文本聚类等领域。例如，在图像分割中，谱聚类可以有效地将图像划分为背景和前景；在社交网络分析中，它可以识别出不同的社区结构。1.算法概述谱聚类的基本原理是将数据点视为图中的顶点，根据数据点之间的相似性构建图的边。它首先计算图的拉普拉斯矩阵的特征向量，然后利用这些特征向量进行聚类。这种方法能够捕捉到数据的非线性结构，因此在许多应用中表现优异。所谓拉普拉斯矩阵，是一种用于表示一个图的矩阵形式。对于给定的一个有\(

scikit-learn 监督 strong code 矩阵机器学习

【scikit-learn基础】--『监督学习』之谱聚类

谱聚类算法基于图论，它的起源可以追溯到早期的图分割文献。不过，直至近年来，受益于计算机计算能力的提升，谱聚类算法才得到了广泛的研究和关注。谱聚类被广泛应用于图像分割、社交网络分析、推荐系统、文本聚类等领域。例如，在图像分割中，谱聚类可以有效地将图像划分为背景和前景；在社交网络分析中，它可以识别出不同的社区结构。1.算法概述谱聚类的基本原理是将数据点视为图中的顶点，根据数据点之间的相似性构建图的边。它首先计算图的拉普拉斯矩阵的特征向量，然后利用这些特征向量进行聚类。这种方法能够捕捉到数据的非线性结构，因此在许多应用中表现优异。所谓拉普拉斯矩阵，是一种用于表示一个图的矩阵形式。对于给定的一个有\(

scikit-learn 监督 strong code 矩阵 AI

《An End-to-end Model for Entity-level Relation Extraction using Multi-instance Learning》阅读笔记

代码原文地址预备知识：1.什么是MIL？多示例学习（MIL）是一种机器学习的方法，它的特点是每个训练数据不是一个单独的实例，而是一个包含多个实例的集合（称为包）。每个包有一个标签，但是包中的实例没有标签。MIL的目的是根据包的标签来学习实例的特征和分类规则，或者根据实例的特征来预测包的标签。MIL的应用场景包括药物活性预测、图像分类、文本分类、关系抽取等。MIL的挑战在于如何处理实例之间的相关性、标签的不确定性和数据的不平衡性。MIL的常用算法有基于贝叶斯、KNN、决策树、规则归纳、神经网络等的方法，以及基于注意力机制、自编码器、变分推断等的方法。 2.什么是基于跨度（span）的命名实体

Multi-instance Entity-level section 3038153 span 读书区

《RAPL: A Relation-Aware Prototype Learning Approach for Few-Shot Document-Level Relation Extraction》阅读笔记

代码原文地址预备知识：1.什么是元学习（MetaLearning）？元学习或者叫做“学会学习”（Learningtolearn），它是要“学会如何学习”，即利用以往的知识经验来指导新任务的学习，具有学会学习的能力。由于元学习可帮助模型在少量样本下快速学习，从元学习的使用角度看，人们也称之为少次学习（Few-ShotLearning）。 2.什么是基于度量的元学习（Metric-based meta-learning）？基于度量的元学习将相似性学习和元学习相结合，学习训练过的相似任务的经验，从而加快新任务的完成。Guo等人将注意机制与集成学习方法相结合，形成了基于度量的元学习模型。标记文档

Relation Document-Level section 3038153 img 读书区

Kafka-Topic&Partition

Kafka主题与分区主题与分区topic&partition，是Kafka两个核心的概念，也是Kafka的基本组织单元。主题作为消息的归类，可以再细分为一个或多个分区，分区也可以看作对消息的二次归类。分区的划分为kafka提供了可伸缩性、水平扩展性、容错性等优势。分区可以有一个至多个副本，每个副本对应一个日志文件，每个日志文件对应一至多个日志分段（LogSegment），每个日志分段还可以细分为索引文件、日志存储文件和快照文件等主题的管理主题的管理创建主题查看主题信息修改主题删除主题上述操作可以采用Kafka提供的kafka-topics.sh脚本来完成，也可以采用Kafka提供的AdminC

Kafka-Topic Partition span class token kafka linq 数据库

kafka topic分区数设定

创建一个1副本1分区的topickafka-topics.sh--create--topictest--bootstrap-serverlocalhost:9092--partitions1--replication-factor1对这个topic生产吞吐量测试#生产者吞吐量测试工具kafka-producer-perf-test.sh #生产者测试--topictest#topic--num-records300000#总共300000条数据--record-size1000#每条1000字节，约1kb--throughput100000#每次发送100000条记录--producer-pr

分区设定 records sec latency kafka 分布式

【scikit-learn基础】--『监督学习』之层次聚类

层次聚类算法是机器学习中常用的一种无监督学习算法，它用于将数据分为多个类别或层次。该方法在计算机科学、生物学、社会学等多个领域都有广泛应用。层次聚类算法的历史可以追溯到上世纪60年代，当时它主要被用于社会科学中。随着计算机技术的发展，这种方法在90年代得到了更为广泛的应用。1.算法概述层次聚类的基本原理是创建一个层次的聚类，通过不断地合并或分裂已存在的聚类来实现。它分为两种策略：凝聚策略：初始时将每个点视为一个簇，然后逐渐合并相近的簇分裂策略：开始时将所有点视为一个簇，然后逐渐分裂在scikit-learn中，层次聚类的策略有4种：ward：默认策略，也就是最小方差法。它倾向于合并那些使得合并

scikit-learn 层次 strong 策略样本机器学习

【scikit-learn基础】--『监督学习』之层次聚类

层次聚类算法是机器学习中常用的一种无监督学习算法，它用于将数据分为多个类别或层次。该方法在计算机科学、生物学、社会学等多个领域都有广泛应用。层次聚类算法的历史可以追溯到上世纪60年代，当时它主要被用于社会科学中。随着计算机技术的发展，这种方法在90年代得到了更为广泛的应用。1.算法概述层次聚类的基本原理是创建一个层次的聚类，通过不断地合并或分裂已存在的聚类来实现。它分为两种策略：凝聚策略：初始时将每个点视为一个簇，然后逐渐合并相近的簇分裂策略：开始时将所有点视为一个簇，然后逐渐分裂在scikit-learn中，层次聚类的策略有4种：ward：默认策略，也就是最小方差法。它倾向于合并那些使得合并

scikit-learn 层次 strong 策略样本 AI

乱七八糟方面的入门视频推荐-对比学习、prompt learning、instruct learing、一些deep learning的学习视频

具体方法1.对比学习2.Promptlearning3.Instructlearning4.其他-深度学习入门学习讲在开头！适用：完全没接触过以下方法的朋友；最近探索研究方向，看的比较杂1，2，3效果：2倍速听完能明白方法4：深度学习入门1.对比学习链接：【2023最好出创新点的研究方向：对比学习，华理博士精讲SimCLR、SimCSE、Multiview、BYOL四大对比学习经典论文，轻松搞定论文创新点！】https://www.bilibili.com/video/BV1WR4y1b76q/p=3&share_source=copy_web&vd_source=2cab9613692c5f

learning 学习 xff xff0c blockquote 深度学习人工智能自然语言处理机器学习