草庐IT

向量叉积

全部标签

旋转矩阵R、平移向量t以及变换矩阵T的定义及其下标的含义

旋转矩阵R首先,只考虑旋转。假设坐标系1:{X1,Y1,Z1}\{X_1,Y_1,Z_1\}{X1​,Y1​,Z1​}经过纯旋转之后得到坐标系2:{X2,Y2,Z2}\{X_2,Y_2,Z_2\}{X2​,Y2​,Z2​}(如上图),其中坐标系1对应的单位正交基为(e1,e2,e3)\left(e_{1},e_{2},e_{3}\right)(e1​,e2​,e3​),坐标系2对应的单位正交基为(e1′,e2′,e3′)\left(e_{1}^{\prime},e_{2}^{\prime},e_{3}^{\prime}\right)(e1′​,e2′​,e3′​)。对于空间中的同一个点p\bo

为什么 AIGC 和大模型创业者都在安利向量数据库?

从目前VC的投资数据来看,大家对AI的关注点主要有三个:一个是基础大模型LLM,第二个是具体某个场景的应用(包括小模型),第三个就属基础模型与应用层之间的中间层了(开发者工具和数据库等)。随着开发者疯狂涌入开发各种AI应用,中间层已经成为各大VC争抢的投资标的,作为AI时代Memory的向量数据库,更是当下最大的一个热门。在之前的文章我曾提到,虽然向量数据库的发展还处于非常早期阶段,但在过去一个月里资本正在疯狂涌入这个赛道,这个领域的创业梯队也逐渐浮现了出来。估值在一亿美金以内的有Chroma和Qdrant,总融资金额在千万美金级别;估值在五亿美金之内区间的有Weaviate,总融资金额在50

高维向量相似搜索插件 pgvector

大模型爆火以后,持仓股票都卖飞了(捶自己),只能研究研究技术,来填补下心灵上的创伤。正在用openai开放的接口做调试,用embedding接口来实现内容相似度检索,并用chatGPT生成答案,从目前来看实现的效果还不错。embedding接口会返回一组vector,相对于其他数据的向量搜索,它生成的向量精确度更高,起初用的是supebase云数据库,后来替换成了postgres(支持私有化部署PostgreSQL:Theworld'smostadvancedopensourcedatabase),向量存储都用到了pgvector(GitHub-pgvector/pgvector:Open-s

自然语言处理从入门到应用——动态词向量预训练:ELMo词向量

分类目录:《自然语言处理从入门到应用》总目录在双向语言模型预训练完成后,模型的编码部分(包括输入表示层以及多层堆叠LSTM)便可以用来计算任意文本的动态词向量表示。最自然的做法是使用两个LSTM的最后一层隐含层输出作为词的动态向量表示。然而,在ELMo模型中,不同层次的隐含层向量蕴含了不同层次或粒度的文本信息。例如,越接近顶层的LSTM隐含层表示通常编码了更多的语义信息,而接近底层的隐含层表示(包括输入表示xxx)更偏重于词法、句法信息。不同的下游任务,对词表示的需求程度有所不同。例如,对于阅读理解、自动问答这类任务,对语义信息的需求较高;而对于命名实体识别等任务,词法、句法信息更重要。因此,

向量叉乘的几何意义及其模的计算

目的:在传统的向量叉乘计算中,常常遇到叉乘。定义为向量。其这个向量方向满足右手定则。它的模大小,一般被忽略。因此推测一下。向量叉乘定义:外积(英语:Crossproduct)又称向量积(英语:Vectorproduct),是对三维空间中的两个向量的二元运算,用符号:×\times×表示。可以定义为:a→×b→=c→    (1)\overrightarrow{a}\times\overrightarrow{b}=\overrightarrow{c}\space\space\space\space(1)a×b=c    (1)假设两个向量a→×b→\overrightarrow{a}\times

linux - gnu C++ 库在向量分配期间陷入循环

运行linux内核3.6.6-1,gcc4.7.2-2,程序如下:1#include2usingnamespacestd;3intmain()4{5vectora(1从不从第5行返回。当我在gdb中运行时,我看到它卡在STL_algobase.h的第743/744行:0x000000000040101cinstd::__fill_n_a(__first=0x7fffeffd8060,__n=16777216,__value=@0x7fffffffe0a8:0)at/usr/lib/gcc/x86_64-redhat-linux/4.7.2/../../../../include/c++

linux - gnu C++ 库在向量分配期间陷入循环

运行linux内核3.6.6-1,gcc4.7.2-2,程序如下:1#include2usingnamespacestd;3intmain()4{5vectora(1从不从第5行返回。当我在gdb中运行时,我看到它卡在STL_algobase.h的第743/744行:0x000000000040101cinstd::__fill_n_a(__first=0x7fffeffd8060,__n=16777216,__value=@0x7fffffffe0a8:0)at/usr/lib/gcc/x86_64-redhat-linux/4.7.2/../../../../include/c++

云原生向量数据库Milvus(一)-简述、系统架构及应用场景

什么是MilvusMilvus是一款云原生向量数据库,它具备高可用、高性能、易拓展的特点,用于海量向量数据的实时召回。Milvus基于FAISS、Annoy、HNSW等向量搜索库构建,核心是解决稠密向量相似度检索的问题。在向量检索库的基础上,Milvus支持数据分区分片、数据持久化、增量数据摄取、标量向量混合查询、timetravel等功能,同时大幅优化了向量检索的性能,可满足任何向量检索场景的应用需求。通常,建议用户使用Kubernetes部署Milvus,以获得最佳可用性和弹性。Milvus采用共享存储架构,存储计算完全分离,计算节点支持横向扩展。从架构上来看,Milvus遵循数据流和控制

向量检索(一)Faiss 在工业界的应用和常见问题解决

一、向量检索的场景传统的搜索,使用关键做精确的查找,利用倒排索引在索引库中搜索。日常在用的百度,Google都属于关键词搜索。在AI时代,我们需要查找一张相似的图片,一个问题的答案,或者根据一段音乐查找对应的歌曲,这些情况下没有准确的关键词用来做检索。这些图片,问题(文本),语音,不再是简单的一个一维量化的数字,而是包含了大量的属性特征。因而不合适使用传统的关键字搜索引擎来查找。对于文本,图片,语音,视频,DNA信息等等,都可以用向量来表示,数据被特征化处理后,用来表示这条数据的向量称之为Embedding。比如IloveChina,andIlovetheworld.这一句话,假设在特定的语料

矩阵的谱分解 (详细推导步骤~~~特征值分解特征向量

      所谓矩阵的分解,就是将一个矩阵写成结构比较简单的或性质比较熟悉的另一些矩阵的乘积。矩阵的分解方法有很多种,包括三角分解、QR(正交三角)分解、最大秩分解、奇异值分解和谱分解,所有这些分解在数值代数和最优化问题的解法中都扮演着十分重要的角色。本文介绍矩阵的谱分解(Eigendecomposition/Spectraldecomposition),不多废话了、直接进入正题、*** ***设矩阵有特征根,其对应的特征向量为,根据定义有同时,矩阵A和它的转置的特征值是相同的,都是,因为它们的特征多项式是相同的:因此,存在向量,使得将上式取转置,有这里,称为A的左特征向量,则为A的右特征向量