草庐IT

量子计算基础——量子测量

技术背景在上一篇博客中,我们用矩阵的语言介绍了量子计算中基本量子单元——量子比特,与量子门操作的相关概念。通过对量子态的各种操作,相当于传统计算机中对经典比特的操作,就可以完成一系列的运算了。但是量子计算的一个待解决的问题是,所有存储在量子态中的信息是没办法从经典世界直接读取的,只能通过量子测量,使得量子态坍缩到经典比特之后,才能够在经典世界里进行读取。量子测量的矩阵形式如果通过各种量子门操作构成的量子线路,也称为量子算法,会使得一个给定的量子态\(\left|\psi_0\right>\)变化到目标量子态\(\left|\psi_t\right>\)。那么以当前时代的量子计算机的条件来说,还

量子计算基础——矩阵语言

技术背景量子计算作为一种新的计算框架,采用了以超导、离子阱等物理体系的新语言来描述我们传统中所理解的矩阵运算。不同于传统计算机中的比特(经典比特)表示方法,量子计算的基本单元被称为量子比特。我们可以通过一个布洛赫球的模型来理解二者的区别: 传统比特用高电平和低电平来表示一个经典比特的1态和0态,分别对应于布洛赫球模型的南极点和北极点。这是经典比特所能够表示的信息,相当于球表面的两个点,而一个量子比特所能够表示的信息,是整个球的表面(球体内部的点在特定体系下也能够取到,一般我们只取球的表面来表示量子比特的信息)。除了两个极点所表示的信息,与经典比特所表示的信息一致之外,其他的布洛赫球表面的点,表

量子计算基础——量子测量

技术背景在上一篇博客中,我们用矩阵的语言介绍了量子计算中基本量子单元——量子比特,与量子门操作的相关概念。通过对量子态的各种操作,相当于传统计算机中对经典比特的操作,就可以完成一系列的运算了。但是量子计算的一个待解决的问题是,所有存储在量子态中的信息是没办法从经典世界直接读取的,只能通过量子测量,使得量子态坍缩到经典比特之后,才能够在经典世界里进行读取。量子测量的矩阵形式如果通过各种量子门操作构成的量子线路,也称为量子算法,会使得一个给定的量子态\(\left|\psi_0\right>\)变化到目标量子态\(\left|\psi_t\right>\)。那么以当前时代的量子计算机的条件来说,还

量子计算基础——矩阵语言

技术背景量子计算作为一种新的计算框架,采用了以超导、离子阱等物理体系的新语言来描述我们传统中所理解的矩阵运算。不同于传统计算机中的比特(经典比特)表示方法,量子计算的基本单元被称为量子比特。我们可以通过一个布洛赫球的模型来理解二者的区别: 传统比特用高电平和低电平来表示一个经典比特的1态和0态,分别对应于布洛赫球模型的南极点和北极点。这是经典比特所能够表示的信息,相当于球表面的两个点,而一个量子比特所能够表示的信息,是整个球的表面(球体内部的点在特定体系下也能够取到,一般我们只取球的表面来表示量子比特的信息)。除了两个极点所表示的信息,与经典比特所表示的信息一致之外,其他的布洛赫球表面的点,表

AcWing 787.归并排序(Java)

题目来源:https://www.acwing.com/problem/content/description/789/题目描述给定你一个长度为n的整数数列。请你使用归并排序对这个数列按照从小到大进行排序。并将排好序的数列按顺序输出。输入格式输入共两行,第一行包含整数n。第二行包含n个整数(所有整数均在1∼109范围内),表示整个数列。输出格式输出共一行,包含n个整数,表示排好序的数列。数据范围1≤n≤100000输入样例:531245输出样例:12345思路讲解首先确定中间基准点mid=left+(right-left)/2,在每次进行方法时先进性一次递推进行数组的分割,将数组分为单个值后进

AcWing 787.归并排序(Java)

题目来源:https://www.acwing.com/problem/content/description/789/题目描述给定你一个长度为n的整数数列。请你使用归并排序对这个数列按照从小到大进行排序。并将排好序的数列按顺序输出。输入格式输入共两行,第一行包含整数n。第二行包含n个整数(所有整数均在1∼109范围内),表示整个数列。输出格式输出共一行,包含n个整数,表示排好序的数列。数据范围1≤n≤100000输入样例:531245输出样例:12345思路讲解首先确定中间基准点mid=left+(right-left)/2,在每次进行方法时先进性一次递推进行数组的分割,将数组分为单个值后进

ACL2022挖宝 CMR

CMR看一张比较有说服力的图(是师姐让我看的这个文章,她觉得对她的论文有用。我就开始看,然后把图直接pia给她,她说“好有说服力的一张图”)。当我们离线训练好一个模型$f_0$之后,我们把它部署出去,当他遇到分布外的数据(outofdistributiondata)的时候,就会报错,产生一个$E_1$。然后我们就需要回来把这个模型更新,就得到我们的新模型$f_1$,然后再把它部署上线;它又会遇到分布外的一些数据,然后会报错产生一个$E_2$,然后我们再把这个模型拿回来再更新,得到一个$f_2$。如此循环往复。CMR方法旨在通过在不发生灾难性遗忘的情况下改进$f_t$来修复错误情况。关于持续学习

Transformer 结构:位置编码 | Transformer Architecture: The Positional Encoding

注意:本文大多采用义译,确保原文意思不变,但不保证用词和原作完全一致。:sunglasses:使用正弦函数为模型添加位置信息Transformer是只基于自注意力机制的序列到序列架构。因为并行计算能力以及高性能。使得它在NLP领域中大受欢迎。现在常见的几个深度学习框架都实现了transformer,这让很多学生都能够方便使用到transformer。但是这也存在一个弊端,他会让我们忽略模型的一些细节。在本文中我,不打算研究它的整体结构,毕竟现在已经有很多优秀的文章介绍其结构了。在本文中我仅对transformer结构的一部分进行探讨,就是位置编码。当我阅读论文原文^[AttentionIsAl