草庐IT

以小博大进行时!2023年值得关注的个小模型

编译丨诺亚大语言模型(LLM)作为年度热词,已经充分向我们证明了其影响力。如今,一场无声却极具开创性的变革正在兴起。小语言模型(SLM)的兴起正逐步挑战着大预言模型的主导地位。相较大模型,小模型对于训练数据、内存、算力的要求较少,但高质量的“小数据”同样能够让小模型表现出良好的语言理解和推理性能。当前,很多公司都在关注小模型,因为它们在可访问性、计算效率和适应性方面的特性,使它们非常适合部署在边缘设备和云环境中,进而开创一个人机交互的新时代。在今年Ignite大会上,微软CEO萨蒂亚·纳德拉在会上宣布将自研小模型Phi-2完全开源,并表示:“微软热爱SLM”。这也为此后其他小模型的推出开了个好

以小博大外小内大,Db数据库SQL优化之小数据驱动大数据

SQL优化中,有一条放之四海而皆准的既定方针,那就是:永远以小数据驱动大数据。其本质其实就是以小的数据样本作为驱动查询能够优化查询效率,在SQL中,涉及到不同表数据的连接、转移、或者合并,这些操作必须得有个数据集作为“带头”大哥,即驱动数据,而这个驱动数据最好是数据量最小的那一个。内大外小在讨论数据库之前,日常开发中,我们经常会遇到数据样本数量不一致,但是需要进行检索的情况,比如某人在地铁的某节车厢里捡到N台Iphone,而车厢里正好有T个人,他应该怎么去检索双样本数据,从而找到失主?for(inti=0;i一般的说法是把循环次数少的循环放在外面,其实,这个问题的主要原因是CPU内部的指令执行

以小博大外小内大,Db数据库SQL优化之小数据驱动大数据

SQL优化中,有一条放之四海而皆准的既定方针,那就是:永远以小数据驱动大数据。其本质其实就是以小的数据样本作为驱动查询能够优化查询效率,在SQL中,涉及到不同表数据的连接、转移、或者合并,这些操作必须得有个数据集作为“带头”大哥,即驱动数据,而这个驱动数据最好是数据量最小的那一个。内大外小在讨论数据库之前,日常开发中,我们经常会遇到数据样本数量不一致,但是需要进行检索的情况,比如某人在地铁的某节车厢里捡到N台Iphone,而车厢里正好有T个人,他应该怎么去检索双样本数据,从而找到失主?for(inti=0;i一般的说法是把循环次数少的循环放在外面,其实,这个问题的主要原因是CPU内部的指令执行