草庐IT

团队协作

全部标签

预测token速度翻番!Transformer新解码算法火了,来自小羊驼团队

小羊驼团队的新研究火了。他们开发了一种新的解码算法,可以让模型预测100个token数的速度提高1.5-2.3倍,进而加速LLM推理。比如这是同一个模型(LLaMa-2-Chat7B)面对同一个用户提问(苏格拉底采用了哪些方法来挑战他那个时代的主流思想?)时输出回答的速度:左边为原算法,耗时18.12s,每秒约35个token;右边为该算法,耗时10.4s,每秒约60个token,明显快了一大截。简单来说,这是一种并行解码算法,名叫“LookaheadDecoding” (前向解码)。它主要利用雅可比(Jacobi)迭代法首次打破自回归解码中的顺序依赖性 (众所周知,当下大模型基本都是基于自回

浅析Redis大Key | 京东云技术团队

一、背景在京东到家购物车系统中,用户基于门店能够对商品进行加车操作。用户与门店商品使用Redis的Hash类型存储,如下代码块所示。不知细心的你有没有发现,如果单门店加车商品过多,或者门店过多时,此Key就会越来越大,从而影响线上业务。userPin:{storeId:{门店下加车的所有商品基本信息},storeId:{门店下加车的所有商品基本信息},......}二、BigKey的界定和如何产生2.1、BigKey的界定BigKey称为大Key,通常以Key对应Value的存储大小,或者Key对应Value的数量来进行综合判断。对于大Key也没有严格的定义区分,针对String与非Strin

【中国知名企业高管团队】系列17:字节跳动

大家好!今天华研荟的中国知名企业高管团队带大家了解字节跳动。说到字节跳动,不是或者不关注互联网圈子的小伙伴可能不一定知道这是啥,但是说到今日头条、抖音、西瓜视频、火山小视频等,我相信很多人就明白了——这些产品的背后就是字节跳动这个公司,当然了,字节跳动的业务板块比前面说的这几个国民级应用要多很多。字节跳动的崛起,让很多老牌的互联网大厂十分害怕。事实证明,这个2012年才成立的后生(按年龄的话今天才11岁,算是少年)已经从BAT里面抢走了很多市场份额了,更不用说传统的新浪、搜狐、网易。字节跳动从今日头条做起,把腾讯、网易的新闻业务打得落花流水,依托抖音的快速崛起,在电商这块切走了很大一块蛋糕,头

android - 要求图形团队设计 Android 应用程序 UI 时的最佳实践

我不确定这在Android中是否可行,它在各种设备上支持多种外形规范。这是我们通常面临的最痛苦的场景之一。场景:设计团队为应用程序创建UI图形,其中包含所有UI小部件及其位置预定义,如按钮、编辑文本等。这是我们需要在应用程序中使用的UI。问题:无法链接UI小部件,例如在图像上提交的实际位置上的提交按钮。有没有办法将它们联系起来?它适用于所有外形规范吗?当前的解决方案:使用布局从头开始重新创建整个UI及其所有组件。据我所知,在iOS中,实际上可以将小部件放在具有透明背景的顶部,并且开箱即用。这是可能的,因为您可以使用x和y的绝对值。--编辑--我想从上面的描述中不是很清楚。问题不在于使用

熊平开讲数字化团队管理与人才培养,清华五道口数字中国走进51CTO

近日,清华五道口“数字中国”企业家项目三期班在51CTO实地“开课”,来自制造、金融、科技等领域的40余位企业家走进51CTO实地走访和讨论。51CTO创始人&总裁熊平作为本期班的学员之一和本次课程的特邀讲师,就“数字时代如何构建企业‘技术力’”进行了授课。企业家学员们就“数字化团队管理与人才培养”话题开展了热烈的讨论。会上,熊平对企业家学员们的到来表示热烈的欢迎,并基于51CTO近二十年来专注于数字化人才培养的专业积累和思考,就数字化背后的技术奥秘、“技术力”解剖及企业应对策略等问题进行了系统阐述。熊平强调,“技术力”是数字时代企业核心竞争力的基石。面对数字化时代的诸多挑战,企业必须从技术战

LLaMA 2端到端推理打通!来自中国团队

BuddyCompiler端到端LLaMA2-7B推理示例已经合并到buddy-mlir仓库[1]主线。我们在BuddyCompiler的前端部分实现了面向TorchDynamo的第三方编译器,从而结合了MLIR和PyTorch的编译生态。目前,前端部分可以覆盖LLaMA计算图,转换到MLIR后我们集成了部分向量化和并行优化,并在AVX512平台上进行了测试。整个推理过程可以跑通但还需要大量优化。以下是相关链接和现状:[E2E]BuddyCompiler端到端LLaMA2-7B推理示例[2][E2E]上述端到端推理示例目的是展示编译栈设计,并非完备的LLaMA问答工具[Frontend]Bud

NUS华人团队最新模型,单视图重建3D,又快又准

2D图像的3D重建一直是CV领域的重头戏。层出不同的模型被开发出来试图攻克这个难题。今天,新加坡国立大学的学者共同发表了一篇论文,开发了一个全新的框架Anything-3D来解决这个老大难问题。论文地址:https://arxiv.org/pdf/2304.10261.pdf借助Meta「分割一切」模型,Anything-3D直接让分割后的任意物体活起来了。另外,再用上Zero-1-to-3模型,你就可以得到不同角度的柯基。甚至,还可以进行人物3D重建。可以说,这把真突破了。Anything-3D!在现实世界中,各种物体和各类环境既多样又复杂。所以,在不受限制的情况下,从单一RGB图像中进行三

教AI Agents学会协作&竞争!首个大模型多智能体框架CAMEL已斩获3.6k星

「什么神奇的技巧让我们变得智能?窍门就是没有窍门。智慧的力量源于我们巨大的多样性,而不是任何单一的、完美的原则。」——人工智能先驱马文·明斯基(MarvinMinsky)目前来看,在机器通向高级智能的道路上,以ChatGPT为代表的大模型(LLMs)应该是必须经过的里程碑之一,它们以聊天对话的人机交互方式在多个领域的复杂任务解决方面取得了非常耀眼的成就。随着LLMs的发展,AIAgents(AI智能体)之间的交互框架也逐渐兴起,尤其是在一些复杂的专业领域,以角色扮演等模式预置的智能体完全有能力代替人类用户在任务中扮演的角色,同时,智能体之间通过以协作和竞争形式的动态交互往往能够带来意想不到的效

PyTorch团队重写「分割一切」模型,比原始实现快八倍

从年初到现在,生成式AI发展迅猛。但很多时候,我们又不得不面临一个难题:如何加快生成式AI的训练、推理等,尤其是在使用PyTorch的情况下。本文PyTorch团队的研究者为我们提供了一个解决方案。文章重点介绍了如何使用纯原生PyTorch加速生成式AI模型,此外,文章还介绍了PyTorch新功能,以及如何组合这些功能的实际示例。结果如何呢?PyTorch团队表示,他们重写了Meta的「分割一切」(SAM)模型,从而使代码比原始实现快8倍,并且没有损失准确率,所有这些都是使用原生PyTorch进行优化的。 博客地址:https://pytorch.org/blog/accelerating-g

数字化转型团队中的九个关键角色

数字化转型,如同探索未知的迷宫,既充满机遇又充满挑战。在这场变革的浪潮中,组建一个合适的数字化转型团队成为了至关重要的环节。而这支团队的领导者,往往决定了整个数字化转型的走向。然而,组建这样一支团队并非易事,需要深思熟虑,考虑到各种因素,包括经验、教育、技能、影响力以及团队协作的能力。在数字化转型的征程中,领导者的作用至关重要。优秀的数字领导者通常是拥有预算、影响力和尊重的C级高管。他们不仅领导着整个数字化转型过程,还需要协调各方资源,确保数字化转型项目的平稳推进。数字团队的组建通常由CEO亲自把关,对于数字化转型的战略选择和执行路径,CEO的决策将直接影响整个企业的未来。数字化团队的构建是数