草庐IT

将附件发送到团队的机器人

我正在与.NETC#中的Botbuilder合作。我无法弄清楚如何使用TeamsClient向机器人发送附件-我尝试使用Windows桌面应用程序和Web客户端,但都没有在与机器人的聊天中显示附件按钮。我还尝试使用Android客户端,发现我可以发送图像附件,但不能发送其他文件类型,然后我回去,发现我可以通过将图像粘贴到聊天框中,在桌面/Web客户端中进行相同的操作。使用此方法,我确实在Activity.Attachments和ContentType="image/*"。我尝试在Android客户端附加的任何其他类型的文件都不会发送到机器人(Activity.Attachments正如我所说,

大数据前端团队生存指南

本文会简单介绍大数据、大数据前端团队以及可落地的演进方向。ps.针对数据前端团队10人及以内的中小厂。开始前问几个问题:你了解大数据技术吗?为什么需要大数据前端团队(和大数据有什么关联)?大数据前端团队在前端团队中的定位?浅入浅出大数据为什么需要大数据咱们年终述职汇报的时候,是不是有个标准套路:使用xx工具替换了xx工具,并落地xx个团队的xx个项目,覆盖率x%,整体体积减少了x%,加载速度从x缩短到x。那么完成上面这条简短而有力的阐述需要那几个步骤?我需要哪些数据,从哪来?寻源与采集收集的数据很多要怎么管理?聚合与统计如何整理出可读和有用的结果?建模与分析大数据技术在做什么数据本身的价值——

谷歌DeepMind团队深夜发布新AI开源模型Gemma;技术大神Karpathy离职OpenAI后发布教学视频

🦉AI新闻🚀谷歌DeepMind团队深夜发布新AI开源模型Gemma摘要:谷歌DeepMind团队于今日发布了一款名为Gemma的新型AI模型,该模型启发自Gemini,提供两个版本:Gemma2B和Gemma7B。这款模型支持Keras3.0和PyTorch等工具进行微调,可在性能较低的设备上运行,且性能超越竞品MetaLlama-2模型。为确保模型的安全性和可靠性,研究团队采用自动化技术过滤敏感数据,并通过大量微调及“强化学习”等手段提高模型的行为一致性。此外,对模型进行了“红队测试”和“自动对抗测试”以评估其能力,确保模型具有“负责任的特性”。Kaggle地址:https://www.k

想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速

作为2024开年王炸,Sora的出现树立了一个全新的追赶目标,每个文生视频的研究者都想在最短的时间内复现Sora的效果。根据OpenAI披露的技术报告,Sora的核心技术点之一是将视觉数据转化为patch的统一表征形式,并通过Transformer和扩散模型结合,展现了卓越的扩展(scale)特性。在报告公布后,Sora核心研发成员WilliamPeebles和纽约大学计算机科学助理教授谢赛宁合著的论文《ScalableDiffusionModelswithTransformers》就成了众多研究者关注的重点。大家希望能以论文中提出的DiT架构为突破口,探索复现Sora的可行路径。最近,新加坡

陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存

陈丹琦团队刚刚发布了一种新的LLM上下文窗口扩展方法:它仅用8k大小的token文档进行训练,就能将Llama-2窗口扩展至128k。最重要的是,在这个过程中,只需要原来1/6的内存,模型就获得了10倍吞吐量。除此之外,它还能大大降低训练成本:用该方法对7B大小的羊驼2进行改造,只需要一块A100就能搞定。团队表示:希望这个方法有用、好用,为未来的LLM们提供廉价又有效的长上下文能力。目前,模型和代码都已在HuggingFace和GitHub上发布。只需添加两个组件这个方法名叫CEPE,全称“并行编码上下文扩展(ContextExpansionwithParallelEncoding)”。作为

中国如何复刻Sora,华人团队长文解构!996 OpenAI研究员:Sora是视频GPT-2时刻

今天,这张图在AI社区热转。它列举了一众文生视频模型的诞生时间、架构和作者机构。毫不意外,谷歌依然是视频模型开山之作的作者。不过如今AI视频的聚光灯,全被Sora抢去了。同时,自曝996作息时间表的OpenAI研究员JasonWei表示——「Sora是一个里程碑,代表着视频生成的GPT-2时刻。」对于文字生成领域,GPT-2无疑是一个分水岭。2018年GPT-2的推出,标志着能够生成连贯、语法正确的文本段落的新时代。当然,GPT-2也难以完成一篇完整无误的文章,会出现逻辑不一致或捏造事实的情况。但是,它为后续的模型发展奠定了基础。在不到五年内,GPT-4已经能够执行串联思维这种复杂任务,或者写

上海交大 AI4S 团队提出「智能化科学设施」构想,建立跨学科 AI 科研助手

近年来,人工智能在科研中的应用持续向纵深发展,同时也在不断扩张应用领域的广度,从蛋白质折叠到新材料发现,从疾病预测到预后诊疗,从天文探索到自然灾害分析……AIforScience多点开花的背后,一方面是国内外AI企业面向科学研究领域的研发,降低了AI工具的使用门槛;另一方面也是科研人员在接纳「AI帮手」的过程中,与其磨合出了高效的协作模式。Nature的一项分析显示,在Scopus数据库中,在标题或摘要中提到人工智能或人工智能相关关键词的论文比例,从十年前的2%上升到了现在的8%。然而,纵观以谷歌DeepMind为代表的科技大厂所发布的大模型等工具,以及海内外高校研究团队发表的相关研究成果,大

本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere

一周纵览本周硅谷大厂最值得关注的,是各家的大模型均有不少上新。OpenAI宣布了多项模型更新,同时发布了GPT-4Turbo预览模型,提升了代码生成能力。Google发布文本生成视频模型Lumiere,生成视频在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对OpenAI的依赖。AdeptAI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和GeminiUltra。同时,国内大模型也有不少进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外,第四批国产AI大模型备案获批,14款大模型及产

小鹏团队提出Anything in Any Scene,超真实的视频模拟框架,图像增强的未来?

你能找出哪个物体是假的么?项目demo效果非常惊艳,仔细看了之后又发现工作量很大,Pipeline很复杂,即使SupplementaryMaterial中补充了很多信息,但具体细节估计需要详细看代码才能清楚了。看文章的排版和挂到arxiv的时间,应该是投CVPR2024了,可以期待一下完整代码。摘要:实际视频模拟在从虚拟现实到电影制作的多样化应用中显示出巨大的潜力,特别是在现实世界环境中拍摄视频不切实际或成本过高的情况下。现有的视频模拟方法常常无法准确地模拟光照环境、表现物体几何形状或达到高水平的照片级真实感。在这篇论文中,提出了一个名为“任何物体在任何场景”(AnythinginAnySce

补齐Transformer规划短板,田渊栋团队的Searchformer火了

最近几年,基于Transformer的架构在多种任务上都表现卓越,吸引了世界的瞩目。使用这类架构搭配大量数据,得到的大型语言模型(LLM)等模型可以很好地泛化用于真实世界用例。尽管有如此成功,但基于Transformer的架构和LLM依然难以处理规划和推理任务。之前已有研究证明LLM难以应对多步规划任务或高阶推理任务。为了提升Transformer的推理和规划性能,近些年研究社区也提出了一些方法。一种最常见且有效的方法是模拟人类的思考过程:先生成中间「思维」,然后再输出响应。比如思维链(CoT)提示法就是鼓励模型预测中间步骤,进行按步骤的「思考」。思维树(ToT)则使用了分支策略和评判方法,让