草庐IT

军团队

全部标签

微软和苏黎世联邦理工学院开源SliceGPT创新压缩技术节省大量部署资源;OpenAI成立儿童安全团队,防AI误用

🦉AI新闻🚀微软和苏黎世联邦理工学院开源SliceGPT创新压缩技术节省大量部署资源摘要:微软和苏黎世联邦理工学院研究人员开源了SliceGPT,通过对大模型的权重矩阵进行压缩切片,实现了模型紧缩,节省了部署资源。SliceGPT利用主成分分析和正交矩阵变换实现了计算不变性,通过切片操作将模型的参数体量压缩了25%左右,同时保持了高质量的生成任务性能。SliceGPT的技术特点包括简单高效、保持性能、吞吐量提升和无需额外代码优化,使得模型压缩过程更为便捷,并且在运行速度上比稠密模型更快,无需额外的代码优化。🚀日本请求修改法律以更好地保护新闻版权摘要:日本报刊出版协会近日向文化厅提交意见书,呼吁

【低代码】低代码平台协同&敏捷场景下的并行开发解决方案探索 | 京东云技术团队

低代码开发平台的出现,大大地提高的产品交付效率,但是在协同开发、敏捷迭代的场景下,也暴露出了一些问题。例如:多人同时对项目进行修改,相互影响甚至修改内容被互相覆盖;同一项目下多个需求同步开发,但需求上线日期不统一,无法拆分上线等等。本文将根据不同诉求,渐进式的讨论支持并行开发的各种解决方案。低代码开发平台(Low-CodeDevelopmentPlatform,LCDP),帮助用户使用可视化图形界面(拖拽搭建或配置化方式)编写应用程序,而无需进行传统的编程开发。低代码开发平台的研发团队往往把更多的经历投入到应用程度搭建过程的完善和丰富上(例如,丰富可通过搭建实现的功能,优化拖拽搭建的交互体验等

通过REST部署团队城市通过Visual Studio Team服务建造

我们最近实施了团队城市,我一直在使其与现有VSTS环境合作。理想情况下,我们希望拥有团队城市建设和VSTS发布。我们已经在VST内部有团队的城市产生了工件,但是您不能按照本文触发CI触发CI;https://www.visualstudio.com/en-us/docs/build/concepts/definitions/release/artifacts我想做的是让城市团队通过VSTSRESTAPI触发发布。我在这里遵循了文档https://www.visualstudio.com/en-us/docs/integrate/api/rm/releases但是我遇到的问题要吸引VST使用团队

京东广告算法架构体系建设--高性能计算方案最佳实践 | 京东零售广告技术团队

1、前言推荐领域算法模型的在线推理是一个对高并发、高实时有较强要求的场景。算法最初是基于Wide&Deep相对简单的网络结构进行建模,容易满足高实时、高并发的推理性能要求。但随着广告模型效果优化进入深水区,基于Transformer用户行为序列和Attention的建模逐渐成为主流,这个阶段模型的特点是参数的体量、网络结构复杂度呈指数级增长,算法建模的创新工作往往由于吞吐和耗时的性能算力问题,导致无法落地于在线推理获得效果收益。传统通过扩容资源的方式,其边际效应也在减弱,算力优化存在诸多挑战:1、高算力需求下的资源成本边际效应问题:集群资源扩容是提升算力的一种传统方案,但算力需求的增加往往需要

记一次线上问题引发的对 Mysql 锁机制分析 | 京东物流技术团队

背景最近双十一开门红期间组内出现了一次因Mysql死锁导致的线上问题,当时从监控可以看到数据库活跃连接数飙升,导致应用层数据库连接池被打满,后续所有请求都因获取不到连接而失败整体业务代码精简逻辑如下:@Transactionpublicvoidservice(Integerid){delete(id);insert(id);}数据库实例监控:当时通过分析上游问题流量限流解决后,后续找时间又重新分析了下问题发生的根本原因,现将其总结如下:本篇文章会先对Mysql中的各种锁进行分析,包括互斥锁、间隙锁和插入意向锁,让大家对各种锁的使用场景有一个了解,然后在此基础上再对本问题进行分析,希望大家未来再

C++ 如何防止我的团队开发人员错误地使用整数版本的 abs?

我的团队正在编写要为Windows(使用VS2015)和Android(使用QtCreator调用的GCC4.9)编译的代码。我们发现Android二进制文件在abs函数方面存在问题。doublea=1.0;doubleb=0.5;std::cout显示:10.5这是一个已知问题,发现了这个主题(以及其他主题):Strangebuginusageofabs()Iencounteredrecently我们在很多地方使用abs,我将把它们全部替换为std::abs。美好的。但我怎样才能防止abs被再次使用呢?找到这个主题:Avoidingcompilerissueswithabs(),但它

DevOps 团队应该了解的 5 个安全威胁

DevOps安全性,也称为DevSecOps,是一种将安全实践集成到DevOps流程中的理念。DevOps安全涉及通过发布工程师和安全团队之间持续、灵活的协作来创建“安全即代码”文化。DevSecOps运动与DevOps本身非常相似,专注于在敏捷框架内为复杂的软件开发流程创建新的解决方案。DevOps安全性在于打破孤岛并促进跨团队的开放式协作。它是为了让每个人都对安全负责,最终目标是提高代码发布的质量和速度。采用DevOps安全模型需要整个组织进行文化转变。它需要将安全性集成到开发和运营流程的各个方面。DevOps安全不仅仅是实施工具和技术;这是关于改变我们看待安全的方式。安全性不应成为事后的

无需RLHF就能对齐人类,性能比肩ChatGPT!华人团队提出袋熊Wombat模型

OpenAI的ChatGPT能够理解各种各样的人类指令,并在不同的语言任务中表现出色。这归功于一种新颖的大规模语言模型微调方法——RLHF(通过强化学习对齐人类反馈)。RLHF方法解锁了语言模型遵循人类指令的能力,使得语言模型的能力与人类需求和价值观保持一致。目前,RLHF的研究工作主要使用PPO算法对语言模型进行优化。然而,PPO算法包含许多超参数,并且在算法迭代过程中需要多个独立模型相互配合,因此错误的实现细节可能会导致训练结果不佳。同时,从与人类对齐的角度来看,强化学习算法并不是必须的。论文地址:https://arxiv.org/abs/2304.05302v1项目地址:https:/

springboot升级过程中踩坑定位分析记录 | 京东云技术团队

作者:京东零售 李文龙1.背景“俗话说:为了修复一个小bug而引入了一个更大bug”因所负责的系统使用的spring框架版本5.1.5.RELEASE在线上出过一个偶发的小事故,最后定位为spring-context中的一个bug导致的。为了修复此bug进行了spring版本的升级,最终定的版本为收银台团队使用的版本5.2.12.RELEASE,对应的springboot版本为2.2.12.RELEASE。选择这个版本的原因是:1.有团队经过了长时间的线上验证2.修复了5.1.5.RELEASE对应的bug2.升级上线升级相关版本后在预发环境进行了验证,暂未遇到关于框架的问题。本以为安全升级完

AI新工具(20240206) Qwen1.5;法唠;Boximator 是由字节跳动研究团队开发的创新视频生成工具;秒画 等

Qwen1.5-Qwen1.5更新了六种尺寸的基础和聊天模型,并在HuggingFace转换器集成了其代码,以提升开发者体验,并支持多种语言和长上下文处理。Qwen1.5是一个大规模语言模型的最新迭代,它由Qwen团队开发。这个更新在中国新年前夕发布,目标是在优化开发者体验的同时,开发一个“优质”的模型。Qwen1.5是一个功能丰富、多用途的大规模语言模型,它通过易于使用的API、支持多种框架和工具,以及优秀的多语言能力,为开发者和研究人员提供了强大的支持,特别适用于那些追求高效开发体验和高质量模型输出的场景。https://qwenlm.github.io/blog/qwen1.5/Imag