太极_草庐IT

腾讯广告模型基于"太极"的训练成本优化实践

近年来，大数据加大模型成为了AI领域建模的标准范式。在广告场景，大模型由于使用了更多的模型参数，利用更多的训练数据，模型具备了更强的记忆能力和泛化能力，为广告效果向上提升打开了更大的空间。但是大模型在训练过程中所需要的资源也是成倍的增长，存储以及计算上的压力对机器学习平台都是巨大的挑战。腾讯太极机器学习平台持续探索降本增效方案，在广告离线训练场景利用混合部署资源大大降低了资源成本，每天为腾讯广告提供 50W 核心廉价混合部署资源，帮助腾讯广告离线模型训练资源成本降低 30%，同时通过一系列优化手段使得混部资源稳定性和正常资源持平。1、引言近年来，随着大模型在NLP领域横扫各种大数据磅单取得巨大

太极限了，JDK的这个BUG都能被我踩到

hello，大家好呀，我是小楼。之前遇到个文件监听变更的问题，刚好这周末有空研究了一番，整理出来分享给大家。从一次故障说起我们还是从故障说起，这样更加贴近实际，也能让大家更快速理解背景。有一个下发配置的服务，这个配置服务的实现有点特殊，服务端下发配置到各个服务的本地文件，当然中间经过了一个agent，如果没有agent也就无法写本地文件，然后由client端的程序监听这个配置文件，一旦文件有变更，就重新加载配置，画个架构图大概是这样：今天的重点是文件的变更该如何监听（watch），我们当时的实现非常简单：单独起个线程，定时去获取文件的最后更新时间戳（毫秒级）记录每个文件的最后更新时间戳，根据这

JDK BUG section images upload

太极限了，JDK的这个BUG都能被我踩到

hello，大家好呀，我是小楼。之前遇到个文件监听变更的问题，刚好这周末有空研究了一番，整理出来分享给大家。从一次故障说起我们还是从故障说起，这样更加贴近实际，也能让大家更快速理解背景。有一个下发配置的服务，这个配置服务的实现有点特殊，服务端下发配置到各个服务的本地文件，当然中间经过了一个agent，如果没有agent也就无法写本地文件，然后由client端的程序监听这个配置文件，一旦文件有变更，就重新加载配置，画个架构图大概是这样：今天的重点是文件的变更该如何监听（watch），我们当时的实现非常简单：单独起个线程，定时去获取文件的最后更新时间戳（毫秒级）记录每个文件的最后更新时间戳，根据这

JDK BUG section images upload