草庐IT

TKE qGPU 通过 CRD 管理集群 GPU 卡资源

作者刘旭,腾讯云高级工程师,专注容器云原生领域,有多年大规模Kubernetes集群管理经验,现负责腾讯云GPU容器的研发工作。背景目前TKE已提供基于qGPU的算力/显存强隔离的共享GPU调度隔离方案,但是部分用户反馈缺乏GPU资源的可观测性,例如无法获取单个GPU设备的剩余资源,不利于GPU资源的运维和管理。在这种背景下,我们希望提供一种方案,可以让用户在Kubernetes集群中直观的统计和查询GPU资源的使用情况。目标在目前TKE共享GPU调度方案的基础上,从以下几个方面增强GPU设备的可观测性:支持获取单个GPU设备的资源分配信息。支持获取单个GPU设备的健康状态。支持获取某个节点上

TKE 注册节点,IDC 轻量云原生上云的最佳路径

林顺利,腾讯云原生产品经理,负责分布式云产品迭代和注册节点客户扩展,专注于云原生混合云新形态的推广实践。背景企业在持续业务运维过程中,感受到腾讯云TKE带来的便捷性和极致的使用体验,将新业务的发布以及老业务都迁移到云上TKE来实现。但很多企业数据中心建设较为早期,选型上采取了自建IDC机房的方案,长久以来的IDC运营维护和企业上云的诉求产生了冲突和矛盾1、资源难利旧/利用率低业务大部分在云上运行,存量的IDC主机难以利旧;云下资源业务利用率低(主要是CPU资源),平均不超过20%,资源浪费严重;对于GPU只能实现整卡利用,多数业务运行达不到单卡门槛时产生了gpu资源浪费;2、运维成本高自建Ku

TKE 注册节点,IDC 轻量云原生上云的最佳路径

林顺利,腾讯云原生产品经理,负责分布式云产品迭代和注册节点客户扩展,专注于云原生混合云新形态的推广实践。背景企业在持续业务运维过程中,感受到腾讯云TKE带来的便捷性和极致的使用体验,将新业务的发布以及老业务都迁移到云上TKE来实现。但很多企业数据中心建设较为早期,选型上采取了自建IDC机房的方案,长久以来的IDC运营维护和企业上云的诉求产生了冲突和矛盾1、资源难利旧/利用率低业务大部分在云上运行,存量的IDC主机难以利旧;云下资源业务利用率低(主要是CPU资源),平均不超过20%,资源浪费严重;对于GPU只能实现整卡利用,多数业务运行达不到单卡门槛时产生了gpu资源浪费;2、运维成本高自建Ku

降本超30%,智聆口语通过 TKE 注册节点实现 IDC GPU 节点降本增效实践

背景介绍腾讯云智聆口语评测(SmartOralEvaluation,SOE)是腾讯云推出的中英文语音评测产品,支持从儿童到成人全年龄覆盖的语音评测,提供单词、句子、段落、自由说等多种评测模式,从发音精准度、流利度、完整度等全方位打分机制,与专家打分相似度达95%以上,可广泛应用于中英文口语教学场景中。在降本增效的大环境下,业务积极寻求成本更优的解决方案,且由于已经积累了IDC物理机、云上虚拟机和云上Serverless容器服务等多套部署环境,业务架构十分臃肿,运维难度非常高,业务急需一套更加统一的方案降低系统复杂度。问题与挑战产品侧的降本诉求问题在当前降本增效大环境下,如何控制产品成本成为一个

降本超30%,智聆口语通过 TKE 注册节点实现 IDC GPU 节点降本增效实践

背景介绍腾讯云智聆口语评测(SmartOralEvaluation,SOE)是腾讯云推出的中英文语音评测产品,支持从儿童到成人全年龄覆盖的语音评测,提供单词、句子、段落、自由说等多种评测模式,从发音精准度、流利度、完整度等全方位打分机制,与专家打分相似度达95%以上,可广泛应用于中英文口语教学场景中。在降本增效的大环境下,业务积极寻求成本更优的解决方案,且由于已经积累了IDC物理机、云上虚拟机和云上Serverless容器服务等多套部署环境,业务架构十分臃肿,运维难度非常高,业务急需一套更加统一的方案降低系统复杂度。问题与挑战产品侧的降本诉求问题在当前降本增效大环境下,如何控制产品成本成为一个

轻量化安装 TKEStack:让已有 K8s 集群拥有企业级容器云平台的能力

关于我们更多关于云原生的案例和知识,可关注同名【腾讯云原生】公众号~福利:①公众号后台回复【手册】,可获得《腾讯云原生路线图手册》&《腾讯云原生最佳实践》~②公众号后台回复【系列】,可获得《15个系列100+篇超实用云原生原创干货合集》,包含Kubernetes降本增效、K8s性能优化实践、最佳实践等系列。③公众号后台回复【白皮书】,可获得《腾讯云容器安全白皮书》&《降本之源-云原生成本管理白皮书v1.0》④公众号后台回复【光速入门】,可获得腾讯云专家5万字精华教程,光速入门Prometheus和Grafana。作者王龙,腾讯云后台开发工程师,负责TKEStack的设计开发维护及混合云项目相关

轻量化安装 TKEStack:让已有 K8s 集群拥有企业级容器云平台的能力

关于我们更多关于云原生的案例和知识,可关注同名【腾讯云原生】公众号~福利:①公众号后台回复【手册】,可获得《腾讯云原生路线图手册》&《腾讯云原生最佳实践》~②公众号后台回复【系列】,可获得《15个系列100+篇超实用云原生原创干货合集》,包含Kubernetes降本增效、K8s性能优化实践、最佳实践等系列。③公众号后台回复【白皮书】,可获得《腾讯云容器安全白皮书》&《降本之源-云原生成本管理白皮书v1.0》④公众号后台回复【光速入门】,可获得腾讯云专家5万字精华教程,光速入门Prometheus和Grafana。作者王龙,腾讯云后台开发工程师,负责TKEStack的设计开发维护及混合云项目相关
12