陈冰心,腾讯云产品经理,负责超级节点迭代与客户拓展,专注于TKEServerless产品演进。背景让人又爱又恨的ServerlessServerless炙手可热,被称为云原生未来发展的方向。信通院报告显示:在核心业务中使用Serverless的用户占到18.11%,已经开始和计划使用Serverless技术的用户超过了70%。Serverless广受追捧,得益于它在“快速的开发交付”、“极高的运维效率”、“极低的资源成本”这三个方面上的优势。Serverless可以让业务更快上云,让用户用最小的运维投入享受云带来的便利性。底层资源规划及运维交给更专业的云平台处理,使用户可以更专注业务和产品本身
作者徐蓓,腾讯云容器技术专家,腾讯云异构计算容器负责人,多年云计算一线架构设计与研发经验,长期深耕Kubernetes、在离线混部与GPU容器化领域,KubernetesKEPMemoryQoS作者,Kubernetes积极贡献者。当前存在问题GPU具备大量核心和高速内存,擅长并行计算,非常适合训练和运行机器学习模型。由于近几年AI技术愈发成熟,落地场景越来越多,对GPU的需求呈井喷趋势。而在资源管理调度平台上,Kubernetes已成为事实标准。所以很多客户选择在Kubernetes中使用GPU运行AI计算任务。Kubernetes提供deviceplugin机制,可以让节点发现和上报设备资
作者徐蓓,腾讯云容器技术专家,腾讯云异构计算容器负责人,多年云计算一线架构设计与研发经验,长期深耕Kubernetes、在离线混部与GPU容器化领域,KubernetesKEPMemoryQoS作者,Kubernetes积极贡献者。当前存在问题GPU具备大量核心和高速内存,擅长并行计算,非常适合训练和运行机器学习模型。由于近几年AI技术愈发成熟,落地场景越来越多,对GPU的需求呈井喷趋势。而在资源管理调度平台上,Kubernetes已成为事实标准。所以很多客户选择在Kubernetes中使用GPU运行AI计算任务。Kubernetes提供deviceplugin机制,可以让节点发现和上报设备资
陈冰心,腾讯云产品经理,负责超级节点迭代与客户拓展,专注于TKEServerless产品演进。背景让人又爱又恨的ServerlessServerless炙手可热,被称为云原生未来发展的方向。信通院报告显示:在核心业务中使用Serverless的用户占到18.11%,已经开始和计划使用Serverless技术的用户超过了70%。Serverless广受追捧,得益于它在“快速的开发交付”、“极高的运维效率”、“极低的资源成本”这三个方面上的优势。Serverless可以让业务更快上云,让用户用最小的运维投入享受云带来的便利性。底层资源规划及运维交给更专业的云平台处理,使用户可以更专注业务和产品本身
陈冰心,腾讯云产品经理,负责超级节点迭代与客户拓展,专注于TKEServerless产品演进。背景让人又爱又恨的ServerlessServerless炙手可热,被称为云原生未来发展的方向。信通院报告显示:在核心业务中使用Serverless的用户占到18.11%,已经开始和计划使用Serverless技术的用户超过了70%。Serverless广受追捧,得益于它在“快速的开发交付”、“极高的运维效率”、“极低的资源成本”这三个方面上的优势。Serverless可以让业务更快上云,让用户用最小的运维投入享受云带来的便利性。底层资源规划及运维交给更专业的云平台处理,使用户可以更专注业务和产品本身
作者刘旭,腾讯云高级工程师,专注容器云原生领域,有多年大规模Kubernetes集群管理经验,现负责腾讯云GPU容器的研发工作。背景目前TKE已提供基于qGPU的算力/显存强隔离的共享GPU调度隔离方案,但是部分用户反馈缺乏GPU资源的可观测性,例如无法获取单个GPU设备的剩余资源,不利于GPU资源的运维和管理。在这种背景下,我们希望提供一种方案,可以让用户在Kubernetes集群中直观的统计和查询GPU资源的使用情况。目标在目前TKE共享GPU调度方案的基础上,从以下几个方面增强GPU设备的可观测性:支持获取单个GPU设备的资源分配信息。支持获取单个GPU设备的健康状态。支持获取某个节点上
作者刘旭,腾讯云高级工程师,专注容器云原生领域,有多年大规模Kubernetes集群管理经验,现负责腾讯云GPU容器的研发工作。背景目前TKE已提供基于qGPU的算力/显存强隔离的共享GPU调度隔离方案,但是部分用户反馈缺乏GPU资源的可观测性,例如无法获取单个GPU设备的剩余资源,不利于GPU资源的运维和管理。在这种背景下,我们希望提供一种方案,可以让用户在Kubernetes集群中直观的统计和查询GPU资源的使用情况。目标在目前TKE共享GPU调度方案的基础上,从以下几个方面增强GPU设备的可观测性:支持获取单个GPU设备的资源分配信息。支持获取单个GPU设备的健康状态。支持获取某个节点上
林顺利,腾讯云原生产品经理,负责分布式云产品迭代和注册节点客户扩展,专注于云原生混合云新形态的推广实践。背景企业在持续业务运维过程中,感受到腾讯云TKE带来的便捷性和极致的使用体验,将新业务的发布以及老业务都迁移到云上TKE来实现。但很多企业数据中心建设较为早期,选型上采取了自建IDC机房的方案,长久以来的IDC运营维护和企业上云的诉求产生了冲突和矛盾1、资源难利旧/利用率低业务大部分在云上运行,存量的IDC主机难以利旧;云下资源业务利用率低(主要是CPU资源),平均不超过20%,资源浪费严重;对于GPU只能实现整卡利用,多数业务运行达不到单卡门槛时产生了gpu资源浪费;2、运维成本高自建Ku
林顺利,腾讯云原生产品经理,负责分布式云产品迭代和注册节点客户扩展,专注于云原生混合云新形态的推广实践。背景企业在持续业务运维过程中,感受到腾讯云TKE带来的便捷性和极致的使用体验,将新业务的发布以及老业务都迁移到云上TKE来实现。但很多企业数据中心建设较为早期,选型上采取了自建IDC机房的方案,长久以来的IDC运营维护和企业上云的诉求产生了冲突和矛盾1、资源难利旧/利用率低业务大部分在云上运行,存量的IDC主机难以利旧;云下资源业务利用率低(主要是CPU资源),平均不超过20%,资源浪费严重;对于GPU只能实现整卡利用,多数业务运行达不到单卡门槛时产生了gpu资源浪费;2、运维成本高自建Ku
背景介绍腾讯云智聆口语评测(SmartOralEvaluation,SOE)是腾讯云推出的中英文语音评测产品,支持从儿童到成人全年龄覆盖的语音评测,提供单词、句子、段落、自由说等多种评测模式,从发音精准度、流利度、完整度等全方位打分机制,与专家打分相似度达95%以上,可广泛应用于中英文口语教学场景中。在降本增效的大环境下,业务积极寻求成本更优的解决方案,且由于已经积累了IDC物理机、云上虚拟机和云上Serverless容器服务等多套部署环境,业务架构十分臃肿,运维难度非常高,业务急需一套更加统一的方案降低系统复杂度。问题与挑战产品侧的降本诉求问题在当前降本增效大环境下,如何控制产品成本成为一个