vivo AI计算平台在线业务落地实践
一、背景
vivo人工智能计算平台小组从2018年底开始建设 AI 计算平台至今,已经在k8s集群、以及离线的深度学习模型训练等方面,积累了众多宝贵的开发、运维经验,并逐步打造出稳定的基础容器平台 - AI容器平台(VContainer)。为了支撑公司AI在线业务的发展,满足公司对算力资源的高效调度管控需求,需要将在线业务,主要包括C端、推理等业务,由原来的虚拟机或物理机迁移至AI容器平台。于是小组从2020年初开始,基于在线业务的需求对AI容器平台进行进一步建设,并将平台与公司的CMDB、CI...