9月5日,在腾讯全球数字生态大会上,腾讯云正式发布AI infra品牌“腾讯云智算”。 据介绍,腾讯云智算是一个集算存网一体的高性能智算底座,整合了腾讯云高性能计算HCC、高性能网络IHN星脉、高性能云存储、加速框架、容器、向量数据库、智算套件等腾讯云优势产品,能够为AI创新输出性能领先、多芯兼容、灵活部署的智算产品能力。
在稳定性和性能上,腾讯云的集群千卡单日故障数已经刷新到0.16,是行业水平的1/3;1分钟就能完成万卡checkpoint写入,数据读写效率是业界10倍;千卡集群的通信时间缩短到6%,是业界一半。
同时,通过整合软硬件技术能力,腾讯云智算集群从机器上架到开始训练可以做到只需1天,相比业界以月为单位也大为缩短。
目前,腾讯云智算也能比较灵活地支持公有云、私有云以及分布式云的输出,成为了国内大量大模型厂商的选择,也帮助一大批IDC厂商向AIDC转型。