中昊芯英宣布推出新一代全自研高性能TPU AI专用芯片「须臾」,其单芯片混合精度浮点算力可达896 TFLOPS,是上一代芯片「刹那」的三倍。8-bit推理算力可达1792 TOPS,适用于海量词元高并发推理场景。须臾的显存和芯片内部互联速率都有大幅提升,支持超长上下文。单卡额定功耗600W,相比传统算力芯片功耗降低50%,有助于低碳数据中心的建设。须臾的芯片IP核、专属指令集、底层算子加速库、整机系统软件均为完整自主研发,无海外核心技术依赖,满足政务、金融、电网等行业的安全合规要求。

同时,「泰则2.0」高性能智算平台亮相,它搭载两路高性能CPU处理器与8片高性能TPU处理单元,算力达7.168P(混合精度),同等任务下整机能耗仅为传统GPU服务器的80%。该平台从软件层面实现了全主流AI框架兼容,原生支持PyTorch、vLLM、SGLang等开发工具,训练场景适配DeepSpeed、Megatron-LM分布式套件;已完成Qwen全系列、DeepSeek、GLM、MiniMAX等数十款大语言、多模态模型深度适配,开发者可快速完成模型迁移。

标签: none

评论已关闭