衡水新闻网

2026年6月30日，中昊芯英正式发布新一代全自研高性能TPU AI专用算力芯片“须臾”，同步推出搭载“须臾”芯片构建的软硬件一体化智算底座——泰则2.0 AI高性能智算平台。作为初代“刹那”芯片、初代泰则智算服务器的全面升级产品，“须臾”与泰则2.0在底层架构、算力峰值、片上存储、集群互联、计算能效等方面皆实现跨越式提升。

从“刹那”到“须臾”：TPU架构全面升级，单卡算力性能提升3倍

作为国内最早投身于TPU架构AI专用算力芯片研发的企业之一，中昊芯英在2023年成功流片了国内首枚高性能TPU AI专用算力芯片“刹那”并实现量产和产业化。基于“刹那”三年规模化落地的实践经验，中昊芯英完成新一代芯片“须臾”的架构革新，针对性解决超大模型、长上下文、海量词元交互场景下传统算力存在的访存延迟、能耗偏高、并行效率不足等痛点。

1.1 核心硬件算力指标全面升级

单颗“须臾”芯片深度优化大模型专属张量计算逻辑，扩容寄存器与大容量片上缓存，核心性能参数实现大幅跃升：

·单芯片混合精度浮点算力达896TFLOPS，性能是上一代芯片“刹那”的 3倍；8-bit推理算力可达1792TOPS，适配海量词元高并发推理场景；

·单卡搭载的显存及芯片内部互联速率均有大幅提升，支持超长上下文，降低多轮对话的数据反复搬运开销；

·单芯片额定功耗600W，相较于算力性能持平的传统算力芯片，功耗降低50%，天然适配绿色低碳智算中心建设；

·依托多维张量计算单元与数据复用优化设计，“须臾”有效缓解深度学习领域经典存储墙难题，执行同等AI任务时，综合计算效能可达传统GPU架构数倍，在大模型计算、批量词元生成场景优势尤为突出。

1.2 全栈自主可控底层技术体系

“须臾”延续中昊芯英全自研TPU技术路线，实现芯片IP核、专属指令集、底层算子加速库、整机系统软件完整自主研发，无海外核心技术依赖。公司核心技术完整覆盖芯片设计、电路开发、编译工具、模型适配全链条，可快速高效完成新模型和迭代模型的适配和部署，满足政务、金融、电网等关键行业的信息安全合规要求。

泰则2.0 AI高性能智算平台：单机7.168P算力，2048芯片高速片间互联

本次同步推出的泰则2.0 AI高性能智算平台中标准的最小计算单元（即“泰则2.0智算节点”/单机）由两路高性能CPU处理器与8片高性能TPU处理单元互联构建而成，从物理形态上形成1台通用的CPU服务器外接1台高性能TPU算力加速设备，算力达 7.168P（混合精度），同等任务下整机能耗仅为传统GPU服务器的80%。

在集群部署层面，泰则2.0在构建超大规模算力资源池时，通过自研的低延迟高并行的片间通讯协议，单个超节点最高可实现 2048片“须臾”芯片直联，能够承载万亿参数大模型分布式训练、多智能体协同运算、全平台海量词元并发推理等重负载业务。

此外，该平台还配套了完整的可视化运营管理系统，集成BMC硬件远程管控、全链路硬件状态监控、故障短信/邮件预警、算力计费、用户权限、模型市场一体化功能，运维人员可实时查看芯片温度、功耗、资源使用率、系统日志等全维度信息，拥有开箱即用的运维体验。

值得一提的是，软件层面实现了全主流AI框架兼容，原生支持PyTorch、vLLM、SGLang等开发工具，训练场景适配DeepSpeed、Megatron-LM分布式套件；已完成Qwen全系列、DeepSeek、GLM、MiniMAX等数十款大语言、多模态模型深度适配，开发者无需大规模代码改造即可快速完成模型迁移，大幅降低国产算力替换门槛。

直击词元经济与AI智能体产业新需求，覆盖多个垂直行业落地

2026年行业正式迈入词元经济落地阶段，AI产业从传统算力时租模式转向以词元为核心计价单位的 MaaS 模型即服务模式，海量对话交互、长上下文记忆、AI智能体自主任务带来指数级词元吞吐压力。“须臾”芯片与泰则2.0平台从硬件层面对词元生成、上下文缓存、批量并发推理做专属优化，可有效降低单词元推理成本，支撑AI服务商搭建自主可控的按量计费词元服务体系。

同时，产品深度适配当下主流开源AI智能体框架OpenClaw，提供本地私有化部署方案，所有交互词元、业务数据本地存储不对外流出，兼顾数字员工7×24小时自动化执行能力与企业数据隐私安全，可落地报表自动化、IT运维监控、批量数据分析、个人智能助理等场景。依托通用高效的张量算力底座，整套方案可赋能多个行业数字化智能化转型。

在商业化成本与绿色算力层面，泰则2.0单位算力建设成本仅为海外高端算力产品的60%，低功耗特性可显著降低智算中心电费支出与碳排放，契合各地低碳算力园区、数据中心碳中和建设政策导向。

大规模客户应用落地，驱动技术持续迭代

中昊芯英的初代“刹那”芯片已在多个行业实现大规模客户交付与成熟落地。目前，公司产品已成功部署于由深圳联通、天津移动、太极股份、江西上饶等运营商、政府机构及科技企业建设的多个超大规模智算中心，并已在高校、科研机构等的科研计算平台与教学实验环境中投入使用，辐射至金融、传媒、教育、医疗等广泛行业领域。

面向未来，中昊芯英将继续依托已有的大规模客户基础，持续进行技术迭代，优化TPU芯片算力、能效与片上存储架构，适配更多大规模大模型与多智能体集群的运算需求；同时联合主流大模型厂商、云服务商及系统集成商，深化软硬件协同开发，进一步扩展自主可控算力产业链的落地版图。

来源：中国新闻资讯网
原标题：中昊芯英正式发布新一代高性能TPU AI专用算力芯片“须臾”

点赞 +1

微博

微信

重设密码

中昊芯英正式发布新一代高性能TPU AI专用算力芯片“须臾”

我要评论

相关推荐

河北武邑：生态赋能城市 文脉浸润民生

武邑县“小院议事”解民忧：两处老旧院落危墙修缮完工

书香润初心 共读砺使命 武强县街关镇开展庆“七一”红色共读主题活动

武强县北代镇举办庆祝建党105周年文艺汇演

以武聚贤振国粹 文企赋能兴湖城 2026武术名家衡水交流大会成功举办

健康润乡土 知识惠农家 衡水市武邑县举办健康提“素”乡村行专场活动

柔性板制造精度要求攀升，汉普智造“前移+专用+全检”提供实践参考

武邑康泰社区开展庆“七一”主题联谊活动

热门

24小时

河北武邑：生态赋能城市文脉浸润民生

书香润初心共读砺使命武强县街关镇开展庆“七一”红色共读主题活动

以武聚贤振国粹文企赋能兴湖城 2026武术名家衡水交流大会成功举办

健康润乡土知识惠农家衡水市武邑县举办健康提“素”乡村行专场活动