后摩智能推出边端大模型 AI 芯片M30，赋能多场景智能化｜后摩智能科技有限公司|劲能芯·极效行

后摩智能推出边端大模型 AI 芯片M30，赋能多场景智能化

2024-07-04

近日，后摩智能推出基于存算一体架构的边端大模型 AI 芯片——后摩漫界™️M30，最高算力 100TOPS，典型功耗 12W。为了进一步提升部署的便捷性，后摩智能同步推出了基于 M30 芯片的智算模组(SoM)和力谋®️AI加速卡。

m30-文中.jpg
后摩漫界™️M30

随着 AI 大模型部署需求从云端迅速向端侧和边缘侧设备迁移，AI 芯片的性能、功耗和响应速度面临前所未有的挑战。后摩漫界™️M30 芯片兼具高性能与低功耗特性，可满足边端侧大模型部署对高效率和实时性的严苛要求。

M30是一款通用的边端大模型 AI 芯片，能够支持多种大模型，包括但不限于ChatGLM、Llama2、通义千问等。以Qwen1.5-7B-Chat为例，M30的运行性能可达15-20 Tokens/s。

基于M30 芯片的智算模组(SoM)支持PCIe EP模式，以其小巧的体积、强劲的性能和极低的功耗，成为小型化设备和功耗敏感嵌入式场景的理想选择。此外，基于M30 芯片的力谋®️AI加速卡作为标准的半高半长PCIe加速卡，能在 PC、一体机和服务器中实现快速部署，支持主动散热和被动散热两种模式，确保设备在不同环境下的稳定运行。

后摩漫界™️M30 将以“+AI”的方式，为传统的端侧和边缘侧设备注入强大的大模型能力，现已成功适配包括 X86、ARM 在内的多种主流处理器，可广泛应用于 AI PC、边缘AI一体机、智能座舱、商用显示、智能融合网关，NAS（网络附加存储）等领域，为 AI 技术在更多领域的深入应用注入强大动力。