后摩智能推出边端大模型 AI 芯片M30,赋能多场景智能化
2024-07-04近日,后摩智能推出基于存算一体架构的边端大模型 AI 芯片——后摩漫界™️M30,最高算力 100TOPS,典型功耗 12W。为了进一步提升部署的便捷性,后摩智能同步推出了基于 M30 芯片的智算模组(SoM)和力谋®️AI加速卡。
后摩漫界™️M30
随着 AI 大模型部署需求从云端迅速向端侧和边缘侧设备迁移,AI 芯片的性能、功耗和响应速度面临前所未有的挑战。后摩漫界™️M30 芯片兼具高性能与低功耗特性,可满足边端侧大模型部署对高效率和实时性的严苛要求。
M30是一款通用的边端大模型 AI 芯片,能够支持多种大模型,包括但不限于ChatGLM、Llama2、通义千问等。以Qwen1.5-7B-Chat为例,M30的运行性能可达15-20 Tokens/s。
基于M30 芯片的智算模组(SoM)支持PCIe EP模式,以其小巧的体积、强劲的性能和极低的功耗,成为小型化设备和功耗敏感嵌入式场景的理想选择。此外,基于M30 芯片的力谋®️AI加速卡作为标准的半高半长PCIe加速卡,能在 PC、一体机和服务器中实现快速部署,支持主动散热和被动散热两种模式,确保设备在不同环境下的稳定运行。
后摩漫界™️M30 将以“+AI”的方式,为传统的端侧和边缘侧设备注入强大的大模型能力,现已成功适配包括 X86、ARM 在内的多种主流处理器,可广泛应用于 AI PC、边缘AI一体机、智能座舱、商用显示、智能融合网关,NAS(网络附加存储)等领域,为 AI 技术在更多领域的深入应用注入强大动力。