后摩智能携全新端边大模型 AI 芯片后摩漫界®M50 全矩阵新品亮相
2025年7月26日,2025年世界人工智能大会(WAIC 2025)在上海世博展览馆开幕,大会以 “智能时代 同球共济” 为主题,汇聚全球人工智能领域的顶尖企业、专家学者与行业精英。作为端边大模型 AI 芯片的领跑者,后摩智能携全新发布的端边大模型 AI 芯片后摩漫界®M50 (以下简称M50 )系列产品、后摩漫界®M30 (以下简称M30 )系列产品及端边大模型应用方案亮相,全面呈现存算一体技术在端边场景的落地成效。
后摩漫界®M50 首次亮相 存算技术让算力配得上智能的野心
作为专为大模型推理设计的新一代高能效端边 AI 芯片,M50 依托创新存算一体架构实现性能突破,单芯片算力达 160 TOPS,支持多精度运算,搭配最大 48GB 内存与 153.6 GB/s 带宽,为百亿级参数模型本地运行提供硬件支撑,让云级推理能力下沉至终端。同时,M50 采用多芯互联技术可动态扩展算力,超小尺寸适配紧凑型设备集成,本地计算模式从物理层保障数据隐私、杜绝云端延迟,目前已实现 7B/8B 大模型 25+tokens/s 的推理速度,成功将大模型能力融入 PAD / PC、智能语音设备、机器人等端边智能场景,推动端边设备从 “功能型” 向 “智能体” 升级。
M50 系列硬件作为芯片的场景化延伸,形成多元形态的产品矩阵,精准匹配端边场景的多样化需求。力擎™️LQ50 M.2 卡与 LQ50 Duo M.2 卡以紧凑设计实现 “即插即用”,适配 AI PC、AI Stick 等空间受限的智能终端,为消费、办公、工业场景提供本地大模型推理支持,兼顾数据隐私与低延迟;力谋®LM5050 加速卡集成双 M50 芯片,打造高密度单机推理方案,兼容多平台与主流系统,依托后摩大道® 软件平台快速部署,助力 AI 工作站、大模型一体机等轻量级推理业务落地;力谋®LM5070 加速卡则集成 4 颗 M50 芯片,凭借 640TOPS 弹性算力与多卡互联能力,在有限空间构建超强算力池,赋能大模型推理及高并发业务;力谋® BX50 计算盒子面向边缘智能设备,以单颗 M50 芯片的紧凑机身实现端侧大模型推理与多模态处理,工业级设计适配智慧工业质检、车路云协同等场景,提供低功耗且隐私保护的本地化方案。
M30 系列持续落地 让AI设备融得进每一个场景
M30 系列通过技术验证与场景落地,为端边大模型的普及应用奠定了坚实基础,与 M50 系列形成技术迭代与场景互补,共同构建起覆盖全场景的端边大模型硬件体系。M30 芯片及系列产品,作为端边大模型应用的成熟解决方案,能够支持多种大模型,包括但不限于ChatGLM、Llama2、通义千问、DeepSeek等。其系列产品包括力谋®LM30 加速卡、力谋®SM30 计算模组、力谋®BX30 计算盒子等,覆盖从一体机到工业终端的多元场景。
从 AI PC 到智能办公 大模型本地运行让智能对得住每一份信任
以存算一体深耕创新 解锁端边大模型应用新可能
随着人工智能大模型向端边侧深度渗透,传统芯片架构在算力供给、能效平衡与内存带宽上的局限性愈发明显,以存算一体技术为核心的创新路径成为突破端边智能瓶颈的关键。作为端边大模型 AI 芯片的领跑者,后摩智能在本次 WAIC 2025 上首次亮相的M50 芯片及系列产品,与 M30 系列形成技术迭代与场景互补的完整矩阵,以全场景覆盖能力为PAD、PC、智能语音设备、机器人等多种智能移动终端,以及一体机、计算盒子等边缘智能设备提供从 “功能型” 到 “智能体” 的升级引擎。未来,后摩智能将持续深耕存算一体技术,推动算力能效比与场景适配性的再突破,让大模型能力真正融入千行百业的终端及边缘端设备。
端边大模型应用体验