美团开源首个从训练到推理都用国产芯片的万亿大模型LongCat-2.0
快链头条 2026-06-30 14:07:07
据动察 Beating 监测,美团开源超大规模混合专家(MoE)模型 LongCat-2.0。模型拥有 1.6 万亿总参数,单 token 激活参数约 480 亿,支持 1M 超长上下文。
这是业界首个依靠国产算力完成训练、推理全流程的万亿参数大模型。它在超过 5 万张国产 AI 芯片集群上完成了 35 万亿 token 的预训练,成功验证了国产算力承载前沿大模型的工程稳定性。
LongCat-2.0 的核心更新集中在长上下文和推理效率。LongCat Sparse Attention(LSA)针对稀疏注意力索引带来的显存读取和计算开销,引入流感知索引、跨层索引和分层索引,让长文本推理时的索引读取更连续,也能在相邻层之间复用部分索引结果。
模型还集成 1350 亿参数的 5-gram 嵌入模块,通过建模相邻 token 组合来扩展嵌入空间,增强局部上下文表达。相比只依赖 MoE 专家路由,这类前置嵌入可以在大 batch 推理中减少部分显存读写压力。
在 SWE-bench Pro 等主流 Agent 和代码评测中,LongCat-2.0 表现逼近甚至超越部分主流闭源模型。
快链头条登载此文本着传递更多信息的缘由,并不代表赞同其观点或证实其描述。
文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
投资有风险,入市须谨慎。本资讯不作为投资理财建议。
7*24小时快讯
Binance Japan任命新总经理
06-30 15:40(6分钟前)
Binance Alpha将于今日18时发放空投,积分门槛224
06-30 15:33(13分钟前)
Binance将下架BIGTIME/USDC等不活跃现货交易对
06-30 15:31(16分钟前)
Broadcom联创减持价值2.5亿美元公司股票
06-30 15:28(18分钟前)
数据:西班牙上市公司 Vanadi Coffee 增持 10 枚 BTC,总持仓达 223 枚
06-30 15:26(20分钟前)
温施:预计通胀将在几个季度内高于目标
06-30 15:21(25分钟前)
今年以来ETF已流出10万枚比特币,外流速度为历年之最
06-30 15:21(26分钟前)
以太坊基金会向 Lido 质押 4938 枚 ETH,约合 786 万美元
06-30 15:13(33分钟前)
热门资讯
风险提示
根据银保监会等五部门于 2018 年 8月发布《关于防范以「虚拟货币」「区块链」名义进行非法集资的风险提示》的文件, 请广大公众理性看待区块链,不要盲目相信天花乱坠的承诺,树立正确的货币观念和投资理念,切实提高风险意识;对发现的违法犯罪线索,可积极向有关部门举报反映。