微博开源VibeThinker-3B,3B小模型冲进前沿推理梯队
快链头条 2026-06-18 23:07:13
据动察 Beating 监测,新浪微博团队日前开源了 30 亿参数的推理模型 VibeThinker-3B。
模型在数学与编程等任务上达到前沿水平,部分指标接近或超越 DeepSeek V3.2、GLM-5 和 Gemini 3 Pro 等大规模旗舰模型。
VibeThinker-3B 基于 Qwen2.5-Coder-3B 改造,采用 Spectrum-to-Signal 流程进行二次训练:模型先从易到难做题积累解题谱系,再通过强化学习放大正确解法信号,训练全程使用 64K 大思考空间防止中断推理步骤。
针对数学与编程,模型一方面将自己做对的优秀步骤收集起来进行自蒸馏模仿,另一方面在答题时引入步骤级评估来进行自我核对。自我核对机制最终将 AIME26 数学测试得分从 94.3 提升至 97.1。
研发团队在报告中提出「参数压缩-覆盖假设」,认为逻辑推理属于高度可压缩的能力,主要依赖规则和纠错,用 3B 小模型就能跑出顶尖效果;而开放领域知识则需要海量参数去死记硬背。受限于参数规模,VibeThinker-3B 对常识性开放知识的覆盖能力仍弱于大模型。
团队强调,研发目的并非用小模型替代大模型,而是探索紧凑型模型在明确验证机制下的能力边界。
快链头条登载此文本着传递更多信息的缘由,并不代表赞同其观点或证实其描述。
文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
投资有风险,入市须谨慎。本资讯不作为投资理财建议。
7*24小时快讯
美元兑日元日内涨幅扩大至 0.5%,现报 161.44
06-19 00:57(15分钟前)
特朗普否认美国向伊朗支付3000亿美元
06-19 00:52(20分钟前)
分析:以太坊跌破通道下轨,下个支撑位在 1580 美元
06-19 00:39(32分钟前)
分析:以太坊跌破通道下轨,下个支撑位在1580美元
06-19 00:39(33分钟前)
数据:过去 24 小时全网爆仓 5.78 亿美元,多单爆仓 4.96 亿美元,空单爆仓 8,241.5 万美元
06-19 00:30(42分钟前)
SpaceX投行团队正筹备至少200亿美元的债券发行
06-19 00:27(44分钟前)
特朗普政府将允许伊朗动用存放在卡塔尔的60亿美元石油收入
06-19 00:16(1小时前)
加密市场加速回落,近1小时全网爆仓1.8亿美元
06-19 00:03(1小时前)
热门资讯
风险提示
根据银保监会等五部门于 2018 年 8月发布《关于防范以「虚拟货币」「区块链」名义进行非法集资的风险提示》的文件, 请广大公众理性看待区块链,不要盲目相信天花乱坠的承诺,树立正确的货币观念和投资理念,切实提高风险意识;对发现的违法犯罪线索,可积极向有关部门举报反映。