微博开源VibeThinker-3B，3B小模型冲进前沿推理梯队 - 快链头条_区块链世界的入口_行情资讯_技术解读_独家深度

微博开源VibeThinker-3B，3B小模型冲进前沿推理梯队

快链头条 2026-06-18 23:07:13

阅读 8,056

据动察 Beating 监测，新浪微博团队日前开源了 30 亿参数的推理模型 VibeThinker-3B。

模型在数学与编程等任务上达到前沿水平，部分指标接近或超越 DeepSeek V3.2、GLM-5 和 Gemini 3 Pro 等大规模旗舰模型。

VibeThinker-3B 基于 Qwen2.5-Coder-3B 改造，采用 Spectrum-to-Signal 流程进行二次训练：模型先从易到难做题积累解题谱系，再通过强化学习放大正确解法信号，训练全程使用 64K 大思考空间防止中断推理步骤。

针对数学与编程，模型一方面将自己做对的优秀步骤收集起来进行自蒸馏模仿，另一方面在答题时引入步骤级评估来进行自我核对。自我核对机制最终将 AIME26 数学测试得分从 94.3 提升至 97.1。

研发团队在报告中提出「参数压缩-覆盖假设」，认为逻辑推理属于高度可压缩的能力，主要依赖规则和纠错，用 3B 小模型就能跑出顶尖效果；而开放领域知识则需要海量参数去死记硬背。受限于参数规模，VibeThinker-3B 对常识性开放知识的覆盖能力仍弱于大模型。

团队强调，研发目的并非用小模型替代大模型，而是探索紧凑型模型在明确验证机制下的能力边界。

生成图片

快链头条登载此文本着传递更多信息的缘由，并不代表赞同其观点或证实其描述。
文章内容仅供参考，不构成投资建议。投资者据此操作，风险自担。
投资有风险，入市须谨慎。本资讯不作为投资理财建议。

推荐活动

【Amplify2026—Quantifying&Growth In Web 4.0】

2026-04-21 14:00

香港 Web3 嘉年华 2026

2026-04-20 18:34

【Amplify2026—VENTURE HORIZON】

2026-04-20 14:00

7*24小时快讯

美元兑日元日内涨幅扩大至 0.5%，现报 161.44

06-19 00:57(15分钟前)

特朗普否认美国向伊朗支付3000亿美元

06-19 00:52(20分钟前)

分析：以太坊跌破通道下轨，下个支撑位在 1580 美元

06-19 00:39(32分钟前)

分析：以太坊跌破通道下轨，下个支撑位在1580美元

06-19 00:39(33分钟前)

数据：过去 24 小时全网爆仓 5.78 亿美元，多单爆仓 4.96 亿美元，空单爆仓 8,241.5 万美元

06-19 00:30(42分钟前)

SpaceX投行团队正筹备至少200亿美元的债券发行

06-19 00:27(44分钟前)

特朗普政府将允许伊朗动用存放在卡塔尔的60亿美元石油收入

06-19 00:16(1小时前)

加密市场加速回落，近1小时全网爆仓1.8亿美元

06-19 00:03(1小时前)

热门资讯

从颠覆者到影子市场：加密市场正在成为传统金融的殖民地

2026-06-18 11:57:50

慈善之名，家族之利：特朗普家族如何把慈善变收益？

2026-06-18 11:57:43

币安客服风波背后的隐忧

2026-06-17 09:50:52

Galaxy 深度研究：比特币四年周期还有效吗？

2026-06-16 18:27:55

风险提示

根据银保监会等五部门于 2018 年 8月发布《关于防范以「虚拟货币」「区块链」名义进行非法集资的风险提示》的文件，请广大公众理性看待区块链，不要盲目相信天花乱坠的承诺，树立正确的货币观念和投资理念，切实提高风险意识；对发现的违法犯罪线索，可积极向有关部门举报反映。