纯代码硬刚神经网络！大模型手写控制规则杀入硬核工业，14美元跑通全套策略

星期一

05 / 19

星期一 2026-05-19 19:09

据动察 Beating 监测，OpenAI 后训练核心成员翁家翌刚证明了「纯靠大模型写代码能通关 Atari 游戏」，研究人员 Paul Garnier 就把这套方法搬进了更硬核的流体力学控制。

他全程没训练任何神经网络。单纯让 Codex 5.5 充当程序员，盯着流体仿真录像反复改写 Python 脚本。就靠这套手写的控制规则，AI 在十多项物理测试中，硬是在超半数的场景里把顶级的强化学习（DRL）基线挑落马下。

给汽车减阻、安抚管道湍流，工业界以前只能靠砸算力，硬喂出一个看不懂的黑盒模型去控制气流阀门。Codex 避开了这条死胡同。它写出来的规则极其直白，例如「当局部曲率过大时，延迟喷气」。几十行带着物理常识的短代码，直接替代了神经网络无脑的暴力试错。

把黑盒换成代码，干掉了神经网络僵化、一碰就碎的死穴。以前只要硬件稍微改动（比如控制喷嘴从 5 个换成 10 个），旧模型当场报废，必须重新烧钱训练。现在只要在代码里改个常数，系统瞬间就能对接新设备。

当测试时间被强行拉长四倍时，走出经验区的传统 DRL 模型全盘崩溃；但大模型写的代码由于直接遵循了物理逻辑，始终运转稳定。跑通这一整套控制策略，大模型只消耗了 2125 万 Token，总花费不到 14 美元。