纯代码硬刚神经网络!大模型手写控制规则杀入硬核工业,14美元跑通全套策略
快链头条 2026-05-19 19:09:15
据动察 Beating 监测,OpenAI 后训练核心成员翁家翌刚证明了「纯靠大模型写代码能通关 Atari 游戏」,研究人员 Paul Garnier 就把这套方法搬进了更硬核的流体力学控制。
他全程没训练任何神经网络。单纯让 Codex 5.5 充当程序员,盯着流体仿真录像反复改写 Python 脚本。就靠这套手写的控制规则,AI 在十多项物理测试中,硬是在超半数的场景里把顶级的强化学习(DRL)基线挑落马下。
给汽车减阻、安抚管道湍流,工业界以前只能靠砸算力,硬喂出一个看不懂的黑盒模型去控制气流阀门。Codex 避开了这条死胡同。它写出来的规则极其直白,例如「当局部曲率过大时,延迟喷气」。几十行带着物理常识的短代码,直接替代了神经网络无脑的暴力试错。
把黑盒换成代码,干掉了神经网络僵化、一碰就碎的死穴。以前只要硬件稍微改动(比如控制喷嘴从 5 个换成 10 个),旧模型当场报废,必须重新烧钱训练。现在只要在代码里改个常数,系统瞬间就能对接新设备。
当测试时间被强行拉长四倍时,走出经验区的传统 DRL 模型全盘崩溃;但大模型写的代码由于直接遵循了物理逻辑,始终运转稳定。跑通这一整套控制策略,大模型只消耗了 2125 万 Token,总花费不到 14 美元。
快链头条登载此文本着传递更多信息的缘由,并不代表赞同其观点或证实其描述。
文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
投资有风险,入市须谨慎。本资讯不作为投资理财建议。
7*24小时快讯
香港证监会:慎防冒称可向投资者赔偿基金索偿的诈骗
05-19 20:24(5分钟前)
美股存储板块盘前走弱,闪迪跌超3%
05-19 20:22(7分钟前)
美国至5月2日当周ADP就业人数周度变动4.225万人,前值3.3万人
05-19 20:15(14分钟前)
美国官员:白宫今日国家安全委员会会议因特朗普推迟对伊朗的攻击而被推迟
05-19 20:05(25分钟前)
Tether加快进军韩国步伐,已提交公司名称与Logo商标申请
05-19 19:59(31分钟前)
Hut 8承诺投资1600万美元扩建供水系统以配合AI数据中心开发
05-19 19:52(37分钟前)
DeepSeek辟谣「<think>泄露隐私」:实为模型幻觉
05-19 19:42(1小时前)
世界首富马斯克教你如何管理时间
05-19 19:41(1小时前)
热门资讯
风险提示
根据银保监会等五部门于 2018 年 8月发布《关于防范以「虚拟货币」「区块链」名义进行非法集资的风险提示》的文件, 请广大公众理性看待区块链,不要盲目相信天花乱坠的承诺,树立正确的货币观念和投资理念,切实提高风险意识;对发现的违法犯罪线索,可积极向有关部门举报反映。