Prime Intellect开源可自我进化智能体环境:让AI「左右互搏」生成逾8000个测试工具
快链头条 2026-05-19 19:21:42
据动察 Beating 监测,Prime Intellect 宣布开源智能体训练环境 general-agent,这是一个可自我进化的完全合成环境。此次发布的核心是将任务生成设定为一场双玩家博弈:由合成器和求解器交替对抗,目前已自动构建出包含 4504 个任务、逾 8000 个独特工具的大型状态数据库。
该框架从简单的种子任务起步,通过条件约束、噪音指令、跨实体耦合等 9 种策略,将任务切分为 t0 到 t4 五个难度阶梯。合成器负责设计带有数据库、交互工具和验证函数的任务,求解器则负责尝试通关。只有通过率落在特定难度区间的任务才会被保留,最难层级会作为下一波进化的种子。
官方实测显示,仅用该环境合成的 4400 余条轨迹对 30B 参数模型进行微调,就在 BFCL 基准测试中将工具调用准确率从 18.9% 提升至 52.3%。
这种机制让模型脱离了对人工标注静态数据集的依赖。通过模型间的直接博弈,系统能够源源不断地自动生成难度可控、带有语义验证的训练语料。
快链头条登载此文本着传递更多信息的缘由,并不代表赞同其观点或证实其描述。
文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
投资有风险,入市须谨慎。本资讯不作为投资理财建议。
7*24小时快讯
Robinhood已上线VVV现货交易
05-19 20:43(5分钟前)
Pump.fun将于5月21日为新发行代币引入USDC交易对
05-19 20:39(10分钟前)
Strive斥资3030万美元增持382枚比特币
05-19 20:32(16分钟前)
香港证监会:慎防冒称可向投资者赔偿基金索偿的诈骗
05-19 20:24(24分钟前)
美股存储板块盘前走弱,闪迪跌超3%
05-19 20:22(26分钟前)
美国至5月2日当周ADP就业人数周度变动4.225万人,前值3.3万人
05-19 20:15(33分钟前)
美国官员:白宫今日国家安全委员会会议因特朗普推迟对伊朗的攻击而被推迟
05-19 20:05(43分钟前)
Tether加快进军韩国步伐,已提交公司名称与Logo商标申请
05-19 19:59(1小时前)
热门资讯
风险提示
根据银保监会等五部门于 2018 年 8月发布《关于防范以「虚拟货币」「区块链」名义进行非法集资的风险提示》的文件, 请广大公众理性看待区块链,不要盲目相信天花乱坠的承诺,树立正确的货币观念和投资理念,切实提高风险意识;对发现的违法犯罪线索,可积极向有关部门举报反映。