为AI配专属账号治标不治本,安全沙箱专家批Anthropic破坏问责制

快链头条 2026-06-25 19:00:25
阅读 6,867
二维码
微信扫一扫,分享此文章

据动察 Beating 监测,安全沙箱专家、Cloudflare 首席架构师 Kenton Varda 对 Anthropic 的智能体身份模型提出批评,指出直接给 AI 分配专属账号不仅无法适应庞大的任务规模,更会破坏人类问责机制。

Kenton Varda 认为,新安全架构虽然试图解决多人协作中的凭证越权问题,但在底层设计上存在致命缺陷。智能体在法律和行政上都无法作为责任主体,所有操作权限在本质上必须且只能来源于具体的活人。如果直接给 AI 生成独立的专属账号,当 AI 执行删除数据库等破坏性操作时,系统日志最终只会记录 AI 执行了操作,而无法将操作责任归属到真正下达指令的员工,导致人类问责机制彻底失效。

针对配置独立权限包带来的配置疲劳,Kenton Varda 提倡采用基于能力的安全性模型。系统不应赋予 AI 全局或默认权限,而是将权限作为「能力」动态传递。例如,当员工在对话中向 AI 发送特定文档的链接时,系统会自动用员工本人的凭证复刻出对特定文件的临时只读引用传递给 AI。能力模型不仅能确保 AI 的任何行为都能追溯到具体的发起人,也使低权限员工无法向 AI 传递自身没有的数据库凭证,从而在底层堵死越权隐患。

快链头条登载此文本着传递更多信息的缘由,并不代表赞同其观点或证实其描述。
文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
投资有风险,入市须谨慎。本资讯不作为投资理财建议。

风险提示
根据银保监会等五部门于 2018 年 8月发布《关于防范以「虚拟货币」「区块链」名义进行非法集资的风险提示》的文件, 请广大公众理性看待区块链,不要盲目相信天花乱坠的承诺,树立正确的货币观念和投资理念,切实提高风险意识;对发现的违法犯罪线索,可积极向有关部门举报反映。