Anthropic 开源 AI 安全分析框架 Petri,利用 Agent 代理人测试主流模型潜在不对齐风险10 月 14 日消息,Anthropic 于 10 月...河南{前天日期}9187阅读全文