Anthropic 和 ML Alignment & Theory Scholars (MATS) 项目的一份新报告在 AI 安全和区块链安全社区引起了巨大震动,该报告揭示,现代 AI 代理现在能够自主发现和利用现实世界智能合约的漏洞,并达到具有经济意义的规模。
这 学习 该研究评估了 Anthropic 的 Claude 4.5 系列和 OpenAI 的 GPT-5 在 3200 多个合同中的能力,提供了迄今为止最清晰的证据,表明盈利的自主网络攻击不再是理论上的——如今在技术上是可行的。
至关重要的是,这些实验完全在沙盒区块链模拟器中进行,没有在实时网络上执行任何攻击,但其经济影响是真实的:这些模型总共产生了价值 460 万美元的过去攻击收益,并发现了最近部署的合约中的两个新的零日攻击。
这些发现标志着首次尝试用直接的经济术语而非抽象的“成功率”来量化人工智能网络能力——Anthropic 认为,这种转变对于政策制定者、工程师和行业领导者了解新兴人工智能驱动威胁的真实规模至关重要。
AI代理复制了价值460万美元的真实世界漏洞利用
报告的核心是 SCONE-bench,这是 Anthropic 新开发的 405 基准。 智能合约 实际上,这些都被利用了 以太坊 ,BNB 链 和 Base 将于 2020 年至 2025 年间推出。
通过引导模型识别漏洞并自主生成漏洞利用脚本,研究人员可以直接计算出人工智能攻击者可能窃取了多少钱。
为避免数据污染,核心评估采用了最新人工智能模型知识截止日(2025年3月)之后使用的34份合约子集。在这34份合约中:
- Opus 4.5、Sonnet 4.5 和 GPT-5 成功利用了 34 个合约中的 19 个(55.8%)。
- 这些成功的攻击本可骗取高达 460 万美元的模拟赃款。
- 表现最佳的克劳德·奥普斯4.5号(Claude Opus 4.5)一人就贡献了450万美元的收入。
这代表着能力的惊人提升。仅仅一年前,前沿模型只能复现2025年左右类似攻击的2%;而现在,它们已经能够自主执行其中一半以上的攻击。
而且这种趋势还在加速。据 Anthropic 称,过去一年中,前沿模型的漏洞利用收益能力每 1.3 个月就翻一番——这是人工智能安全分析领域有史以来记录到的最快增长曲线之一。
各模型窃取的测试资金量(来源:Anthropic)
AI代理发现了两个全新的零日漏洞
为了超越回顾性测试,Anthropic 使用 2,849 个新部署的数据集对 Sonnet 4.5 和 GPT-5 进行了评估。 BNB Chain 与以下公司签订合同:
- 已验证源代码
- 近期交易活动
- 至少有1000美元的流动资金
- 没有已知漏洞
两个代理独立发现了两个新的零日漏洞,产生了 3,694 美元的模拟收入,其中 GPT-5 的 API 成本为 3,476 美元——这几乎是收支平衡的演示,但却是一个强有力的概念验证。
这些漏洞包括:
1. 计算器函数配置错误,导致代币无限膨胀
开发者忘记将一个公共辅助函数标记为视图函数,导致其拥有了意外的写入权限。人工智能代理反复调用该函数,在去中心化交易所(DEX)出售代币前,不断增加其代币余额。
模拟收益:约 2,500 美元(流动性高峰时可达 19,000 美元)
2. 手续费提现系统中缺少验证检查
当创建者没有设置受益人地址时,代币发行合约未能强制执行或默认受益人地址,导致任何人都可以重定向费用。
四天后,现实世界中的攻击者利用了这个漏洞。 耗资约 1000 美元。
Anthropic 曾尝试协调披露漏洞——其中一个漏洞被白帽黑客发现,另一个漏洞在联系到开发者之前就被利用了。
经济形势正向攻击者倾斜
报告中最令人警醒的发现之一是基于人工智能的攻击成本呈下降趋势。使用 GPT-5 对所有 2849 个合同进行一次扫描的成本为 3476 美元,即每个扫描合同仅需 1.22 美元。
更重要的是:
- 每次成功利用漏洞的平均成本为 1,738 美元。
- 每次漏洞利用的平均收益为 1,847 美元。
- 即使使用如今成本高昂的前沿模型,平均净利润也已达到 109 美元,为正值。
随着模型效率的提高,Anthropic 预计这些成本将进一步下降。在四个 Claude 世代中,成功利用漏洞所需的代币使用量在六个月内下降了 70.2%。
实际上,这意味着:
- 攻击成本降低
- 攻击速度加快
- 可发现漏洞的比例增加
- 修补漏洞的窗口期正在缩小。
Anthropic 警告说,攻击者(尤其是以经济利益为目的的组织)将使用启发式方法预先筛选合同,从而将成本降低一个数量级,并加快攻击时间线。
威胁远不止于加密货币领域。
虽然智能合约提供了一个独特的可衡量环境,但 Anthropic 强调,用于利用区块链应用程序的相同技能也适用于整个软件生态系统:
- 长远推理
- 代码理解与综合
- 边界条件分析
- 迭代工具的使用
- 逆向工程
报告指出,如果人工智能代理能够自主利用数千份合同中的新漏洞,那么这些代理最终可能会进行以下探测:
- 旧版身份验证库
- 晦涩的云服务
- 未维护的微服务
- 企业内部 API
- 开源基础设施
呼吁采取主动防御措施:人工智能也必须用于保护。
尽管调查结果令人担忧,但安特罗皮克强调,这些系统可以而且必须用于防御。
SCONE-bench 支持将 AI 漏洞利用代理集成到安全审计中,以便开发人员在部署前对合约进行压力测试。该团队明确希望这项研究能够加速 AI 在区块链生态系统及其他领域应用于国防领域的普及。
报告总结道:“现在是时候将人工智能应用于国防领域了。我们的研究结果应该能够更新防御人员对风险的认知模型,使其与现实相符。”
由于漏洞利用能力每隔几周就会翻一番,而每一代的成本都会大幅下降,业界准备的时间可能比预期的要少得多。
微信里点“发现”,扫一下二维码便可将本篇文章分享至朋友圈
主题测试文章,只做测试使用。发布者:币安赵长鹏,转转请注明出处:https://www.binancememe.com/291284.html