OpenAI“抓虫AI”登顶测试榜能发现漏洞更能一键打补丁

OpenAI 今天放大招了——发布了一款专门面向网络安全领域的 AI 模型 GPT-5.5-Cyber，不仅能发现漏洞，还能一键打补丁。初步基准测试显示，该模型在 CyberGym 测试中得分 85.6%，直接超越 Claude Mythos 5 的 83.8%，帮 OpenAI 重夺榜首。

这款模型脱胎于 OpenAI 的 Daybreak 网络安全计划。自今年 3 月 Codex Security 发布以来，该工具已分析超过 30,000 个代码库中的逾 3 亿个代码提交，识别出 70,000 个被人类审查者标记为已修复的问题，另有超过 50 万份报告被自动标记为已解决。

OpenAI 指出，当前 AI 工具在发现新漏洞方面已经很强，但在漏洞评估、修复和提供安全更新方面仍有短板。GPT-5.5-Cyber 正是为此而生——它不仅能识别漏洞，还能自主创建补丁。

这个 AI 代理可以执行深度代码分析、检查变更、还原攻击路径、生成安全报告，然后准备定制补丁供人工审查。它还支持评估外部来源信息，比如漏洞赏金报告、建议和票务系统，并能将结果集成到现有漏洞管理系统中。

CyberGym 测试（网络安全评测集）：得分 85.6%，高于标准版 GPT-5.5 的 81.8% 和 Claude Mythos 5 的 83.8%
ExploitGym 测试（考验智能体能否将已知漏洞转化为可执行的攻击代码）：得分 39.5%，而 GPT-5.5 仅为 25.95%
SEC-Bench Pro 测试（长链条漏洞挖掘）：得分 69.8%，领先基础版的 63.1%

从数据可以看出，GPT-5.5-Cyber 在漏洞利用和深度挖掘方面的优势尤为明显，ExploitGym 测试得分比标准版 GPT-5.5 高出近 14 个百分点。这意味着 AI 在网络安全领域的应用正在从发现走向修复，真正实现端到端的自动化安全运维。

本文地址：https://www.163264.com/13355

OpenAI“抓虫AI”登顶测试榜 能发现漏洞更能一键打补丁