OpenAI“抓虫AI”登顶测试榜 能发现漏洞更能一键打补丁

OpenAI“抓虫AI”登顶测试榜 能发现漏洞更能一键打补丁

OpenAI 今天放大招了——发布了一款专门面向网络安全领域的 AI 模型 GPT-5.5-Cyber,不仅能发现漏洞,还能一键打补丁。初步基准测试显示,该模型在 CyberGym 测试中得分 85.6%,直接超越 Claude Mythos 5 的 83.8%,帮 OpenAI 重夺榜首。

这款模型脱胎于 OpenAI 的 Daybreak 网络安全计划。自今年 3 月 Codex Security 发布以来,该工具已分析超过 30,000 个代码库中的逾 3 亿个代码提交,识别出 70,000 个被人类审查者标记为已修复的问题,另有超过 50 万份报告被自动标记为已解决。

OpenAI 指出,当前 AI 工具在发现新漏洞方面已经很强,但在漏洞评估、修复和提供安全更新方面仍有短板。GPT-5.5-Cyber 正是为此而生——它不仅能识别漏洞,还能自主创建补丁。

这个 AI 代理可以执行深度代码分析、检查变更、还原攻击路径、生成安全报告,然后准备定制补丁供人工审查。它还支持评估外部来源信息,比如漏洞赏金报告、建议和票务系统,并能将结果集成到现有漏洞管理系统中。

测试成绩一览

  • CyberGym 测试(网络安全评测集):得分 85.6%,高于标准版 GPT-5.5 的 81.8% 和 Claude Mythos 5 的 83.8%
  • ExploitGym 测试(考验智能体能否将已知漏洞转化为可执行的攻击代码):得分 39.5%,而 GPT-5.5 仅为 25.95%
  • SEC-Bench Pro 测试(长链条漏洞挖掘):得分 69.8%,领先基础版的 63.1%

从数据可以看出,GPT-5.5-Cyber 在漏洞利用和深度挖掘方面的优势尤为明显,ExploitGym 测试得分比标准版 GPT-5.5 高出近 14 个百分点。这意味着 AI 在网络安全领域的应用正在从发现走向修复,真正实现端到端的自动化安全运维。

本文地址:https://www.163264.com/13355

(0)
AI日报:豆包音频生成模型1.0发布;企业微信内测AI Agent大圆;Cursor发布全自主训练大模型 16
上一篇 1天前
OpenAI首款自研芯片Jalapeño亮相:从设计到流片仅9个月
下一篇 1天前

相关推荐