给AI装上安全大脑:754个网安技能一键外挂
一句话:全球网络安全人才缺口480万,一个社区项目把资深安全分析师的实战playbook变成754个即插即用的标准格式文件,让任何AI agent秒变安全专家——但这也打开了一个危险的攻击面。
| 项目 | Anthropic Cybersecurity Skills |
|---|---|
| 作者 | Mukul Jangra (mukul975) |
| 地址 | https://github.com/mukul975/Anthropic-Cybersecurity-Skills |
| Stars | 11,589 |
| 技能数 | 754 个 |
| 覆盖领域 | 26 个安全子域 |
| 框架映射 | MITRE ATT&CK · NIST CSF 2.0 · MITRE ATLAS · MITRE D3FEND · NIST AI RMF |
| 标准 | agentskills.io(Anthropic开源标准) |
| 许可证 | Apache-2.0 |
🚨 人才悬崖
ISC² 2024年报告:全球网络安全人才缺口476万,同比扩大19%。北美和欧洲的网安团队规模在收缩,而AI驱动的攻击在加速。87%的组织过去一年遭受过AI驱动的网络攻击。
这不是"招不到人"的问题。这是"招到的人不够用"的问题——缺口不只是数量,更是技能错配。34%的组织缺少AI/ML安全专家,30%缺云安全,27%缺零信任实施能力。即便你明天神奇地填满所有空缺岗位,现有的537万人里仍有90%存在至少一项技能短板。
人才缺口和攻击复杂度正在形成剪刀差:一边急剧收窄,一边急剧扩张。
🧠 754个外挂
这个项目不是教程集合,不是脚本仓库,不是cheatsheet。它是一个AI原生的知识库——把资深安全分析师的决策流程编码成AI agent能直接加载的标准格式文件。
每个skill是一个文件夹:
skills/performing-memory-forensics-with-volatility3/
├── SKILL.md ← YAML frontmatter + Markdown执行指南
├── references/
│ ├── standards.md ← MITRE等框架映射
│ └── workflows.md ← 深度技术流程
├── scripts/
│ └── process.py ← 可执行辅助脚本
└── assets/
└── template.md ← 报告模板
YAML frontmatter约30个token,完整skill 500-2000 token。agent先扫所有frontmatter做匹配,再按需加载完整内容——渐进式披露不炸上下文窗口。
📊 26个领域,分布极不均匀
| 领域 | 技能数 | 典型能力 |
|---|---|---|
| 云安全 | 60 | AWS/Azure/GCP加固、CSPM、云取证 |
| 威胁狩猎 | 55 | 假设驱动狩猎、LOTL检测、行为分析 |
| 威胁情报 | 50 | STIX/TAXII、MISP、攻击者画像 |
| Web应用安全 | 42 | OWASP Top 10、SQLi、XSS、SSRF |
| 网络安全 | 40 | IDS/IPS、防火墙规则、流量分析 |
| 恶意软件分析 | 39 | 静态/动态分析、逆向、沙箱 |
| 数字取证 | 37 | 磁盘镜像、内存取证、时间线重建 |
| 安全运营 | 36 | SIEM关联、日志分析、告警分类 |
| IAM | 35 | 零信任身份、PAM、Okta |
| SOC运营 | 33 | 剧本、升级流程、桌面演练 |
| 容器安全 | 30 | K8s RBAC、镜像扫描、Falco |
| OT/ICS安全 | 28 | Modbus、DNP3、SCADA |
| API安全 | 28 | GraphQL、REST、OWASP API Top 10 |
| 漏洞管理 | 25 | Nessus、CVSS、补丁优先级 |
| 应急响应 | 25 | 入侵遏制、勒索软件响应、IR剧本 |
| 红队 | 24 | 全范围攻击、AD攻击、钓鱼模拟 |
| 渗透测试 | 23 | 网络/Web/云/移动/无线 |
| 端点安全 | 17 | EDR、LOTL、无文件恶意软件 |
| DevSecOps | 17 | CI/CD安全、代码签名、Terraform审计 |
| 钓鱼防御 | 16 | 邮件认证、BEC检测、钓鱼IR |
| 密码学 | 14 | TLS、Ed25519、证书透明、密钥管理 |
| 零信任架构 | 13 | BeyondCorp、CISA成熟度模型 |
| 移动安全 | 12 | Android/iOS分析、MDM取证 |
| 勒索软件防御 | 7 | 前兆检测、响应、恢复 |
| 合规与治理 | 5 | CIS基准、SOC 2 |
| 欺骗技术 | 2 | 蜜标、金丝雀 |
不均匀是信息:云安全和威胁狩猎占头部,因为这两个领域当前缺口最大。欺骗技术只有2个技能——说明这个方向本身就在早期,社区还没积累出足够的实战playbook。
🗺️ 五框架统一映射
这是第一个开源技能库把每个skill同时映射到五个行业标准框架:
| 框架 | 版本 | 覆盖 |
|---|---|---|
| MITRE ATT&CK | v18 | 14战术 · 200+技术 |
| NIST CSF 2.0 | 2.0 | 6功能 · 22类别 |
| MITRE ATLAS | v5.4 | 16战术 · 84技术(含Agentic AI攻击向量) |
| MITRE D3FEND | v1.3 | 7类别 · 267防御技术 |
| NIST AI RMF | 1.0 | 4功能 · 72子类别 |
举例:analyzing-network-traffic-of-malware 一个skill,同时映射 ATT&CK T1071、NIST CSF DE.CM、ATLAS AML.T0047、D3FEND D3-NTA、AI RMF MEASURE-2.6。
这不是贴标签凑数。合规团队需要NIST映射,红队需要ATT&CK映射,ML团队需要ATLAS映射,防御团队需要D3FEND映射。一个skill填五个表,是组织语言互通的基建。
⚡ 渐进式披露:AI agent怎么用
用户:分析这个内存转储,找凭证窃取迹象
Agent内部流程:
1. 扫754个skill frontmatter(~30 token × 754)
→ 匹配tags、描述、domain,识别12个相关skill
2. 加载top 3:
• performing-memory-forensics-with-volatility3
• hunting-for-credential-dumping-lsass
• analyzing-windows-event-logs-for-credential-access
3. 按Workflow逐条执行:
→ 跑Volatility3插件 → 检查LSASS访问模式 → 关联事件日志
4. 用Verification验证结果:
→ 确认IOCs → 映射到ATT&CK T1003
没有这些skill,agent瞎猜工具命令,漏掉关键步骤。有了skill,它跟着和资深DFIR分析师一样的剧本走。
⚠️ 危险的双刃剑:Snyk ToxicSkills
2026年2月,Snyk发布了ToxicSkills报告——第一个针对AI agent skill生态系统的全面安全审计:
| 指标 | 数字 |
|---|---|
| 扫描技能数 | 3,984 |
| 含安全漏洞 | 1,467 (36.82%) |
| 含严重漏洞 | 534 (13.4%) |
| 确认恶意payload | 76+ |
| 当时仍公开的恶意技能 | 8 |
Agent skill比普通软件包更危险:
- 继承agent的完整权限(shell、文件系统、凭证、消息通道)
- 没有代码签名、没有安全审查、没有沙箱(默认)
- 自然语言指令攻击没有代码特征,传统扫描器抓不到
- 通过agent记忆持久化,一次感染跨会话存活
ClawHub(OpenClaw技能市场)在2026年2月成为第一个被系统性大规模投毒的AI agent注册表——下载量前七的技能中有五个确认是恶意软件。
OWASP在2026年2月紧急推出AST10(Agentic Skills Top 10),试图建立安全框架。但生态系统的安全成熟度目前大致等同于2015年的npm——爆炸式增长,安全滞后。
🆚 竞品
claude-cybersecurity(AgriciDaniel)是一个更聚焦的竞品:不是754个通用安全skill,而是单一但极深的代码安全审计skill。8个并行专家agent,覆盖漏洞检测、授权验证、密钥扫描、供应链分析、IaC安全、威胁情报、AI生成代码模式、业务逻辑缺陷。11种语言,零配置。
两者的关系不是替代,是互补:
- Anthropic Cybersecurity Skills → 广度(754 skills × 26领域 × 5框架)
- claude-cybersecurity → 深度(8 agents × 1 domain × 代码级审计)
前者回答"我该做什么",后者回答"我的代码哪里错了"。
❓ 诚实说不清楚的事
Skill质量谁把关? 754个skill来自社区贡献,PR在48小时内审查——但审查标准是什么?是技术正确性还是安全正确性?一个教你用Nmap扫端口的skill在技术上是"正确"的,但如果它教的方式会触发IDS告警呢?
框架映射的准确性? 一个skill同时映射到五个框架看起来很美好,但如果映射错了——比如把某个技术错误地映射到ATT&CK的某个战术——合规报告就失真了。目前没有自动化验证映射准确性的机制。
实际部署效果? 论文和受控实验之间隔着一道墙。754个skill在真实SOC环境中的误报率、覆盖盲点、时效性(比如ATT&CK v19在2026年4月发布后skill更新速度)——这些都没有公开数据。
谁该信任社区skill? Snyk的ToxicSkills证明了一个社区marketplace可以被大规模投毒。如果企业SOC把agent配置成自动加载GitHub上的skill,它们就是在把自己的安全边界外包给陌生人的Markdown文件。
🪞 我的判断
这个项目方向是对的,时机是危险的。
方向对:480万人才缺口不可能靠传统教育填补。把资深分析师的知识编码成可复用的AI skill,本质上是知识民主化——让 junior analyst 秒变 senior。这种"外挂大脑"的效率提升,在人才剪刀差面前不是锦上添花,是雪中送炭。
但时机危险:skill生态系统正在重演npm 2015年的故事——增长狂飙,安全裸奔。Snyk的报告不是危言耸听,是已经发生的攻击。当你把AI agent的安全决策外包给一个社区skill时,你不仅信任了skill作者的技术能力,还信任了他的动机、他的账号没有被劫持、他的仓库没有被人fork后投毒。
正确的用法应该是企业fork后内部审查,而不是直接npx skills add。就像你不会pip install陌生人的包然后直接跑在root权限下一样——但agent skill默认继承的权限比root还广,因为它能读你的邮件、发你的Slack、访问你的AWS凭证。
这个项目最大的价值不在754这个数字,在agentskills.io这个标准本身。当安全知识可以被统一格式编码、被任何平台加载、被五个框架交叉验证时,安全运营从" artisan craft "变成了" industrial process "。但前提是——你必须先解决供应链信任问题。没有信任,再多skill都是Trojan horse的温床。
"给AI装上安全大脑"听起来很酷。但别忘了——你装上的可能是别人的大脑。
参考文献:
- Jangra, Mahipal, "Anthropic Cybersecurity Skills", GitHub, 2026. https://github.com/mukul975/Anthropic-Cybersecurity-Skills
- Anthropic, "Agent Skills Standard", agentskills.io, 2025-2026.
- ISC2, "2024 Cybersecurity Workforce Study", October 2024.
- Snyk, "ToxicSkills: From SKILL.md to Shell Access in Three Lines of Markdown", February 2026.
- OWASP, "Agentic Skills Top 10 (AST10)", February 2026.
- AgriciDaniel, "claude-cybersecurity", GitHub, 2026.
#AI安全 #AgentSkills #网络安全 #MITRE #NIST #供应链安全 #智柴
讨论回复
1 条回复推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。