跳转到内容

威胁模型 (MITRE ATLAS)

版本: 1.0-draft 最后更新: 2026-02-04 方法论: MITRE ATLAS + 数据流图 框架: MITRE ATLAS (Adversarial Threat Landscape for AI Systems)

此威胁模型基于 MITRE ATLAS 构建,它是用于记录 AI/ML 系统对抗性威胁的行业标准框架。ATLAS 由 MITRE 与 AI 安全社区协作维护。

关键 ATLAS 资源:

这是由 OpenClaw 社区维护的动态文档。请参阅 CONTRIBUTING-THREAT-MODEL.md 了解贡献指南:

  • 报告新威胁
  • 更新现有威胁
  • 提议攻击链
  • 建议缓解措施

本威胁模型记录了针对 OpenClaw AI 代理平台和 ClawHub 技能市场的对抗性威胁,使用了专为 AI/ML 系统设计的 MITRE ATLAS 框架。

组件是否包含备注
OpenClaw 代理运行时核心代理执行、工具调用、会话
Gateway(网关)身份验证、路由、渠道集成
渠道集成WhatsApp、Telegram、Discord、Signal、Slack 等
ClawHub 市场技能发布、审核、分发
MCP 服务器外部工具提供商
用户设备部分移动应用、桌面客户端

本威胁模型未明确排除任何内容。


┌─────────────────────────────────────────────────────────────────┐
│ UNTRUSTED ZONE │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │
│ │ WhatsApp │ │ Telegram │ │ Discord │ ... │
│ └──────┬──────┘ └──────┬──────┘ └──────┬──────┘ │
│ │ │ │ │
└─────────┼────────────────┼────────────────┼──────────────────────┘
│ │ │
▼ ▼ ▼
┌─────────────────────────────────────────────────────────────────┐
│ TRUST BOUNDARY 1: Channel Access │
│ ┌──────────────────────────────────────────────────────────┐ │
│ │ GATEWAY │ │
│ │ • Device Pairing (1h DM / 5m node grace period) │ │
│ │ • AllowFrom / AllowList validation │ │
│ │ • Token/Password/Tailscale auth │ │
│ └──────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────────────────────┐
│ TRUST BOUNDARY 2: Session Isolation │
│ ┌──────────────────────────────────────────────────────────┐ │
│ │ AGENT SESSIONS │ │
│ │ • Session key = agent:channel:peer │ │
│ │ • Tool policies per agent │ │
│ │ • Transcript logging │ │
│ └──────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────────────────────┐
│ TRUST BOUNDARY 3: Tool Execution │
│ ┌──────────────────────────────────────────────────────────┐ │
│ │ EXECUTION SANDBOX │ │
│ │ • Docker sandbox OR Host (exec-approvals) │ │
│ │ • Node remote execution │ │
│ │ • SSRF protection (DNS pinning + IP blocking) │ │
│ └──────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────────────────────┐
│ TRUST BOUNDARY 4: External Content │
│ ┌──────────────────────────────────────────────────────────┐ │
│ │ FETCHED URLs / EMAILS / WEBHOOKS │ │
│ │ • External content wrapping (XML tags) │ │
│ │ • Security notice injection │ │
│ └──────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────────────────────┐
│ TRUST BOUNDARY 5: Supply Chain │
│ ┌──────────────────────────────────────────────────────────┐ │
│ │ CLAWHUB │ │
│ │ • Skill publishing (semver, SKILL.md required) │ │
│ │ • Pattern-based moderation flags │ │
│ │ • VirusTotal scanning (coming soon) │ │
│ │ • GitHub account age verification │ │
│ └──────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────┘
目标数据保护
F1渠道Gateway(网关)用户消息TLS,AllowFrom
F2Gateway(网关)Agent路由消息会话隔离
F3Agent工具工具调用策略执行
F4Agent外部web_fetch 请求SSRF 阻断
F5ClawHubAgent技能代码审核、扫描
F6Agent渠道响应输出过滤

属性
ATLAS IDAML.T0006 - 主动扫描
描述攻击者扫描暴露的 OpenClaw 网关端点
攻击向量网络扫描、shodan 查询、DNS 枚举
受影响的组件Gateway(网关),暴露的 API 端点
当前缓解措施Tailscale 身份验证选项,默认绑定到回环地址
剩余风险中等 - 公共网关可被发现
建议记录安全部署,在发现端点上添加速率限制
属性
ATLAS IDAML.T0006 - 主动扫描
描述攻击者探测消息渠道以识别 AI 管理的账户
攻击向量发送测试消息,观察响应模式
受影响的组件所有渠道集成
当前缓解措施无特定措施
剩余风险低 - 单纯发现的收益有限
建议考虑随机化响应时间

属性
ATLAS IDAML.T0040 - AI 模型推理 API 访问
描述攻击者在配对宽限期内拦截配对码(私信渠道配对为 1 小时,节点配对为 5 分钟)
攻击向量肩窥、网络嗅探、社会工程学
受影响的组件设备配对系统
当前缓解措施1 小时过期(私信配对)/ 5 分钟过期(节点配对),通过现有渠道发送代码
剩余风险中等 - 宽限期可被利用
建议缩短宽限期,添加确认步骤
属性
ATLAS IDAML.T0040 - AI Model Inference API Access
描述攻击者在渠道中伪造允许的发送者身份
攻击向量取决于渠道 - 电话号码欺骗、用户名冒充
受影响的组件针对每个渠道的 AllowFrom 验证
当前的缓解措施特定于渠道的身份验证
剩余风险中等 - 部分渠道易受欺骗攻击
建议记录特定于渠道的风险,尽可能添加加密验证
属性
ATLAS IDAML.T0040 - AI Model Inference API Access
描述攻击者从配置文件中窃取身份验证令牌
攻击向量恶意软件、未经授权的设备访问、配置备份泄露
受影响的组件~/.openclaw/credentials/, 配置存储
当前的缓解措施文件权限
剩余风险高 - 令牌以明文形式存储
建议实施静态令牌加密,添加令牌轮换

属性
ATLAS IDAML.T0051.000 - LLM Prompt Injection: Direct
描述攻击者发送精心设计的提示词以操纵代理行为
攻击向量包含对抗性指令的渠道消息
受影响的组件Agent LLM,所有输入面
当前的缓解措施模式检测,外部内容包装
剩余风险严重 - 仅检测,不阻止;复杂的攻击可绕过
建议实施多层防御、输出验证,对敏感操作进行用户确认
属性
ATLAS IDAML.T0051.001 - LLM Prompt Injection: Indirect
描述攻击者在获取的内容中嵌入恶意指令
攻击向量恶意 URL、受感染的电子邮件、受损的 Webhook
受影响的组件web_fetch、电子邮件摄取、外部数据源
当前的缓解措施使用 XML 标签和安全通知包装内容
剩余风险高 - LLM 可能会忽略包装器指令
建议实施内容清理,隔离执行上下文
属性
ATLAS IDAML.T0051.000 - LLM 提示注入:直接
描述攻击者通过提示注入操作工具参数
攻击向量精心制作的提示词,用于影响工具参数值
受影响组件所有工具调用
当前缓解措施针对危险命令的执行批准
剩余风险高 - 依赖于用户判断
建议实施参数验证,使用参数化工具调用
属性
ATLAS IDAML.T0043 - 编制对抗性数据
描述攻击者编制绕过批准允许列表的命令
攻击向量命令混淆、别名利用、路径操作
受影响组件exec-approvals.ts, 命令允许列表
当前缓解措施允许列表 + 询问模式
剩余风险高 - 无命令清理
建议实施命令规范化,扩展阻止列表

属性
ATLAS IDAML.T0010.001 - 供应链入侵:AI 软件
描述攻击者向 ClawHub 发布恶意技能
攻击向量创建账户,发布包含隐藏恶意代码的技能
受影响组件ClawHub, 技能加载, 代理执行
当前缓解措施GitHub 账户年龄验证,基于模式的审核标记
剩余风险严重 - 无沙箱隔离,审查有限
建议VirusTotal 集成(进行中),技能沙箱隔离,社区审查
属性
ATLAS IDAML.T0010.001 - 供应链入侵:AI 软件
描述攻击者入侵热门技能并推送恶意更新
攻击向量账户入侵,对技能所有者进行社会工程学攻击
受影响组件ClawHub 版本控制、自动更新流程
当前缓解措施版本指纹识别
剩余风险高 - 自动更新可能会拉取恶意版本
建议实施更新签名、回滚能力、版本固定
属性
ATLAS IDAML.T0010.002 - 供应链妥协:数据
描述攻击者修改代理配置以持久化访问
攻击向量配置文件修改、设置注入
受影响的组件代理配置、工具策略
当前缓解措施文件权限
剩余风险中 - 需要本地访问
建议配置完整性验证、配置更改的审计日志记录

属性
ATLAS IDAML.T0043 - 制作对抗性数据
描述攻击者精心制作技能内容以绕过审核模式
攻击向量Unicode 同形异义字、编码技巧、动态加载
受影响的组件ClawHub moderation.ts
当前缓解措施基于模式的 FLAG_RULES
剩余风险高 - 简单的正则表达式很容易被绕过
建议添加行为分析(VirusTotal Code Insight)、基于 AST 的检测
属性
ATLAS IDAML.T0043 - 制作对抗性数据
描述攻击者精心制作可以转义 XML 包装器上下文的内容
攻击向量标签操作、上下文混淆、指令覆盖
受影响的组件外部内容包装
当前缓解措施XML 标签 + 安全通知
剩余风险中 - 定期发现新的转义方式
建议多层包装器、输出端验证

属性
ATLAS IDAML.T0040 - AI 模型推理 API 访问
描述攻击者通过提示枚举可用工具
攻击向量“你有什么工具?”风格的查询
受影响的组件代理工具注册表
当前缓解措施无特定措施
剩余风险低 - 工具通常已有文档说明
建议考虑工具可见性控制
属性
ATLAS IDAML.T0040 - AI 模型推断 API 访问
描述攻击者从会话上下文中提取敏感数据
攻击向量“我们讨论了什么?”查询、上下文探测
受影响组件会话记录、上下文窗口
当前缓解措施按发送方隔离会话
剩余风险中等 - 可访问会话内数据
建议在上下文中实施敏感数据脱敏

3.7 收集与渗漏 (AML.TA0009, AML.TA0010)

Section titled “3.7 收集与渗漏 (AML.TA0009, AML.TA0010)”

T-EXFIL-001:通过 web_fetch 进行数据窃取

Section titled “T-EXFIL-001:通过 web_fetch 进行数据窃取”
属性
ATLAS IDAML.T0009 - Collection
描述攻击者指示代理将数据发送到外部 URL 以渗漏数据
攻击向量提示注入导致代理将数据 POST 到攻击者服务器
受影响组件web_fetch 工具
当前缓解措施针对内部网络的 SSRF 阻断
剩余风险高 - 允许外部 URL
建议实施 URL 白名单、数据分类感知
属性
ATLAS IDAML.T0009 - Collection
描述攻击者导致代理发送包含敏感数据的消息
攻击向量提示注入导致代理向攻击者发送消息
受影响组件消息工具、渠道集成
当前缓解措施出站消息限制
剩余风险中等 - 限制可能会被绕过
建议要求对新收件人进行明确确认
属性
ATLAS IDAML.T0009 - Collection
描述恶意 Skills 从代理上下文中收集凭据
攻击向量Skills 代码读取环境变量、配置文件
受影响组件Skills 执行环境
当前缓解措施无针对 Skills 的特定措施
剩余风险严重 - Skills 以代理权限运行
建议Skills 沙箱隔离、凭据隔离

T-IMPACT-001:未经授权的命令执行

Section titled “T-IMPACT-001:未经授权的命令执行”
属性
ATLAS IDAML.T0031 - Erode AI Model Integrity
DescriptionAttacker executes arbitrary commands on user system
Attack VectorPrompt injection combined with exec approval bypass
Affected ComponentsBash 工具, command execution
Current MitigationsExec approvals, Docker sandbox option
Residual RiskCritical - Host execution without sandbox
RecommendationsDefault to sandbox, improve approval UX
AttributeValue
ATLAS IDAML.T0031 - Erode AI Model Integrity
DescriptionAttacker exhausts API credits or compute resources
Attack VectorAutomated message flooding, expensive 工具 calls
Affected ComponentsGateway(网关), agent sessions, API 提供商
Current MitigationsNone
Residual RiskHigh - No rate limiting
RecommendationsImplement per-sender rate limits, cost budgets
AttributeValue
ATLAS IDAML.T0031 - Erode AI Model Integrity
DescriptionAttacker causes agent to send harmful/offensive content
Attack VectorPrompt injection causing inappropriate responses
Affected ComponentsOutput generation, 渠道 messaging
Current MitigationsLLM 提供商 content policies
Residual RiskMedium - Provider filters imperfect
RecommendationsOutput filtering layer, user controls

ControlImplementationEffectiveness
GitHub Account AgerequireGitHubAccountAge()Medium - Raises bar for new attackers
Path SanitizationsanitizePath()High - Prevents path traversal
File Type ValidationisTextFile()Medium - Only text files, but can still be malicious
Size Limits50MB total bundleHigh - Prevents resource exhaustion
Required SKILL.mdMandatory readmeLow security value - Informational only
Pattern ModerationFLAG_RULES in moderation.tsLow - Easily bypassed
Moderation StatusmoderationStatus field中等 - 可进行人工审查

moderation.ts 中的当前模式:

// Known-bad identifiers
/(keepcold131\/ClawdAuthenticatorTool|ClawdAuthenticatorTool)/i
// Suspicious keywords
/(malware|stealer|phish|phishing|keylogger)/i
/(api[-_ ]?key|token|password|private key|secret)/i
/(wallet|seed phrase|mnemonic|crypto)/i
/(discord\.gg|webhook|hooks\.slack)/i
/(curl[^\n]+\|\s*(sh|bash))/i
/(bit\.ly|tinyurl\.com|t\.co|goo\.gl|is\.gd)/i

局限性:

  • 仅检查 slug、displayName、summary、frontmatter、metadata、文件路径
  • 不分析实际的技能代码内容
  • 简单的正则表达式很容易通过混淆绕过
  • 无行为分析
改进措施状态影响
VirusTotal 集成进行中高 - Code Insight 行为分析
社区举报部分(skillReports 表已存在)中等
审计日志部分(auditLogs 表已存在)中等
徽章系统已实施中等 - highlighted, official, deprecated, redactionApproved

威胁 ID可能性影响风险等级优先级
T-EXEC-001严重严重P0
T-PERSIST-001严重严重P0
T-EXFIL-003中等严重严重P0
T-IMPACT-001中等严重P1
T-EXEC-002P1
T-EXEC-004中等P1
T-ACCESS-003中等P1
T-EXFIL-001中等P1
T-IMPACT-002中等P1
T-EVADE-001中等中等P2
T-ACCESS-001中等P2
T-ACCESS-002中等P2
T-PERSIST-002中等P2

攻击链 1:基于技能的数据窃取

T-PERSIST-001 → T-EVADE-001 → T-EXFIL-003
(Publish malicious skill) → (Evade moderation) → (Harvest credentials)

攻击链 2:提示注入导致 RCE

T-EXEC-001 → T-EXEC-004 → T-IMPACT-001
(Inject prompt) → (Bypass exec approval) → (Execute commands)

攻击链 3:通过获取的内容进行间接注入

T-EXEC-002 → T-EXFIL-001 → External exfiltration
(Poison URL content) → (Agent fetches & follows instructions) → (Data sent to attacker)

ID建议解决对象
R-001完成 VirusTotal 集成T-PERSIST-001, T-EVADE-001
R-002实施技能沙箱隔离T-PERSIST-001, T-EXFIL-003
R-003为敏感操作添加输出验证T-EXEC-001, T-EXEC-002
ID建议解决对象
R-004实施速率限制T-IMPACT-002
R-005添加静态令牌加密T-ACCESS-003
R-006改进执行批准的用户体验和验证T-EXEC-004
R-007为 web_fetch 实施 URL 允许列表T-EXFIL-001
ID建议解决
R-008在可能的情况下添加加密渠道验证T-ACCESS-002
R-009实现配置完整性验证T-PERSIST-003
R-010添加更新签名和版本锁定T-PERSIST-002

ATLAS ID技术名称OpenClaw 威胁
AML.T0006主动扫描T-RECON-001, T-RECON-002
AML.T0009收集T-EXFIL-001, T-EXFIL-002, T-EXFIL-003
AML.T0010.001供应链:AI 软件T-PERSIST-001, T-PERSIST-002
AML.T0010.002供应链:数据T-PERSIST-003
AML.T0031侵蚀 AI 模型完整性T-IMPACT-001, T-IMPACT-002, T-IMPACT-003
AML.T0040AI 模型推理 API 访问T-ACCESS-001, T-ACCESS-002, T-ACCESS-003, T-DISC-001, T-DISC-002
AML.T0043制作对抗性数据T-EXEC-004, T-EVADE-001, T-EVADE-002
AML.T0051.000LLM 提示注入:直接T-EXEC-001, T-EXEC-003
AML.T0051.001LLM 提示注入:间接T-EXEC-002
路径目的风险级别
src/infra/exec-approvals.ts命令批准逻辑严重
src/gateway/auth.tsGateway(网关) 身份验证严重
src/infra/net/ssrf.tsSSRF 保护严重
src/security/external-content.ts提示注入缓解严重
src/agents/sandbox/tool-policy.ts工具策略执行严重
src/routing/resolve-route.ts会话隔离中等
术语定义
ATLASMITRE 的 AI 系统对抗性威胁全景
ClawHubOpenClaw 的技能市场
Gateway(网关)OpenClaw 的消息路由和身份验证层
MCP模型上下文协议 - 工具提供商接口
提示注入将恶意指令嵌入输入的攻击
技能OpenClaw 代理的可下载扩展
SSRF服务器端请求伪造

此威胁模型是一份持续更新的文档。请将安全问题报告至 [email protected]