第20章：安全性和隐私

所属部分：第六部分：高级主题

20.1 加密和隐私保护

IPFS 本身不内置端到端加密，其核心协议（如 IPLD、libp2p、Bitswap）默认以明文方式传输和存储内容标识符（CID）及其对应的数据块。这意味着：任何能获取 CID 的节点均可通过 DHT 查找并下载该内容；若数据未加密，其原始内容即暴露于网络中。因此，加密必须在应用层或工具链层面显式实现。

内容加密（Content Encryption）

最常用模式是“加密后上链”：先对敏感数据进行对称加密（如 AES-256-GCM），再将密文存入 IPFS，最后将加密密钥（KEK）通过安全信道分发或使用公钥加密封装。示例如下：

# 1. 生成随机密钥并加密文件
KEY=$(openssl rand -hex 32)
echo "$KEY" > key.hex
openssl enc -aes-256-gcm -salt -pbkdf2 -iter 100000 \
  -in sensitive.txt -out encrypted.bin -k "$KEY"

# 2. 添加密文至 IPFS（获得 CID）
CID=$(ipfs add -q encrypted.bin)

# 3. （可选）用接收方公钥加密密钥
RECIPIENT_PUB="public_key.pem"
ENCRYPTED_KEY=$(openssl pkeyutl -encrypt -pubin -inkey "$RECIPIENT_PUB" -in key.hex | base64)

echo "Content CID: $CID"
echo "Encrypted Key (Base64): $ENCRYPTED_KEY"

✅ 关键原则：CID 是内容的哈希指纹，加密后 CID 随密文变化而唯一，天然支持完整性校验；但密钥管理完全独立于 IPFS，需依赖外部系统（如 Keybase、HashiCorp Vault 或自建 KMS）。

传输层加密（TLS 替代方案）

libp2p 默认启用 Noise 协议框架（RFC 8446 兼容），提供双向身份认证与前向保密的会话加密。无需额外配置，只要节点启用了 TLS 或 Noise（v0.30+ 默认启用）：

# 检查本地节点是否启用加密传输（查看日志或 API）
curl -s http://127.0.0.1:5001/api/v0/id | jq '.Addresses'
# 输出中应包含 /ip4/.../tcp/.../tls/... 或 /ip4/.../tcp/.../noise/...

所有 libp2p 连接（包括 DHT 查询、Bitswap 交换）均自动协商 Noise 加密通道，抵御被动嗅探与中间人攻击。

20.2 访问控制

IPFS 原生无 RBAC 或 ACL 机制，访问控制需结合以下三层模型构建：

1. 网络层隔离（libp2p 配置）

通过 Swarm 配置限制节点可见性。编辑 ~/.ipfs/config：

{
  "Swarm": {
    "AddrFilters": [
      "/ip4/192.168.0.0/ipcidr/16",
      "/ip6/fd00::/8"
    ],
    "DisableBandwidthMetrics": true,
    "DisableNatPortMap": true
  }
}

AddrFilters 仅允许私有地址段通信；配合 --routing=dhtclient 启动节点，使其不参与公共 DHT，仅作为客户端查询。

2. 内容寻址层控制（Private Networks）

使用共享密钥的私有网络强制节点间通信隔离：

# 生成私网密钥（32 字节 hex）
echo "QmZy..." > ./swarm.key  # 实际为 64 字符 hex 字符串

# 初始化节点时指定密钥
ipfs init --profile=server --swarm-key-file=./swarm.key

# 启动（自动加载 swarm.key）
ipfs daemon

所有加入同一 swarm.key 的节点构成逻辑隔离网络，DHT 和 PubSub 消息仅在该密钥组内传播，外部节点无法发现或连接。

3. 应用层策略（IPLD + DID）

结合可验证凭证（VC）与去中心化标识符（DID）实现细粒度授权。例如，使用 ipfs dag put 存储带签名的访问策略：

{
  "@type": "AccessPolicy",
  "resource": "QmXyZ...",
  "grants": [{
    "subject": "did:key:z6MkjRagNiMu91Dduv1Fbch22rBt4d6oYt6WfAaZcJ5xLHj",
    "permission": ["read", "derive"]
  }]
}

客户端在获取内容前，先解析关联的策略 DAG 节点，并验证 DID 签名有效性（通过 ipfs dag get + did-jwt-vc 库）。

20.3 安全最佳实践

实践	操作命令/配置	说明
禁用远程 API 未授权访问	`ipfs config Addresses.API /ip4/127.0.0.1/tcp/5001`	避免公网暴露 `/api/v0` 接口，防止恶意 `ipfs add` 或 `pin rm`
启用内容固定策略	`ipfs pin add --recursive QmAbc...`	防止垃圾回收误删关键数据；生产环境建议搭配 `ipfs-cluster` 实现跨节点冗余固定
最小权限运行节点	`useradd -r -s /bin/false ipfs && sudo -u ipfs ipfs daemon`	以非 root、无 shell 权限用户运行守护进程
定期轮换 Swarm 密钥	`rm ~/.ipfs/swarm.key && ipfs init --swarm-key-file=...`	私网密钥泄露后，旧节点将被新网络排斥，需同步更新所有节点
审计 CID 来源	`ipfs object stat Qm...` + `ipfs refs local \	wc -l`	监控异常高引用 CID（可能为恶意数据洪泛）

⚠️ 特别提醒：避免在 ipfs add 中使用 --only-hash 处理敏感数据——它仍会读取文件元数据（如 mtime、size），存在侧信道泄漏风险。应优先采用内存流加密（如 gpg --symmetric \| ipfs add -q）。

20.4 常见安全威胁

CID 泄漏（CID Leakage）：前端 JavaScript 直接渲染 ipfs://Qm... 链接，导致浏览器预加载并暴露用户访问意图至网关。✅ 缓解：服务端代理网关请求，或使用 ipfs://localhost:8080/ipfs/Qm... 本地网关。

Sybil 攻击与 DHT 污染：攻击者部署大量虚假节点，篡改 DHT 中的 PeerRecord，使 ipfs dht findprovs <CID> 返回无效地址。✅ 缓解：启用 --routing=dhtclient（不提供记录）、使用可信引导节点（Bootstrap 列表）、或切换至 ipns + DNSLink 绕过 DHT。

内容污染（Content Poisoning）：攻击者发布与合法 CID 冲突的伪造内容（极低概率，因 SHA2-256 抗碰撞性）。✅ 缓解：对高价值内容使用多重哈希（如 sha2-512 + blake2b-256）并交叉验证；或采用 ipns 发布带签名的 CID 清单。

网关滥用（Gateway Abuse）：公共网关（如 ipfs.io）被用于托管恶意脚本或绕过 CSP。✅ 缓解：企业应部署私有网关（ipfs gateway --port=8081 --no-browser），并配置反向代理添加 WAF 规则。

20.5 隐私保护策略

数据最小化（Data Minimization）

在 IPLD 结构中剥离非必要字段。例如，存储医疗记录时：

// ❌ 不推荐：包含完整患者对象
{ "patient": { "name": "Alice", "ssn": "123-45-6789", "diagnosis": "flu" } }

// ✅ 推荐：仅保留业务必需字段 + 零知识证明占位符
{ 
  "diagnosis": "flu",
  "proof": "zkp_1a2b3c...", 
  "timestamp": 1717027200
}

使用 IPLD Schema 定义严格结构，并通过 ipfs dag import --schema=medical.ipldsch 强制校验。

匿名化与假名化（Anonymization）

假名化：用 did:key 替代真实身份，所有操作签名均绑定 DID，而非 IP 地址或邮箱。
匿名化：对统计类数据使用差分隐私（DP）库处理后再上链。例如，使用 diffprivlib 添加拉普拉斯噪声：

from diffprivlib.mechanisms import Laplace
import json

mechanism = Laplace(epsilon=1.0, sensitivity=1)
noisy_count = mechanism.randomise(42)  # 原始计数 42
record = {"anonymized_count": round(noisy_count)}
ipfs_add(json.dumps(record))

零知识证明集成（ZKP）

通过 circom + snarkjs 构建 ZKP 电路，验证数据属性而不暴露原始值。典型场景：证明“某患者年龄 > 18”，无需提交生日。

# 生成证明（本地执行，不上传原始数据）
snarkjs groth16 prove circuit.zkey input.json witness.wtns proof.json public.json

# 将 proof.json 与 public.json（含约束满足声明）存入 IPFS
PROOF_CID=$(ipfs add -Q proof.json)
PUBLIC_CID=$(ipfs add -Q public.json)

验证者仅需下载 public.json 并调用 snarkjs groth16 verify verification_key.json public.json proof.json，全程不接触原始年龄字段。

🔐 终极提示：IPFS 是中立的内容分发协议，其安全性与隐私性取决于你如何组合加密、身份、策略与运维实践。没有银弹，只有纵深防御——从 swarm.key 的第一道门，到 ZKP 的最后一道锁，每一环都不可或缺。