Maigret 深度拆解：用一个用户名，挖出整个数字身份

> 来源：GitHub 仓库 soxoj/maigret、官方文档、OSINT 社区评测 > 作者：小凯 > 日期：2026-05-14 > 仓库：https://github.com/soxoj/maigret > 文档：https://maigret.readthedocs.io

---

一句话总结

Maigret 是开源 OSINT（开源情报）工具，输入一个用户名，自动在 3,100+ 网站 上搜索关联账户，提取个人资料信息，递归追踪关联身份，最终生成可交付的调查报告。23K+ GitHub stars，被执法部门、网络安全研究员和记者广泛使用。它不是一个"黑客工具"，而是一个数字身份侦查的基础设施。

---

一、项目定位：从 Sherlock 分支到 OSINT 旗舰

1.1 历史渊源

Maigret 最初是 Sherlock 的一个分支。Sherlock 是 OSINT 社区最经典的用户名搜索工具（479 个站点、成熟稳定），但 Maigret 在分支后迅速超越了原版：

站点覆盖：从 479 扩展到 3,100+（6.5 倍）
功能深度：从简单的"存在/不存在"检查，进化到递归身份映射
报告能力：从 CSV/文本导出，升级到 HTML/PDF/XMind/JSON/CSV/TXT/Graph 全格式
AI 分析：新增 --ai 模式，用 OpenAI API 生成调查摘要

1.2 核心假设

数字时代，一个人的用户名是最稳定的身份指纹：

很多人在不同平台复用同一个用户名
即使用户名不同，平台间的交叉链接（profile 里的 "Find me on Twitter"）也会暴露关联
一个用户名 + 递归追踪 = 一个人的数字身份网络

Maigret 的出发点：自动化地、大规模地、递归地做这个追踪工作。

1.3 关键数据

指标	数值
GitHub Stars	23,000+
覆盖站点	3,100+（默认检查 top 500）
开源协议	MIT
技术栈	Python 3.10+，异步（aiohttp）
站点数据库	自动从 GitHub 更新（24h 周期）
最新版本	v0.5.0（2025-08）
维护者	soxoj

---

二、核心功能：数字身份的全链路侦查

2.1 用户名枚举（Username Enumeration）

输入一个用户名，Maigret 同时向数千个站点发送 HTTP 请求：

检查用户名是否被注册
返回 profile URL、HTTP 状态码、站点排名
默认只查 top 500 高流量站点（快速），-a 查全部（深度）

2.2 资料解析（Profile Parsing）

不只是"存在"，还要"挖出内容"：

通过 socid_extractor 从公开 profile 页面提取结构化信息
提取字段：全名、头像、简介、位置、链接到其他账户的 URL
支持部分绕过封锁、审查和 CAPTCHA

2.3 递归搜索（Recursive Search）

这是 Maigret 区别于其他工具的核心能力： 1. 在平台 A 找到一个账户 2. 从该账户提取链接到其他平台的 URL（"Follow me on Instagram"） 3. 自动在这些新平台搜索关联用户名 4. 构建身份网络图，而非扁平列表

2.4 报告生成

maigret user --html     # HTML 报告
maigret user --pdf      # PDF 报告
maigret user --xmind    # XMind 思维导图
maigret user --json     # JSON/NDJSON
maigret user --csv      # CSV
maigret user --txt      # 纯文本
maigret user --graph    # 交互式 D3 网络图

2.5 Web UI

maigret --web 5000      # 启动本地 Web 服务
# 或
docker run -p 5000:5000 soxoj/maigret:web

打开浏览器输入用户名，查看结果图谱和下载报告。

2.6 变体生成（Permutation）

maigret "john doe" --permute
# 生成：johndoe, john_doe, j.doe, doejohn, ...

用于 typo-squat（恶意抢注相似用户名）和别名狩猎。

2.7 AI 分析模式

maigret user --ai       # 需要 OPENAI_API_KEY

将原始发现转化为调查摘要，自动分析关联关系和风险信号。

---

三、技术架构

3.1 核心流程

输入用户名
    ↓
加载站点数据库（内置 + GitHub 实时更新）
    ↓
异步并发检查（aiohttp，数千请求并行）
    ↓
解析发现的 profile（socid_extractor）
    ↓
提取关联用户名/ID
    ↓
递归搜索（可选）
    ↓
生成报告（HTML/PDF/Graph/...）

3.2 站点数据库

{
  "name": "GitHub",
  "urlMain": "https://github.com",
  "url": "https://github.com/{username}",
  "urlProbe": "https://api.github.com/users/{username}",
  "usernameClaimed": "torvalds",
  "usernameUnclaimed": "noonewouldeverusethis7",
  "tags": ["coding", "us"],
  "alexaRank": 78,
  "checkType": "status_code",
  "headers": {"User-Agent": "..."}
}

3,100+ 条记录，按 Alexa 排名排序
每条记录定义：URL 模板、验证方式（status_code/content/redirect）、声称/未声称测试用户名
自检查机制：--self-check 验证 claimed/unclaimed 测试对是否仍然有效
支持按标签过滤：--tags photo,dating（摄影/约会类平台）或 --tags us（美国平台）

3.3 反检测机制

机制	说明
代理支持	HTTP/SOCKS/Tor/I2P
请求头	站点自定义 User-Agent 和 headers
并发控制	可配置请求速率和超时
封锁检测	识别并部分绕过 CAPTCHA 和审查
TLS 指纹	部分工具使用 curl_cffi 模拟浏览器 TLS

---

四、竞品全景对比

4.1 用户名搜索工具矩阵

工具	覆盖站点	递归搜索	资料解析	AI 分析	报告格式	协议
Maigret	3,100+	✅	✅ 深度	✅ `--ai`	HTML/PDF/XMind/JSON/CSV/TXT/Graph	MIT
Sherlock	479	❌	基础	❌	CSV/JSON/XLSX	MIT
Enola	407	❌	基础	❌	CSV/JSON	MIT
Snoop	350（免费）/ 5,300+（付费）	❌	基础	❌	CSV/HTML/地图	部分付费
Aliens Eye	841	❌	基础	✅ 置信度评分	JSON	开源
Blackbird	600+	❌	✅	✅ 免费	PDF/CSV/JSON	开源
WhatsMyName	732（数据集）	❌	❌	❌	依赖下游工具	开源
Naminter	730+	❌	基础	❌	PDF/CSV/JSON/HTML	开源
FootprintIQ	商用	✅	✅ 深度	✅	专业报告	商用

4.2 核心差异分析

Maigret vs Sherlock：

Sherlock 是"快速查询工具"——输入用户名，2 分钟出结果
Maigret 是"调查笔记本"——递归追踪、关系映射、证据级报告

Maigret vs Snoop：

Snoop 付费版覆盖 5,300+ 站点（数量优势）
Maigret 递归搜索和报告生成（深度优势）
Snoop 有 geolocation 插件和 Android/Termux 支持（移动场景）

Maigret vs Blackbird：

Blackbird 支持 email 搜索（Maigret 不支持）
Maigret 递归搜索更强
Blackbird 默认包含 NSFW 站点（需注意合规）

开源 vs 商用（FootprintIQ）：

FootprintIQ 提供图像情报、监控、自动移除等高级功能
Maigret 免费、可定制、可嵌入工作流

---

五、部署方式

5.1 快速安装

pip install maigret          # Python 3.10+
maigret YOUR_USERNAME

5.2 Docker

docker run soxoj/maigret:latest maigret user
docker run -p 5000:5000 soxoj/maigret:web   # Web UI

5.3 Python 库嵌入

import maigret

# 异步 API 直接调用
results = await maigret.search(username, sites, ...)
# 集成到更大的 OSINT 工作流

5.4 MCP Server 集成

{
  "mcpServers": {
    "maigret": {
      "command": "docker",
      "args": ["run", "-i", "--rm", "soxoj/maigret:mcp"],
      "env": {
        "MAIGRET_REPORTS_DIR": "/reports"
      }
    }
  }
}

支持 Claude Desktop、Cursor、VS Code 等 MCP 客户端，自然语言触发： > "用 maigret 搜索用户名 'test_user123' 并生成 HTML 报告"

5.5 无安装方案

Telegram Bot：社区维护的机器人（无需安装）
Cloud Shell：直接在云环境运行
Apify Actor：https://apify.com/ntriqpro/maigret-actor（按量计费，$0.02-0.25/次）

---

六、AI 私家侦探：工具背后的能力边界

6.1 它能做什么

✅ 找到一个用户名在 3,100+ 平台上的存在性
✅ 从公开 profile 提取姓名、头像、简介、位置
✅ 递归追踪交叉链接的身份
✅ 生成可用于法律/调查的报告
✅ 通过 AI 模式自动分析关联关系
✅ 在 CI/CD 或自动化工作流中嵌入

6.2 它不能做什么（关键限制）

限制	说明
❌ 无法访问私有账户	只能检查公开可见的信息
❌ 无法确认身份归属	同名用户名可能是不同的人
❌ 无法获取已删除账户	历史数据不可见
❌ 无法绕过付费墙	封闭网络数据 inaccessible
❌ 有假阳性	共享用户名、机器人、同形异义字可能误导
❌ 不是法律证据	需要人工验证每一个结果

6.3 误报来源

共享用户名："admin"、"test" 等常见名出现在多个平台但不属于同一人
机器人账户：平台自动生成同名占位账户
同形异义字（Homoglyphs）：西里尔字母 "о" 和拉丁字母 "o" 视觉上相同但编码不同
API 变动：平台改版后检测逻辑失效，导致 false positive/negative

---

七、反炒作审计

7.1 "AI 私家侦探" vs 现实

营销修辞："AI 私家侦探"——听起来像 ChatGPT 去调查你的前任 真实情况：

Maigret 本身是规则驱动的异步 HTTP 检查器，不是 AI
--ai 模式只是在最后一步用 LLM 总结已收集的数据
核心能力来自站点数据库的广度和维护质量，不是"AI 推理"

结论：Maigret 是工程工具，不是智能代理。它的"侦探能力"来自站点覆盖量（3,100+）和递归逻辑，不是 GPT-4 式的推理。

7.2 技术债务

站点数据库维护：平台改版频繁，3,100 条记录需要持续更新
维护者提供 --self-check 自动审计
开源社区通过 PR 贡献新站点和修复
CAPTCHA 和反爬：越来越多的平台部署 Cloudflare、CAPTCHA
Maigret 的部分绕过能力有限
竞品 Naminter 使用 curl_cffi 模拟浏览器 TLS 指纹，在这方面更先进
法律合规：GDPR、CCPA 等法规限制
README 明确声明"仅用于教育和合法目的"
用户需自行承担合规责任

7.3 商业化风险

维护者 soxoj 提供商业版本：

私有站点数据库（5,000+ 站点，每日更新）
Username Check API（集成到产品）
联系：maigret@soxoj.com

这意味着：

开源版本可能滞后于商业版本的数据库更新
但核心功能（递归搜索、报告生成）仍完全免费

---

八、适用场景判断

8.1 最适合

1. 网络安全调查：蓝队/红队评估数字足迹暴露 2. 记者调查：追踪网络身份的关联关系 3. 执法部门：警方 OSINT 调查（Police1 文章推荐） 4. 招聘背景调查：验证候选人提供的社交媒体信息 5. 个人数字足迹审计：查看自己在互联网上暴露了哪些信息 6. 品牌保护：查找恶意抢注和品牌冒充

8.2 不适合

1. 隐私侵犯/骚扰：工具本身合法，但用途可能非法 2. 期待"一键出真相"：需要人工验证每个结果 3. 非技术用户：虽然有 Web UI，但 CLI 仍是主要界面 4. 深度内容分析：只能检查公开 profile 元数据，不能读取帖子/私信

---

九、核心洞察

9.1 开源情报（OSINT）的民主化

Maigret 代表了 OSINT 工具的开源化和民主化：

过去：只有执法部门和大型安全公司才有能力做这种跨平台调查
现在：任何人 pip install maigret 就能启动调查
双刃剑：能力下放意味着滥用风险也下放

9.2 递归身份映射的价值

Maigret 的真正差异化不是"3,100+ 站点"（Snoop 付费版更多），而是递归搜索：

从用户名 A → 找到平台 X 的账户 → 提取链接 → 发现用户名 B → 在更多平台搜索 B
这种网络效应意味着初始输入（一个用户名）的产出随递归深度指数增长

9.3 AI 只是锦上添花

--ai 模式是典型的AI 包装（AI Wrapping）：

核心逻辑仍是 2020 年就成熟的异步 HTTP 检查
AI 只是在最后把 JSON 结果翻译成自然语言摘要
这不是"AI 私家侦探"，而是"私家侦探 + AI 写报告助手"

9.4 数据质量 > 算法

在 OSINT 领域，站点数据库的质量和新鲜度比算法更重要：

3,100 个站点中如果有 30% 检测逻辑失效，结果可信度暴跌
Maigret 的 --self-check 和社区贡献机制是保持数据质量的关键
商业版本的价值恰恰在于"每日更新的私有数据库"

---

十、生态集成与扩展

10.1 MCP Server

Maigret MCP Server 把 OSINT 能力注入 AI 工作流：

229,409+ 次浏览（mcp.directory）
支持 Cursor、Claude Desktop、VS Code
Docker 化执行，内置安全保护

10.2 集成工作流示例

用户输入可疑用户名
    ↓
Maigret 枚举所有平台存在性
    ↓
socid_extractor 解析 profile 信息
    ↓
递归搜索关联用户名
    ↓
生成网络图（D3 graph）
    ↓
AI 模式总结关键发现
    ↓
输出结构化报告（HTML/PDF）

10.3 Telegram Bot

社区维护的无安装方案：直接发送用户名给机器人，返回结果。

---

参考来源

1. Maigret GitHub 仓库：https://github.com/soxoj/maigret 2. 官方文档：https://maigret.readthedocs.io 3. PyPI：https://pypi.org/project/maigret 4. ExplainX 深度解析：https://explainx.ai/blog/maigret-osint-username-soxoj-open-source-2026 5. WhatsMyName App 对比：https://whatsmynameapp.us/tools/osint 6. Maigret vs Sherlock 对比：https://footprintiq.app/compare/maigret-vs-sherlock 7. OSINT 工具全景：https://github.com/soxoj/osint-namecheckers-list 8. Maigret MCP Server：https://mcp.directory/servers/maigret-osint 9. Police1 执法应用：https://www.police1.com/investigations/3-osint-tools-every-officer-should-master-now 10. Apify Actor：https://apify.com/ntriqpro/maigret-actor

#AI工具 #OSINT #网络安全 #开源情报 #数字身份 #社工 #小凯

Maigret 深度拆解：用一个用户名，挖出整个数字身份

Maigret 深度拆解：用一个用户名，挖出整个数字身份

一句话总结

一、项目定位：从 Sherlock 分支到 OSINT 旗舰

1.1 历史渊源

1.2 核心假设

1.3 关键数据

二、核心功能：数字身份的全链路侦查

2.1 用户名枚举（Username Enumeration）

2.2 资料解析（Profile Parsing）

2.3 递归搜索（Recursive Search）

2.4 报告生成

2.5 Web UI

2.6 变体生成（Permutation）

2.7 AI 分析模式

三、技术架构

3.1 核心流程

3.2 站点数据库

3.3 反检测机制

四、竞品全景对比

4.1 用户名搜索工具矩阵

4.2 核心差异分析

五、部署方式

5.1 快速安装

5.2 Docker

5.3 Python 库嵌入

5.4 MCP Server 集成

5.5 无安装方案

六、AI 私家侦探：工具背后的能力边界

6.1 它能做什么

6.2 它不能做什么（关键限制）

6.3 误报来源

七、反炒作审计

7.1 "AI 私家侦探" vs 现实

7.2 技术债务

7.3 商业化风险

八、适用场景判断

8.1 最适合

8.2 不适合

九、核心洞察

9.1 开源情报（OSINT）的民主化

9.2 递归身份映射的价值

9.3 AI 只是锦上添花

9.4 数据质量 > 算法

十、生态集成与扩展

10.1 MCP Server

10.2 集成工作流示例

10.3 Telegram Bot

参考来源

🌟 智谱 GLM-5 已上线