# Maigret 深度拆解:用一个用户名,挖出整个数字身份
> **来源**:GitHub 仓库 soxoj/maigret、官方文档、OSINT 社区评测
> **作者**:小凯
> **日期**:2026-05-14
> **仓库**:https://github.com/soxoj/maigret
> **文档**:https://maigret.readthedocs.io
---
## 一句话总结
Maigret 是**开源 OSINT(开源情报)工具**,输入一个用户名,自动在 **3,100+ 网站** 上搜索关联账户,提取个人资料信息,递归追踪关联身份,最终生成可交付的调查报告。23K+ GitHub stars,被执法部门、网络安全研究员和记者广泛使用。它不是一个"黑客工具",而是一个**数字身份侦查的基础设施**。
---
## 一、项目定位:从 Sherlock 分支到 OSINT 旗舰
### 1.1 历史渊源
Maigret 最初是 **Sherlock** 的一个分支。Sherlock 是 OSINT 社区最经典的用户名搜索工具(479 个站点、成熟稳定),但 Maigret 在分支后迅速超越了原版:
- **站点覆盖**:从 479 扩展到 **3,100+**(6.5 倍)
- **功能深度**:从简单的"存在/不存在"检查,进化到**递归身份映射**
- **报告能力**:从 CSV/文本导出,升级到 **HTML/PDF/XMind/JSON/CSV/TXT/Graph** 全格式
- **AI 分析**:新增 `--ai` 模式,用 OpenAI API 生成调查摘要
### 1.2 核心假设
数字时代,一个人的**用户名是最稳定的身份指纹**:
- 很多人在不同平台复用同一个用户名
- 即使用户名不同,平台间的交叉链接(profile 里的 "Find me on Twitter")也会暴露关联
- 一个用户名 + 递归追踪 = 一个人的数字身份网络
Maigret 的出发点:**自动化地、大规模地、递归地**做这个追踪工作。
### 1.3 关键数据
| 指标 | 数值 |
|------|------|
| GitHub Stars | **23,000+** |
| 覆盖站点 | **3,100+**(默认检查 top 500) |
| 开源协议 | MIT |
| 技术栈 | Python 3.10+,异步(aiohttp) |
| 站点数据库 | 自动从 GitHub 更新(24h 周期) |
| 最新版本 | v0.5.0(2025-08) |
| 维护者 | soxoj |
---
## 二、核心功能:数字身份的全链路侦查
### 2.1 用户名枚举(Username Enumeration)
输入一个用户名,Maigret 同时向数千个站点发送 HTTP 请求:
- 检查用户名是否被注册
- 返回 profile URL、HTTP 状态码、站点排名
- 默认只查 **top 500** 高流量站点(快速),`-a` 查全部(深度)
### 2.2 资料解析(Profile Parsing)
不只是"存在",还要"挖出内容":
- 通过 **socid_extractor** 从公开 profile 页面提取结构化信息
- 提取字段:全名、头像、简介、位置、链接到其他账户的 URL
- 支持部分绕过封锁、审查和 CAPTCHA
### 2.3 递归搜索(Recursive Search)
**这是 Maigret 区别于其他工具的核心能力**:
1. 在平台 A 找到一个账户
2. 从该账户提取链接到其他平台的 URL("Follow me on Instagram")
3. 自动在这些新平台搜索关联用户名
4. 构建**身份网络图**,而非扁平列表
### 2.4 报告生成
```bash
maigret user --html # HTML 报告
maigret user --pdf # PDF 报告
maigret user --xmind # XMind 思维导图
maigret user --json # JSON/NDJSON
maigret user --csv # CSV
maigret user --txt # 纯文本
maigret user --graph # 交互式 D3 网络图
```
### 2.5 Web UI
```bash
maigret --web 5000 # 启动本地 Web 服务
# 或
docker run -p 5000:5000 soxoj/maigret:web
```
打开浏览器输入用户名,查看结果图谱和下载报告。
### 2.6 变体生成(Permutation)
```bash
maigret "john doe" --permute
# 生成:johndoe, john_doe, j.doe, doejohn, ...
```
用于 typo-squat(恶意抢注相似用户名)和别名狩猎。
### 2.7 AI 分析模式
```bash
maigret user --ai # 需要 OPENAI_API_KEY
```
将原始发现转化为**调查摘要**,自动分析关联关系和风险信号。
---
## 三、技术架构
### 3.1 核心流程
```
输入用户名
↓
加载站点数据库(内置 + GitHub 实时更新)
↓
异步并发检查(aiohttp,数千请求并行)
↓
解析发现的 profile(socid_extractor)
↓
提取关联用户名/ID
↓
递归搜索(可选)
↓
生成报告(HTML/PDF/Graph/...)
```
### 3.2 站点数据库
```json
{
"name": "GitHub",
"urlMain": "https://github.com",
"url": "https://github.com/{username}",
"urlProbe": "https://api.github.com/users/{username}",
"usernameClaimed": "torvalds",
"usernameUnclaimed": "noonewouldeverusethis7",
"tags": ["coding", "us"],
"alexaRank": 78,
"checkType": "status_code",
"headers": {"User-Agent": "..."}
}
```
- **3,100+ 条记录**,按 Alexa 排名排序
- 每条记录定义:URL 模板、验证方式(status_code/content/redirect)、声称/未声称测试用户名
- **自检查机制**:`--self-check` 验证 claimed/unclaimed 测试对是否仍然有效
- 支持按标签过滤:`--tags photo,dating`(摄影/约会类平台)或 `--tags us`(美国平台)
### 3.3 反检测机制
| 机制 | 说明 |
|------|------|
| **代理支持** | HTTP/SOCKS/Tor/I2P |
| **请求头** | 站点自定义 User-Agent 和 headers |
| **并发控制** | 可配置请求速率和超时 |
| **封锁检测** | 识别并部分绕过 CAPTCHA 和审查 |
| **TLS 指纹** | 部分工具使用 curl_cffi 模拟浏览器 TLS |
---
## 四、竞品全景对比
### 4.1 用户名搜索工具矩阵
| 工具 | 覆盖站点 | 递归搜索 | 资料解析 | AI 分析 | 报告格式 | 协议 |
|------|---------|---------|---------|---------|---------|------|
| **Maigret** | **3,100+** | ✅ | ✅ 深度 | ✅ `--ai` | HTML/PDF/XMind/JSON/CSV/TXT/Graph | MIT |
| Sherlock | 479 | ❌ | 基础 | ❌ | CSV/JSON/XLSX | MIT |
| Enola | 407 | ❌ | 基础 | ❌ | CSV/JSON | MIT |
| Snoop | 350(免费)/ 5,300+(付费) | ❌ | 基础 | ❌ | CSV/HTML/地图 | 部分付费 |
| Aliens Eye | 841 | ❌ | 基础 | ✅ 置信度评分 | JSON | 开源 |
| Blackbird | 600+ | ❌ | ✅ | ✅ 免费 | PDF/CSV/JSON | 开源 |
| WhatsMyName | 732(数据集) | ❌ | ❌ | ❌ | 依赖下游工具 | 开源 |
| Naminter | 730+ | ❌ | 基础 | ❌ | PDF/CSV/JSON/HTML | 开源 |
| FootprintIQ | 商用 | ✅ | ✅ 深度 | ✅ | 专业报告 | 商用 |
### 4.2 核心差异分析
**Maigret vs Sherlock**:
- Sherlock 是"快速查询工具"——输入用户名,2 分钟出结果
- Maigret 是"调查笔记本"——递归追踪、关系映射、证据级报告
**Maigret vs Snoop**:
- Snoop 付费版覆盖 5,300+ 站点(数量优势)
- Maigret 递归搜索和报告生成(深度优势)
- Snoop 有 geolocation 插件和 Android/Termux 支持(移动场景)
**Maigret vs Blackbird**:
- Blackbird 支持 **email 搜索**(Maigret 不支持)
- Maigret 递归搜索更强
- Blackbird 默认包含 NSFW 站点(需注意合规)
**开源 vs 商用(FootprintIQ)**:
- FootprintIQ 提供图像情报、监控、自动移除等高级功能
- Maigret 免费、可定制、可嵌入工作流
---
## 五、部署方式
### 5.1 快速安装
```bash
pip install maigret # Python 3.10+
maigret YOUR_USERNAME
```
### 5.2 Docker
```bash
docker run soxoj/maigret:latest maigret user
docker run -p 5000:5000 soxoj/maigret:web # Web UI
```
### 5.3 Python 库嵌入
```python
import maigret
# 异步 API 直接调用
results = await maigret.search(username, sites, ...)
# 集成到更大的 OSINT 工作流
```
### 5.4 MCP Server 集成
```json
{
"mcpServers": {
"maigret": {
"command": "docker",
"args": ["run", "-i", "--rm", "soxoj/maigret:mcp"],
"env": {
"MAIGRET_REPORTS_DIR": "/reports"
}
}
}
}
```
支持 Claude Desktop、Cursor、VS Code 等 MCP 客户端,自然语言触发:
> "用 maigret 搜索用户名 'test_user123' 并生成 HTML 报告"
### 5.5 无安装方案
- **Telegram Bot**:社区维护的机器人(无需安装)
- **Cloud Shell**:直接在云环境运行
- **Apify Actor**:https://apify.com/ntriqpro/maigret-actor(按量计费,$0.02-0.25/次)
---
## 六、AI 私家侦探:工具背后的能力边界
### 6.1 它能做什么
- ✅ 找到一个用户名在 3,100+ 平台上的存在性
- ✅ 从公开 profile 提取姓名、头像、简介、位置
- ✅ 递归追踪交叉链接的身份
- ✅ 生成可用于法律/调查的报告
- ✅ 通过 AI 模式自动分析关联关系
- ✅ 在 CI/CD 或自动化工作流中嵌入
### 6.2 它不能做什么(关键限制)
| 限制 | 说明 |
|------|------|
| ❌ **无法访问私有账户** | 只能检查公开可见的信息 |
| ❌ **无法确认身份归属** | 同名用户名可能是不同的人 |
| ❌ **无法获取已删除账户** | 历史数据不可见 |
| ❌ **无法绕过付费墙** | 封闭网络数据 inaccessible |
| ❌ **有假阳性** | 共享用户名、机器人、同形异义字可能误导 |
| ❌ **不是法律证据** | 需要人工验证每一个结果 |
### 6.3 误报来源
- **共享用户名**:"admin"、"test" 等常见名出现在多个平台但不属于同一人
- **机器人账户**:平台自动生成同名占位账户
- **同形异义字(Homoglyphs)**:西里尔字母 "о" 和拉丁字母 "o" 视觉上相同但编码不同
- **API 变动**:平台改版后检测逻辑失效,导致 false positive/negative
---
## 七、反炒作审计
### 7.1 "AI 私家侦探" vs 现实
**营销修辞**:"AI 私家侦探"——听起来像 ChatGPT 去调查你的前任
**真实情况**:
- Maigret 本身是**规则驱动的异步 HTTP 检查器**,不是 AI
- `--ai` 模式只是在最后一步用 LLM 总结已收集的数据
- 核心能力来自**站点数据库的广度和维护质量**,不是"AI 推理"
**结论**:Maigret 是**工程工具**,不是**智能代理**。它的"侦探能力"来自站点覆盖量(3,100+)和递归逻辑,不是 GPT-4 式的推理。
### 7.2 技术债务
- **站点数据库维护**:平台改版频繁,3,100 条记录需要持续更新
- 维护者提供 `--self-check` 自动审计
- 开源社区通过 PR 贡献新站点和修复
- **CAPTCHA 和反爬**:越来越多的平台部署 Cloudflare、CAPTCHA
- Maigret 的部分绕过能力有限
- 竞品 Naminter 使用 curl_cffi 模拟浏览器 TLS 指纹,在这方面更先进
- **法律合规**:GDPR、CCPA 等法规限制
- README 明确声明"仅用于教育和合法目的"
- 用户需自行承担合规责任
### 7.3 商业化风险
维护者 soxoj 提供**商业版本**:
- 私有站点数据库(5,000+ 站点,每日更新)
- Username Check API(集成到产品)
- 联系:maigret@soxoj.com
这意味着:
- 开源版本可能滞后于商业版本的数据库更新
- 但核心功能(递归搜索、报告生成)仍完全免费
---
## 八、适用场景判断
### 8.1 最适合
1. **网络安全调查**:蓝队/红队评估数字足迹暴露
2. **记者调查**:追踪网络身份的关联关系
3. **执法部门**:警方 OSINT 调查(Police1 文章推荐)
4. **招聘背景调查**:验证候选人提供的社交媒体信息
5. **个人数字足迹审计**:查看自己在互联网上暴露了哪些信息
6. **品牌保护**:查找恶意抢注和品牌冒充
### 8.2 不适合
1. **隐私侵犯/骚扰**:工具本身合法,但用途可能非法
2. **期待"一键出真相"**:需要人工验证每个结果
3. **非技术用户**:虽然有 Web UI,但 CLI 仍是主要界面
4. **深度内容分析**:只能检查公开 profile 元数据,不能读取帖子/私信
---
## 九、核心洞察
### 9.1 开源情报(OSINT)的民主化
Maigret 代表了 OSINT 工具的**开源化和民主化**:
- 过去:只有执法部门和大型安全公司才有能力做这种跨平台调查
- 现在:任何人 `pip install maigret` 就能启动调查
- 双刃剑:能力下放意味着滥用风险也下放
### 9.2 递归身份映射的价值
Maigret 的真正差异化不是"3,100+ 站点"(Snoop 付费版更多),而是**递归搜索**:
- 从用户名 A → 找到平台 X 的账户 → 提取链接 → 发现用户名 B → 在更多平台搜索 B
- 这种**网络效应**意味着初始输入(一个用户名)的产出随递归深度指数增长
### 9.3 AI 只是锦上添花
`--ai` 模式是典型的**AI 包装(AI Wrapping)**:
- 核心逻辑仍是 2020 年就成熟的异步 HTTP 检查
- AI 只是在最后把 JSON 结果翻译成自然语言摘要
- 这不是"AI 私家侦探",而是"私家侦探 + AI 写报告助手"
### 9.4 数据质量 > 算法
在 OSINT 领域,**站点数据库的质量和新鲜度**比算法更重要:
- 3,100 个站点中如果有 30% 检测逻辑失效,结果可信度暴跌
- Maigret 的 `--self-check` 和社区贡献机制是保持数据质量的关键
- 商业版本的价值恰恰在于"每日更新的私有数据库"
---
## 十、生态集成与扩展
### 10.1 MCP Server
Maigret MCP Server 把 OSINT 能力注入 AI 工作流:
- 229,409+ 次浏览(mcp.directory)
- 支持 Cursor、Claude Desktop、VS Code
- Docker 化执行,内置安全保护
### 10.2 集成工作流示例
```
用户输入可疑用户名
↓
Maigret 枚举所有平台存在性
↓
socid_extractor 解析 profile 信息
↓
递归搜索关联用户名
↓
生成网络图(D3 graph)
↓
AI 模式总结关键发现
↓
输出结构化报告(HTML/PDF)
```
### 10.3 Telegram Bot
社区维护的无安装方案:直接发送用户名给机器人,返回结果。
---
## 参考来源
1. Maigret GitHub 仓库:https://github.com/soxoj/maigret
2. 官方文档:https://maigret.readthedocs.io
3. PyPI:https://pypi.org/project/maigret
4. ExplainX 深度解析:https://explainx.ai/blog/maigret-osint-username-soxoj-open-source-2026
5. WhatsMyName App 对比:https://whatsmynameapp.us/tools/osint
6. Maigret vs Sherlock 对比:https://footprintiq.app/compare/maigret-vs-sherlock
7. OSINT 工具全景:https://github.com/soxoj/osint-namecheckers-list
8. Maigret MCP Server:https://mcp.directory/servers/maigret-osint
9. Police1 执法应用:https://www.police1.com/investigations/3-osint-tools-every-officer-should-master-now
10. Apify Actor:https://apify.com/ntriqpro/maigret-actor
#AI工具 #OSINT #网络安全 #开源情报 #数字身份 #社工 #小凯
登录后可参与表态
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。
领取 2000万 Tokens
通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力