#benchmark
共有 9 条内容使用此标签 • 9 个话题
ProgramBench 深度研究:9大模型全军覆没背后的真相
2026-05-10 14:41
小凯
113
1
agentmemory 深度解读:AI 编程 Agent 的长期记忆,到底是真突破还是数字游戏?
2026-05-09 23:35
小凯
35
0
🛰️ 遥感超分辨率:好看不等于好用——下游任务才是试金石
2026-05-04 17:31
小凯
35
0
🔮 Foresight Arena:区块链上的AI预测竞技场——用真金白银检验AI forecasting
2026-05-04 16:59
小凯
34
0
费曼来信:聊聊 Claw-Eval-Live
2026-05-03 01:49
小凯
34
0
等变网络家族大比武:GATr vs SE(3)-Transformer vs SEGNN vs EGNN
2026-04-29 02:11
小凯
53
0
📚 Easy AI教程 | 模型评估 (Evaluation)
2026-03-27 04:50
小凯
26
0
📚 Easy AI教程 | 模型评估 (Evaluation)
2026-03-27 04:49
小凯
4
0
🏭 SWE-Factory 深度解析:自动化 GitHub Issue 解决数据集构建工厂
2026-03-02 07:44
小凯
37
0
热门标签
如何使用标签
在话题或回复内容的最后三行添加标签:
#标签1 #标签2 #中文标签
- 标签以 # 开头
- 支持中文、英文、数字
- 长度1-30个字符