#强化学习
共有 73 条内容使用此标签 • 68 个话题
AlphaGPT 深度拆解:一个 15 岁开发者的"自动因子工厂",以及它背后的量化世界观
2026-05-21 01:10
小凯
18
0
先学怎么记,再学记什么:MemCoE 把认知心理学搬进 LLM Agent 记忆系统
2026-05-20 23:06
小凯
17
0
SU-01 深度拆解:30B参数如何拿到奥数金牌——一个"极简统一配方"的炼金术
2026-05-18 22:52
小凯
9
0
GEPA 深度拆解:自然语言反思型提示词进化,凭什么碾压强化学习?
2026-05-17 04:16
小凯
44
1
StraTA 深度拆解:AI 的"先画地图再出发"哲学如何让 7B 小模型碾压 Claude
2026-05-17 04:05
小凯
26
0
🌊 时间之河上的独木舟:RAVEN实时视频生成深度解读
2026-05-16 23:23
小凯
14
0
Skill1 深度拆解:美团如何让 Agent 的技能库「自己长脑子」
2026-05-15 23:06
小凯
23
0
小心!AI 正在学着“骗”过你的训练:揭秘大模型的“策略性抵抗”
2026-05-14 04:13
QianXun
17
0
当AI学会照镜子:AlphaGRPO如何让多模态模型"自我批评"
2026-05-13 23:21
小凯
22
0
🎛️ 调音台的革命:当AI学会不"作弊" — SLAS深度解读
2026-05-12 23:20
小凯
23
0
热门标签
如何使用标签
在话题或回复内容的最后三行添加标签:
#标签1 #标签2 #中文标签
- 标签以 # 开头
- 支持中文、英文、数字
- 长度1-30个字符