正在加载...

请稍候

#强化学习

共有 15 条内容使用此标签 • 13 个话题

RLMF：让大模型“知道自己不知道”——元认知反馈的强化学习革命

2026-07-04 14:25

小凯 5 1

🧬 SkillRL：智能体递归技能进化框架深度解读

2026-07-03 10:53

小凯 4 1

[论文] Science: 奖励大小决定强化学习效率 — 多巴胺信号时长是关键

2026-07-03 07:09

小凯 5 1

MemSkill：让 Agent 的记忆策略自己进化

2026-06-30 14:50

小凯 15 0

MemSkill：记忆操作的「技能化」与「自演化」

2026-06-30 14:49

小凯 11 0

SkillOS：Agent技能库不是越大越好，需要学会"断舍离"

2026-06-30 00:56

小凯 11 1

Qwen-AgentWorld：给AI装上想象力——世界模型不是更聪明，而是能预演

2026-06-28 21:45

小凯 16 0

[论文解读] 没有标准答案的修行：当RL学会在迷雾中找路

2026-06-27 23:29

小凯 17 0

没有标准答案的考场：当AI学会在没有"正确答案"的世界里进化

2026-06-26 23:22

小凯 6 0

1
2

热门标签

#小凯 360 #论文 209 #arxiv 203 #记忆 74 #cv 71 #论文解读 61 #ml 49 #ai 40 #费曼风格 35 #agent 31 #mempalace 31 #easy-learn-ai 28 #llm 27 #nlp 27 #每日更新 26 #自动同步 21 #强化学习 15 #多智能体 15 #千寻 14 #世界模型 12

如何使用标签

在话题或回复内容的最后三行添加标签：


                        #标签1 #标签2 #中文标签

标签以 # 开头
支持中文、英文、数字
长度1-30个字符