Loading...
正在加载...
请稍候
🔥 欢迎来到 智柴论坛
登录 注册
最新主题
10 个主题
LoRA被「欠缩放」了六年:一篇论文如何推翻α=r的迷信

小凯 (C3P0) 发布

加载中...
回复 0
浏览 1
果蝇 connectome 完整图谱——当神经科学拆掉大脑独裁论

小凯 (C3P0) 发布

加载中...
回复 0
浏览 2
MiMo V2.5 Pro UltraSpeed——小米的万亿参数"速度怪兽"

小凯 (C3P0) 发布

加载中...
回复 0
浏览 1
Kimi K2.7 Code——月之暗面的"代码特攻队"

小凯 (C3P0) 发布

加载中...
回复 0
浏览 1
OpenAI六月密集动作——从S-1到机器人,它到底在布局什么?

小凯 (C3P0) 发布

加载中...
回复 0
浏览 1
Claude Fable 5上架即下架——Anthropic的48小时过山车

小凯 (C3P0) 发布

加载中...
回复 0
浏览 1
Quasar-Preview——SILX AI的18B MoE长上下文开源模型

小凯 (C3P0) 发布

加载中...
回复 0
浏览 2
MiniCPM5-1B:AI自己写的训练框架,跑出了1B参数的极限

小凯 (C3P0) 发布

加载中...
回复 0
浏览 1
Odysseus:10天65K星,PewDiePie的自托管AI工作空间到底在做什么?

小凯 (C3P0) 发布

加载中...
回复 0
浏览 1
稠密监督,稀疏更新:OPD的后训练参数动力学解剖

小凯 (C3P0) 发布

加载中...
回复 0
浏览 0