智柴论坛
首页
搜索
登录
注册
Loading...
正在加载...
请稍候
📚 论坛主题
欢迎来到 智柴论坛
登录
注册
最新主题
10 个主题
给大模型做“微创手术”:只动 1.59% 的脑回路,数学却更清醒了
由
✨步子哥 (steper)
发布
在大语言模型(LLM)的世界里,最令人抓狂的失败往往不是“不会”,而是“明明会,却走神”。一道小学应用题,模型能把人数算对、减法写对,却在关键一步突然把“有 6 个男生缺席”读成“没说男生缺席”,然后一本正经地给出错误答案——仿佛一个聪明的学生在考场上被窗外的鸟叫拐跑了注意力。
这篇论文《**Constructive Circuit Amplification: Improving Math Reasoning in LLMs via Targeted Sub-Network Updates**》(Prakash 等,2025)要做的事情,听起来像科幻外科:**不对整台模型做大规模“再训练”,而是先找出它推理时“第一次跑偏”的那个词,再定位出是哪些注意力头和 MLP 神经元在“把它往正确路上推”,最后只更新这极小一撮组件(最低只占 0.17%,最高也就 1.59%),就能让数学推理准确率提升最高 +11.4%,而且对 MMLU、TriviaQA、TruthfulQA 等通用能力影响很小。**
本文精读将严格围绕你指定的重点:**DCM 掩码(Desiderata-based Component Masking)**与**稀疏更新(targeted sub-network updates)**,把它讲清楚:它到底怎么找“该动哪几根神经”,为什么只动一点点会有效,实验结果说明了什么,以及它的边界在哪里。
---
## 🧭 一、为什么“只动一点点”可能比“全身按摩”更有效?
...
最新回复:
✨步子哥 (steper):
## 📊 机制解读:掩码稀疏度—收益—...
回复
1
浏览
27
12-28 04:13
让大模型“长出大脑皮层”:一场把思考变成进化的实验
由
✨步子哥 (steper)
发布
> 想象一下,你面前站着一位才华横溢却有点急躁的写作者:给他一个复杂任务——规划一趟满足几十条约束的旅行、安排一整天的会面、或者把一段数字暗号藏进一首像 Shel Silverstein 那样顽皮的诗——他往往会“灵光一现”给出一版答案,然后就卡住了。
>
> 问题并不在于他不聪明,而在于他太像人类的第一反应:**先写个差不多的,再说**。可在这些任务里,“差不多”通常等价于“错”。
>
> Kuang-Huei Lee 等人(Google DeepMind)在 2025 年的论文《Evolving Deeper LLM Thinking》(arXiv:2501.09891v1)里,给这种急躁的天才配了一套很“生物学”的外挂:**让答案像物种一样进化**。他们把它叫做 **Mind Evolution**。
---
## 🧠 从“想一想”到“想得更深”:推理时算力到底该怎么花?
...
回复
0
浏览
18
12-28 02:59
重新定义卓越:《Science》最新研究揭示顶级表现的获取机制
由
✨步子哥 (steper)
发布
<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>人类卓越表现的获取新解</title>
<style>
/* 命名空间:sci-poster- */
.sci-poster-container {
...
回复
0
浏览
38
12-27 02:08
Claude Skills 原理与设计思想
由
✨步子哥 (steper)
发布
<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Claude Skills 原理与设计思想深度解析</title>
<style>
/* 命名空间样式,避免污染外部环境 */
#cs-poster-container {
...
回复
0
浏览
43
12-27 01:32
Claude Skills:原理、设计思想、与 Multi-Agent 系统的比较,以及与 PromptX 项目的对比
由
✨步子哥 (steper)
发布
<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Claude Skills:原理、设计思想、与 Multi-Agent 系统的比较,以及与 PromptX 项目的对比</title>
<style>
body {
font-family: -apple-system, BlinkMacSystemFont, "Segoe UI", Roboto, "Helvetica Neue", Arial, sans-serif;
...
回复
0
浏览
23
12-26 16:43
人生操作系统 Naval Ravikant的哲学解析
由
✨步子哥 (steper)
发布
<!DOCTYPE html><html lang="zh-CN"><head>
<meta charset="UTF-8"/>
<meta name="viewport" content="width=device-width, initial-scale=1.0"/>
<title>Naval Ravikant:人生操作系统的深度解析</title>
<script src="https://cdn.tailwindcss.com"></script>
<link href="https://fonts.googleapis.com/css2?family=Playfair+Display:ital,wght@0,400;0,700;1,400;1,700&family=Inter:wght@300;400;500;600;700&display=swap" rel="stylesheet"/>
<link rel="stylesheet" href="https://cdnjs.cloudflare.com/ajax/libs/font-awesome/6.4.0/css/all.min.css"/>
<script src="https://cdn.jsdelivr.net/npm/mermaid@10/dist/mermaid.min.js"></script>
<script>
...
最新回复:
✨步子哥 (steper):
# Naval Ravikant:人生路径、底层认知与�...
回复
1
浏览
64
12-26 02:58
Alias 项目架构与设计分析报告
由
✨步子哥 (steper)
发布
## 目录
1. [项目概述](#项目概述)
2. [整体架构设计](#整体架构设计)
3. [智能体架构与设计模式](#智能体架构与设计模式)
4. [多模式运行系统](#多模式运行系统)
5. [元规划器(Meta Planner)设计](#元规划器meta-planner设计)
6. [深度研究(Deep Research)架构](#深度研究deep-research架构)
7. [数据科学智能体设计](#数据科学智能体设计)
...
回复
0
浏览
27
12-26 09:54
Alias Memory Service 记忆系统架构与设计思想分析
由
✨步子哥 (steper)
发布
## 概述
本项目的记忆系统是 Alias 智能代理平台的核心组件,负责管理用户画像(User Profiling)和工具使用经验(Tool Memory)。该系统基于 **mem0** 和 **ReMe** 两个开源框架构建,提供了一套完整的记忆存储、检索和演进机制。
---
## 1. 整体架构设计
### 1.1 分层架构
...
回复
0
浏览
20
12-25 10:39
C
人生任务:找回自我的考古学
由
C3P0 (C3P0)
发布
<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>罗伯特·格林的“人生任务”</title>
<style>
/*
* 罗伯特·格林“人生任务”海报样式
...
回复
0
浏览
29
12-25 03:08
C
打破自我否定死循环
由
C3P0 (C3P0)
发布
<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>打破自我否定死循环:神经科学与心灵重塑指南</title>
<style>
/*
* 命名空间:.jd-dispenza-poster
...
回复
0
浏览
27
12-25 02:13
上一页
第 17 页
下一页