损失函数

> 机器学习模型训练的核心优化目标

ConceptIntroduction - index

LOSS 是什么？
简单说，LOSS 就是模型在微调过程中犯错误的"程度"的评分，它是一个数字。
LOSS 是一个可微的数学函数
量化模型预测与真实值的误差
输出为标量数值
值越大表示错误越大
怎么算出来的？
模型对数据做预测，然后把预测结果和正确答案进行对比计算。
模型输出预测结果
与真实标签对比
使用数学公式计算差异
常见公式：MSE、交叉熵等
微调时用它干什么？
微调的核心目标就是让模型少犯错，所以要想办法让 LOSS 变得越来越小。
作为优化目标
指导参数更新方向
评估训练效果
决定何时停止训练
怎么变小？
通过梯度下降算法调整模型参数，根据 LOSS 计算出参数更新方向。
计算LOSS对参数的梯度
沿梯度反方向更新参数
使用学习率控制更新幅度
重复迭代直到收敛
简单说，LOSS 就是模型在微调过程中犯错误的
概念介绍组件
使用卡片式布局和动画效果逐步介绍
的基本概念
是什么？
简单说，
就是模型在微调过程中犯错误的"程度"的评分，它是一个数字。
是一个可微的数学函数
常见公式：
交叉熵等
微调的核心目标就是让模型少犯错，所以要想办法让
变得越来越小。
通过梯度下降算法调整模型参数，根据
计算出参数更新方向。
对参数的梯度
标题区域
损失函数）是机器学习中的核心概念，它衡量模型预测与真实值的差距
概念卡片
关键要点总结
关键要点
模型改进
持续迭代优化参数
最终目标是最小化误差

GradientDescentAnimation - index

简单的二次函数作为LOSS函数：(x - 0.3)^2 + 0.1
计算梯度（导数）
生成LOSS函数曲线数据
边界检查
检查收敛
梯度下降动画组件
可视化展示梯度下降算法如何通过迭代降低
简单的二次函数作为
函数曲线数据
梯度下降可视化
观察算法如何逐步找到
函数的最小值
控制面板
播放控制
学习率调整
状态信息
迭代次数
当前位置
当前梯度
收敛完成！
算法已找到最优解
可视化区域
函数与优化路径
坐标轴标签
函数曲线
优化路径
梯度箭头
梯度方向
最优点标记
算法解释
梯度下降原理
计算当前位置的梯度（斜率）
沿梯度反方向移动
移动距离由学习率控制
重复直到收敛到最小值
学习率影响
学习率过大：可能跳过最优解
学习率过小：收敛速度慢
合适的学习率：稳定快速收敛
需要根据问题调整参数

InteractiveDemo - index

生成可视化数据
MSE (均方误差)
(预测值 - 真实值)²
MAE (平均绝对误差)
|预测值 - 真实值|
平滑的绝对误差
Huber Loss
交互式演示组件
让用户通过调整参数来观察
的计算过程和变化
均方误差
平均绝对误差
调整参数，实时观察
的计算过程
控制面板
参数调整
类型选择
函数类型
预测值调整
模型预测值
真实值调整
计算结果
可视化区域
函数可视化
坐标轴标签
真实值垂直线
预测值点
解释文本
理解图表
曲线显示了不同预测值对应的
大小。当预测值接近真实值时，
误差大小

LossVisualization - index

训练 LOSS
验证 LOSS
正常训练
LOSS稳定下降，训练效果良好
训练LOSS下降但验证LOSS上升
不稳定训练
LOSS剧烈波动，学习率可能过大
学习停滞
LOSS下降后趋于平缓
重新开始
开始训练
训练轮数 (Epoch)
LOSS 值
可视化组件
展示动态的
变化曲线图，支持不同训练场景的模拟
稳定下降，训练效果良好
下降但验证
剧烈波动，学习率可能过大
下降后趋于平缓
变化可视化
观察不同训练场景下的
变化趋势
控制面板
训练轮数
场景选择
图表区域
变化曲线
当前场景
图表说明
图表解读
轴表示训练轮数（
数值大小
曲线向下表示模型在改进
平缓区域表示收敛
理想状态
稳定下降
无剧烈波动
最终趋于平缓
训练验证

MistakesSection - index

LOSS曲线漂亮 ≠ 模型效果好
LOSS稳定下降只能说明训练过程正常，不代表模型在真实数据上表现好
训练LOSS很小，但验证LOSS很大（过拟合）
模型在训练集上表现完美，在测试集上表现糟糕
LOSS曲线平滑下降，但模型无法泛化到新数据
只关注LOSS数值大小
不同任务的LOSS数值范围差异很大，应该关注变化趋势而不是绝对值
分类任务LOSS通常在0-10之间
回归任务LOSS可能在0-1000之间
不同的LOSS函数数值范围不同
LOSS波动就是训练失败
适度的LOSS波动是正常的，特别是在训练初期，关键是整体趋势
批次间的随机性会导致正常波动
学习率调整会引起短期波动
数据增强可能增加LOSS波动
追求LOSS越小越好
过度追求小的LOSS可能导致过拟合，需要在训练和泛化之间找平衡
训练时间过长可能导致过拟合
模型复杂度过高会记住噪声
需要使用早停、正则化等技术
训练轮数
训练LOSS
验证LOSS
分类LOSS
回归LOSS
正常训练
波动训练
常见误区组件
使用中的常见误区和注意事项
曲线漂亮
模型效果好
稳定下降只能说明训练过程正常，不代表模型在真实数据上表现好
很小，但验证
很大（过拟合）
曲线平滑下降，但模型无法泛化到新数据
数值大小
不同任务的
数值范围差异很大，应该关注变化趋势而不是绝对值
分类任务
回归任务
函数数值范围不同
波动就是训练失败
波动是正常的，特别是在训练初期，关键是整体趋势
数据增强可能增加
越小越好
过度追求小的
可能导致过拟合，需要在训练和泛化之间找平衡
常见误区与注意事项
避免这些误区，正确理解和使用
误区选择面板

index

LOSS是什么
动态图表
交互演示
梯度下降
常见误区
顶部导航
学习平台
主内容区域

---

#EasyAI #AI教学 #教程

📚 Easy AI教程 | 损失函数

损失函数

ConceptIntroduction - index

GradientDescentAnimation - index

InteractiveDemo - index

LossVisualization - index

MistakesSection - index

index

🌟 智谱 GLM-5 已上线