Efficient Lifelong Learning for LLMs
ELLA 通过各向异性收缩算子(Anisotropic Shrinkage Operator)限制干扰,实现稳定性与可塑性的平衡。
还没有人回复