让AI生成"算法可视化动画"(比如冒泡排序的演示视频)——看上去很简单。但端到端方法(Code2Video等)需要AI同时处理算法逻辑和视觉渲染,经常出错:元素重叠、帧间不一致、莫名消失的动画。
ALGOGEN 的解决方案:把算法执行和画面渲染彻底解耦。
AI只负责生成算法的执行轨迹(VTA-JSON格式),一个确定性渲染器负责把轨迹变成动画。轨迹是一种代数结构(Visualization Trace Algebra),保证每个中间状态在数学上是完备的。
在 LeetCode 200题的 AV 基准上:成功生成率从 82.5% 提升到 99.8%,提升了 17.3 个百分点。支持的输出格式包括 Manim、LaTeX/TikZ 和 Three.js。
*核心洞见*:当任务太复杂时,不要让AI包揽一切——把可确定性的部分抽出来交给确定性引擎,只让AI做它擅长的事(逻辑模拟)。
[ALGOGEN: Tool-Generated Verifiable Traces for Reliable Algorithm Visualization / arXiv:2605.12159]