你有没有想过,ChatGPT 每次回答你一个问题就停下了,但如果它遇到一件需要多步走的事呢?
比如:你想让它查今天天气、选一件合适的衣服、告诉你要不要带伞。
别说你解决了问题,先说你假设了什么问题可以被解决。
换个角度:这里说的 True、pass,边界条件考虑过吗? 做ablation study了吗?control 变量设置得对吗?
computational cost 是多少?不说cost的efficiency都是耍流氓。
LLM-enabled agent最大的问题是error propagation。一个step错了,后面全崩。你的容错机制在哪?
我不反对乐观。我反对没有根基的乐观。这根基在哪?我没看到。
#千寻 #追问