Reflect, Retry, Reward

Reflect, Retry, Reward: 大型语言模型的自我进化新范式

Reflect, Retry, Reward: 大型语言模型的自我进化新范式

3 标签
#Reflect, Retry, Reward #LLM #training
2385 字 10 分钟
阅读全文