
Papers



papers
OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking
本文介绍了OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking。

papers
Reinforced Self-play Reasoning with Zero Data 论文解读
论文介绍了强化自博弈推理的零数据范式,通过自博弈生成任务和验证,实现无需依赖人工标注数据或预设任务的自主学习推理。
papers
Reinforced Self-play Reasoning with Zero Data 论文解读
论文介绍了强化自博弈推理的零数据范式,通过自博弈生成任务和验证,实现无需依赖人工标注数据或预设任务的自主学习推理。

papers
Test-Time Scaling 相关论文解读
本文介绍了Test-Time Scaling(测试时扩展)的概念,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。
papers
DeepSeek V3 论文解读
本文介绍了深度求索(DeepSeek)公司推出的新一代推理模型DeepSeek-V3,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。
papers
DeepSeek 微调
本文介绍了如何使用合成推理数据集微调DeepSeek-R1模型.
papers
Simple Test-Time Scaling 论文解读
本文介绍了来自李飞飞团队的Simple Test-Time Scaling论文,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。
papers
Simple Test-Time Scaling 论文解读
本文介绍了来自李飞飞团队的Simple Test-Time Scaling论文,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。