Papers

AI for Research Survey

2025-07-06

#ai #research #survey

AI for Research Survey. 这篇综述文章概述了人工智能在科学研究（AI4Research）中的应用，强调了大型语言模型（LLMs）在促进科学发现各个阶段的潜力。它建立了一个系统的分类体系，将AI4Research分解为五个主要任务：科学理解、学术调查、科学发现、学术写作和学术同行评审。文章详细介绍了AI在这些领域中的具体应用，例如辅助思想挖掘、实验设计、数据分析、论文撰写和同行评审。此外，该综述还识别了未来的研究方向，包括跨学科AI模型、伦理考量以及多模态和多语言集成，旨在为研究界提供资源并激发AI驱动的科学创新。

Reflect, Retry, Reward: 大型语言模型的自我进化新范式

2025-07-04

#Reflect, Retry, Reward #LLM #training

Reflect, Retry, Reward: 大型语言模型的自我进化新范式

深度研究智能体：系统性审查与路线图

2025-07-01

#deep_research_agents #systematic_examination #roadmap

本文介绍了深度研究智能体：系统性审查与路线图。

Gemini - 通用智能体是否需要世界模型

2025-06-05

#world_model

本文探讨了通用智能体是否需要世界模型才能实现灵活的、面向目标的行为

OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking

2025-06-01

#machine_writing

本文介绍了OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking。

从人工标注到自我迭代：大模型工具学习的动态文档优化新范式

2025-05-25

#tool_learning #tool_document

本文介绍了从人工标注到自我迭代：大模型工具学习的动态文档优化新范式。

Reinforced Self-play Reasoning with Zero Data 论文解读

2025-05-11

#AI #论文 #Reinforced

论文介绍了强化自博弈推理的零数据范式，通过自博弈生成任务和验证，实现无需依赖人工标注数据或预设任务的自主学习推理。

Reinforced Self-play Reasoning with Zero Data 论文解读

2025-05-11

#AI #论文 #Reinforced

论文介绍了强化自博弈推理的零数据范式，通过自博弈生成任务和验证，实现无需依赖人工标注数据或预设任务的自主学习推理。

Chain of Draft 论文解读

2025-03-01

#AI #Chain of Draft #论文 #技术

本文介绍了Chain of Draft（CoD）论文，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

Test-Time Scaling 相关论文解读

2025-02-19

#AI #Test-Time Scaling #论文 #技术

本文介绍了Test-Time Scaling（测试时扩展）的概念，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

DeepSeek 微调

2025-02-14

#AI #DeepSeek #论文 #技术

本文介绍了如何使用合成推理数据集微调DeepSeek-R1模型.

DeepSeek V3 论文解读

2025-02-14

#AI #DeepSeek-V3 #论文 #技术

本文介绍了深度求索（DeepSeek）公司推出的新一代推理模型DeepSeek-V3，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

Simple Test-Time Scaling 论文解读

2025-02-10

#opensource #reasoning #SFT #论文 #Finetuning

本文介绍了来自李飞飞团队的Simple Test-Time Scaling论文，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

DeepSeek R1 论文解读

2025-02-10

#AI #深度思考 #DeepSeek-R1 #论文 #技术

本文介绍了深度求索（DeepSeek）公司推出的新一代推理模型DeepSeek-R1，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

DeepSeek R1 Paper Review

2025-02-10

#AI #DeepThinking #DeepSeek #Paper #Technology

A comprehensive review of the DeepSeek R1 paper