LLM

AI的“知识僵化症”有救了?揭秘MIT自适应大模型SEAL

麻省理工学院(MIT)的一项开创性研究,为我们揭示了这场进化的具体路径。他们推出了一个名为 **SEAL (Self-Adapting Large Language Models,自适应大语言模型)** 的框架。这套框架首次赋予了AI模型一种前所未有的能力:它们可以“自己教自己”,通过生成和应用自己的学习材料,来持续进化其内部的知识体系。

4 标签
#SEAL #self-adaptive #llm +1
2606 字 11 分钟
阅读全文

Verbalized Sampling: 言语采样提升模型多样性

Verbalized Sampling: 言语采样提升模型多样性

5 标签
#LLM #Prompt #Mode Collapse +2
2038 字 9 分钟
阅读全文

Meta: 提示词对决优化器 (PDO)

这篇由Meta和宾夕法尼亚州立大学的研究者发布的论文提出了一种创新的、无需人工标注数据的提示词优化方法。

4 标签
#LLM #Prompt #Prompt Optimization +1
1065 字 5 分钟
阅读全文

强化学习的奠基人的惊人警告:为什么说LLM可能是一条死胡同?

强化学习的奠基人惊人警告:为什么说LLM可能是一条死胡同?

6 标签
#AI #Richard Sutton #LLM +3
4043 字 17 分钟
阅读全文

Gemini 2.5 Pro 在 IMO 2025 中的高级数学推理能力评估

Gemini 2.5 Pro 在 IMO 2025 数学奥林匹克竞赛中的高级数学推理能力评估

4 标签
#IMO #LLM #数学推理 +1
2442 字 10 分钟
阅读全文

Context Engineering

Context Engineering 是大型语言模型(LLM)应用中的系统性技术,旨在通过动态构建、管理和优化输入模型的信息负载(包括指令、记忆、工具输出、外部知识等),提升模型在复杂任务中的性能、稳定性和可靠性。

3 标签
#Context Engineering #LLM #AI
4026 字 17 分钟
阅读全文

Reflect, Retry, Reward: 大型语言模型的自我进化新范式

Reflect, Retry, Reward: 大型语言模型的自我进化新范式

3 标签
#Reflect, Retry, Reward #LLM #training
2385 字 10 分钟
阅读全文

Llama 4 模型系列

本文介绍了Llama 4 模型系列详细解读。

4 标签
#AI #Llama #LLM +1
7603 字 31 分钟
阅读全文

DeepSeek 开源 LLM 对闭源 LLM 的影响

本文介绍了DeepSeek开源LLM对闭源LLM的影响,包括性能基准测试和竞争、成本效益、开源可用性和定制、市场动态和战略转变、创新与社区发展、环境影响以及AI研究和应用的转变。

5 标签
#AI #DeepSeek #开源 +2
2118 字 9 分钟
阅读全文