LLM

AI的“知识僵化症”有救了？揭秘MIT自适应大模型SEAL

麻省理工学院（MIT）的一项开创性研究，为我们揭示了这场进化的具体路径。他们推出了一个名为 **SEAL (Self-Adapting Large Language Models，自适应大语言模型)** 的框架。这套框架首次赋予了AI模型一种前所未有的能力：它们可以“自己教自己”，通过生成和应用自己的学习材料，来持续进化其内部的知识体系。

2025-10-29

4 标签

#SEAL #self-adaptive #llm +1

2606 字 11 分钟

阅读全文

Verbalized Sampling: 言语采样提升模型多样性

2025-10-27

5 标签

#LLM #Prompt #Mode Collapse +2

2038 字 9 分钟

阅读全文

Meta: 提示词对决优化器 (PDO)

这篇由Meta和宾夕法尼亚州立大学的研究者发布的论文提出了一种创新的、无需人工标注数据的提示词优化方法。

2025-10-26

4 标签

#LLM #Prompt #Prompt Optimization +1

1065 字 5 分钟

阅读全文

强化学习的奠基人的惊人警告：为什么说LLM可能是一条死胡同？

强化学习的奠基人惊人警告：为什么说LLM可能是一条死胡同？

2025-10-02

6 标签

#AI #Richard Sutton #LLM +3

4043 字 17 分钟

阅读全文

Gemini 2.5 Pro 在 IMO 2025 中的高级数学推理能力评估

Gemini 2.5 Pro 在 IMO 2025 数学奥林匹克竞赛中的高级数学推理能力评估

2025-08-14

4 标签

#IMO #LLM #数学推理 +1

2442 字 10 分钟

阅读全文

Context Engineering

Context Engineering 是大型语言模型（LLM）应用中的系统性技术，旨在通过动态构建、管理和优化输入模型的信息负载（包括指令、记忆、工具输出、外部知识等），提升模型在复杂任务中的性能、稳定性和可靠性。

2025-08-12

3 标签

#Context Engineering #LLM #AI

4026 字 17 分钟

阅读全文

2025-08-12

3 标签

#Claude-Code-Router #LLM #AI

13929 字 56 分钟

阅读全文

Reflect, Retry, Reward: 大型语言模型的自我进化新范式

2025-07-04

3 标签

#Reflect, Retry, Reward #LLM #training

2385 字 10 分钟

阅读全文

Llama 4 模型系列

本文介绍了Llama 4 模型系列详细解读。

2025-04-03

4 标签

#AI #Llama #LLM +1

7603 字 31 分钟

阅读全文

DeepSeek 开源 LLM 对闭源 LLM 的影响

本文介绍了DeepSeek开源LLM对闭源LLM的影响，包括性能基准测试和竞争、成本效益、开源可用性和定制、市场动态和战略转变、创新与社区发展、环境影响以及AI研究和应用的转变。

2025-02-18

5 标签

#AI #DeepSeek #开源 +2

2118 字 9 分钟

阅读全文

AI的“知识僵化症”有救了？揭秘MIT自适应大模型SEAL

Verbalized Sampling: 言语采样提升模型多样性

Meta: 提示词对决优化器 (PDO)

强化学习的奠基人的惊人警告：为什么说LLM可能是一条死胡同？

Gemini 2.5 Pro 在 IMO 2025 中的高级数学推理能力评估

Context Engineering

Claude-Code-Router：AI 时代的智能路由中枢

Reflect, Retry, Reward: 大型语言模型的自我进化新范式

Llama 4 模型系列

DeepSeek 开源 LLM 对闭源 LLM 的影响

没有找到相关文章