AI

Agentic设计模式:Agentic RAG

Agentic RAG模式是基础检索增强生成(RAG)模式的**高级演进**,它在传统的检索-生成流程中**嵌入了推理和决策层**(即智能体),从而将 RAG 从一个被动的数据管道转变为一个**主动的问题解决框架**。它显著提升了信息提取的**可靠性和深度**。

5 标签
#AI #Agentic RAG #设计模式 +2
3 分钟
阅读全文

Agentic设计模式:Reflection

Reflection模式为智能体增加了一个**自我评估和迭代改进的层次**,使其能够对其自身的工作、输出或内部状态进行批判性审查,并利用评估结果来提升性能或优化响应。

5 标签
#AI #Reflection #设计模式 +2
4 分钟
阅读全文

Agentic设计模式:ReAct

ReAct设计模式将智能体的行为结构化为**显式的推理循环**,将思维链(CoT)推理与智能体的工具交互结合起来,让智能体在思考和行动之间交替进行,从而实现复杂、自适应的问题求解。

5 标签
#AI #ReAct #设计模式 +2
5 分钟
阅读全文

Cursor 2.0 重大更新:AI 编程的新纪元

深入解析 Cursor 2.0 的重大更新,包括 Composer 模型、多代理并行、多模型同时处理同一任务、全新界面设计等革命性功能

5 标签
#Cursor #AI #coding_assistant +2
4851 字 20 分钟
阅读全文

DeepSeek-OCR:重塑AI长文本处理

本文介绍了DeepSeek-OCR,一种革命性的AI模型,能够将长文本处理效率提升数十倍,从而实现对超长文档的快速处理。

4 标签
#AI #DeepSeek #OCR +1
4014 字 17 分钟
阅读全文

Jason Wei在各个场合的观点

Jason wei在各个场合的观点

2 标签
#AI #Jason wei
1080 字 5 分钟
阅读全文

Agent训练新范式:Agent Learning via Early Experience

传统AI训练像是把人类所有的知识都强行灌输AI,而Meta的最新论文《Agent Learning via Early Experience》为我们展示了一条训练AI智能体的新路径: 可扩展、无需奖励的实用范式,通过将智能体自身的行为和结果转化为强大的监督信号,显著提升了AI的性能、数据效率和泛化能力。

5 标签
#AI #Meta #Agent +2
2852 字 12 分钟
阅读全文

AI Context Engineering领域若干重要论文

这里将收集Context Engineering相关的重要文献,具体解读将在其他博客展开。

3 标签
#Context Engineering #Agent #AI
1188 字 5 分钟
阅读全文

小模型逆袭:秘密武器竟是给AI一本不断变厚的“攻略”

该论文介绍了一个名为 ACE(Agentic Context Engineering,代理上下文工程) 的框架,该框架旨在通过演化上下文而非微调模型权重的方式,实现大型语言模型(LLMs)的自我改进。ACE将上下文视为不断累积、提炼和组织策略的 “演化剧本”,从而克服了现有上下文适应方法中存在的简洁性偏差和上下文崩溃等主要限制。通过使用 生成器、反射器和策展器 这三个代理组件,ACE实现了增量更新和“增长与提炼”机制,以保持详细的领域知识并提高可扩展性。实验结果表明,ACE在代理基准测试和金融等领域特定任务中显著优于现有基线方法,同时还能大幅降低适应的延迟和成本。

3 标签
#Agentic Context Engineering #ACE #AI
3430 字 14 分钟
阅读全文

RPG:从“对话”到“蓝图”,用图谱指导AI思考

RPG:从“对话”到“蓝图”,用图谱指导AI思考

3 标签
#AI #RPG #蓝图
4043 字 17 分钟
阅读全文

智谱AI(GLM)

智谱AI(GLM)产品线收集整理分析

3 标签
#AI #智谱AI #GLM
3152 字 13 分钟
阅读全文

强化学习的奠基人的惊人警告:为什么说LLM可能是一条死胡同?

强化学习的奠基人惊人警告:为什么说LLM可能是一条死胡同?

6 标签
#AI #Richard Sutton #LLM +3
4043 字 17 分钟
阅读全文

腾讯AI产品线收集

腾讯AI产品线收集整理分析

3 标签
#AI #腾讯 #产品线
1283 字 6 分钟
阅读全文
Meta颠覆代码AI:新模型CWM不只“读”代码,更能“执行”它

Meta颠覆代码AI:新模型CWM不只“读”代码,更能“执行”它

Meta发布的一项名为“代码世界模型”(Code World Model, CWM)的全新研究,正试图从根本上解决当前代码AI面临的一大痛点。

3 标签
#AI #代码 #世界模型
2221 字 9 分钟
阅读全文
Chrome DevTools MCP:让AI编程助手真正"看见"浏览器

Chrome DevTools MCP:让AI编程助手真正"看见"浏览器

Chrome DevTools MCP是谷歌基于模型上下文协议开发的服务器,它将Chrome浏览器的开发者工具能力开放给AI编码助手。

3 标签
#AI #Chrome DevTools #MCP
3868 字 16 分钟
阅读全文

AI的最终审判:为什么资本主义、GDP和人类智力都将在1000天内失效?

AI的最终审判:为什么资本主义、GDP和人类智力都将在1000天内失效?Emad Mostaque在“Tom Bilyeu”YouTube频道上的访谈,主要探讨了人工智能(AI)将如何从根本上颠覆全球经济。Mostaque认为,在不久的将来,AI不仅会取代大量人类工作,还会使资本主义和国内生产总值(GDP)等传统经济结构变得过时。他提出了一种新的**“心智”(M.I.N.D.)框架来衡量经济健康度,该框架关注物质资本、智能、网络效应和多样性,而不仅仅是GDP。他警告称,人类认知劳动的价值将变为负数,并提出需要重新定义货币和财富的流动方式**,例如通过新型数字资产,以应对AI驱动的生产力爆炸所带来的社会和经济动荡,并确保人类生存与发展。

4 标签
#AI #资本主义 #GDP +1
4958 字 20 分钟
阅读全文

马斯克的“加速”与“刹车”悖论:我们到底在把世界引向何处?

马斯克的“加速”与“刹车”悖论:我们到底在把世界引向何处?

4 标签
#AI #马斯克 #未来 +1
1926 字 8 分钟
阅读全文

Ray Dalio在各个场合的观点

Ray Dalio:在各个场合的观点

2 标签
#AI #Ray Dalio
2079 字 9 分钟
阅读全文

Agent 相关课程收集

AI Agents for Beginners - From MS

微软发布,11 节课,教授开始构建人工智能代理所需了解的一切知识

home page: …

4 标签
#AI #Agent #多模态 +1
29 字 1 分钟
阅读全文

Agent Lightning

介绍

微软开源的 Agent Lightning 项目,它的核心价值在于为开发者和研究者提供了一个强大的工具,用于训练和优化 AI Agent(智能代理),特别是几乎不需要修改现有 Agent 代码就能实现显著的性能提升。

这个项目有以下重 …

4 标签
#AI #Agent #强化学习 +1
1051 字 5 分钟
阅读全文

AI在商业中的现状2025

AI在商业中的现状2025:学习与转型的鸿沟 报告原文

TL.DR

  • 95% 的企业 GenAI 项目未见 ROI,根因在“不会学习”:系统缺少持久记忆、基于反馈的适配与持续改进。
  • 采用多、落地少:从试点到生产仅约 5% 成功;大企业上线需 …

3 标签
#AI #MIT #report
2325 字 10 分钟
阅读全文

阿里Wan开源大模型

Qwen Wan大模型是阿里云推出的一个通用大模型,旨在提供强大的语言理解和生成能力。

2025-08-27

Wan2.2-S2V开源发布! 一个专为电影级音频驱动角色动画设计的140亿参数模型。该模型旨在超越简单的“数字人”对话,提供达到 …

4 标签
#AI #大模型 #阿里 +1
280 字 2 分钟
阅读全文

AI Coding向CLI方向发展的深层次原因

AI编程工具正经历从图形化IDE向命令行界面(CLI)的重要转向。这一趋势在2025年尤其明显,各大科技巨头纷纷推出基于终端的AI编程助手。

5 标签
#AI #CLI #Coding +2
1669 字 7 分钟
阅读全文

MIT AI Do Anything

这门课程得到吴恩达的推荐,以下是关于MIT课程《如何用AI(几乎)做任何事》(How to AI (Almost) Anything)的详细信息整理,结合课程官网内容和公开资料,帮助你快速掌握核心内容与资源获取方式: 课程链接


📘 课程基 …

4 标签
#AI #MIT #多模态 +1
1034 字 5 分钟
阅读全文

Context Engineering

Context Engineering 是大型语言模型(LLM)应用中的系统性技术,旨在通过动态构建、管理和优化输入模型的信息负载(包括指令、记忆、工具输出、外部知识等),提升模型在复杂任务中的性能、稳定性和可靠性。

3 标签
#Context Engineering #LLM #AI
4026 字 17 分钟
阅读全文

Anthropic CEO Dario Amodei访谈

Dario Amodei访谈,AI从业者必读

4 标签
#AI #Dario Amodei #Anthropic +1
863 字 4 分钟
阅读全文

AudioLLM - 李沐亲自解说语音大模型训练的底层思路

李沐亲自解说语音大模型AudioLLM训练的底层思路

5 标签
#AI #AudioLLM #李沐 +2
3142 字 13 分钟
阅读全文

Geoffrey Hinton:2025 WAIC主题演讲《数字智能是否会取代生物智能》

Geoffrey Hinton在2025年世界人工智能大会上关于数字智能与生物智能对比的核心观点梳理

5 标签
#AI #Geoffrey Hinton #WAIC +2
977 字 4 分钟
阅读全文

Kimi-K2 简介和有意思的用法

本文介绍了MoonshotAI公司Kimi-K2模型简介和相关有意思的用法。

6 标签
#AI #Kimi #Kimi-K2 +3
3086 字 13 分钟
阅读全文

李飞飞博士的生平与洞见

李飞飞博士的生平与洞见

2 标签
#AI #李飞飞
4027 字 17 分钟
阅读全文

MiniMax-M1 模型技术报告

MiniMax-M1 模型技术报告

3 标签
#AI #MiniMax #M1
1713 字 7 分钟
阅读全文

MiniMax

MiniMax

2 标签
#AI #MiniMax
1184 字 5 分钟
阅读全文

Andrej Karpathy在各个场合的观点

Andrej Karpathy在各个场合的观点

2 标签
#AI #Andrej Karpathy
2296 字 10 分钟
阅读全文

Ilya Sutskever在各个场合的观点

Ilya Sutskever在各个场合的观点

2 标签
#AI #Ilya Sutskever
2732 字 11 分钟
阅读全文

SkyworkAI DeepResearchAgent

SkyworkAI DeepResearchAgent

3 标签
#AI #DeepResearchAgent #SkyworkAI
1006 字 5 分钟
阅读全文

Google I/O 2025 大会亮点

本文介绍了Google I/O 2025 大会亮点。

4 标签
#AI #google #google_io_2025 +1
2315 字 10 分钟
阅读全文

OpenEvolve - 开源进化算法项目

OpenEvolve相关开源项目和资源链接

4 标签
#开源 #进化算法 #AI +1
348 字 2 分钟
阅读全文

Qwen3 Tech Report解读

全方位解读Qwen3的论文技术报告

5 标签
#AI #Qwen3 #大模型 +2
4406 字 18 分钟
阅读全文

Agent经济:红杉资本2025 AI峰会释放的超级信号

Agent经济:红杉资本2025 AI峰会释放的超级信号

4 标签
#AI #Ascent #Agent +1
1980 字 8 分钟
阅读全文

日常想法随手记-2025

日常想法随手记

4 标签
#AI #Thinking #Daily +1
5168 字 21 分钟
阅读全文

Reinforced Self-play Reasoning with Zero Data 论文解读

论文介绍了强化自博弈推理的零数据范式,通过自博弈生成任务和验证,实现无需依赖人工标注数据或预设任务的自主学习推理。

3 标签
#AI #论文 #Reinforced
6183 字 25 分钟
阅读全文

Reinforced Self-play Reasoning with Zero Data 论文解读

论文介绍了强化自博弈推理的零数据范式,通过自博弈生成任务和验证,实现无需依赖人工标注数据或预设任务的自主学习推理。

3 标签
#AI #论文 #Reinforced
1 分钟
阅读全文

Jim Fan在各个场合的观点

Jim Fan在各个场合的观点

2 标签
#AI #Jim Fan
2001 字 9 分钟
阅读全文

OpenAI: AI in the Enterprise

OpenAI关于企业级AI应用的详细简报

3 标签
#AI #企业级AI #经验教训
2782 字 12 分钟
阅读全文
模型上下文协议(MCP)深度解析:Agent互操作性的新纪元

模型上下文协议(MCP)深度解析:Agent互操作性的新纪元

本文介绍了模型上下文协议(MCP),并对其技术原理、主要贡献、当前优劣、生态系统现状,并与Google A2A等相关技术进行比较,展望其未来发展趋势。

4 标签
#AI #Agent #MCP +1
1789 字 8 分钟
阅读全文

模型上下文协议(MCP)深度解析:Agent互操作性的新纪元

本文介绍了模型上下文协议(MCP),并对其技术原理、主要贡献、当前优劣、生态系统现状,并与Google A2A等相关技术进行比较,展望其未来发展趋势。

4 标签
#AI #Agent #MCP +1
11550 字 47 分钟
阅读全文

多智能体强化学习(MARL)在多智能体系统(MAS)中的应用:理论、算法、应用与展望

本文介绍了多智能体强化学习(MARL)在多智能体系统(MAS)中的应用:理论、算法、应用与展望。

7 标签
#AI #多智能体 #强化学习 +4
16955 字 68 分钟
阅读全文

我在AI领域的一些思考

我在AI领域的一些思考

4 标签
#AI #大模型 #个人思考 +1
12226 字 49 分钟
阅读全文

Deep Research 深度研究

Deep Research 深度研究

4 标签
#AI #Ascent #Agent +1
12970 字 52 分钟
阅读全文

Cursor AI 最佳实践:提升编码效率与代码质量的权威指南

Cursor AI 最佳实践:提升编码效率与代码质量的权威指南

4 标签
#Cursor #AI #论文 +1
17 分钟
阅读全文

Agent2Agent (A2A) 协议

本文介绍了Google公司A2A协议详细解读。

4 标签
#AI #google #A2A +1
8137 字 33 分钟
阅读全文

Shunyu Yao: The Second Half (下半场)

AI的下半场

2 标签
#AI #Shunyu Yao
7590 字 31 分钟
阅读全文

AI Agent Gateway

AI Agent Gateway

4 标签
#AI #Agent Gateway #MCP +1
645 字 3 分钟
阅读全文

Llama 4 模型系列

本文介绍了Llama 4 模型系列详细解读。

4 标签
#AI #Llama #LLM +1
7603 字 31 分钟
阅读全文

CAMEL 工具包

CAMEL Tools

CAMEL工具包是一个模块化框架,旨在通过统一接口扩展AI智能体的能力,使其能够连接外部服务、数据源和计算工具。它提供了多种工具包,涵盖搜索、学术、社交媒体、数据分析、媒体处理、开发、金融和生产力等领域,帮助开发者加 …

3 标签
#AI #CAMEL #Tools
4 分钟
阅读全文

QwQ-32B Qwen推理大模型解读

本文介绍了深度求索(DeepSeek)公司推出的新一代推理模型QwQ-32B,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

5 标签
#AI #深度思考 #QwQ-32B +2
761 字 4 分钟
阅读全文

Chain of Draft 论文解读

本文介绍了Chain of Draft(CoD)论文,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

4 标签
#AI #Chain of Draft #论文 +1
3349 字 14 分钟
阅读全文

DeepSeek FlashMLA 代码解读

本文介绍了深度求索(DeepSeek)公司FlashMLA代码详细解读。

5 标签
#AI #deepseek #FlashMLA +2
3881 字 16 分钟
阅读全文

Google AI协同科学家系统

本文介绍了Google开发的AI协同科学家系统(AI co-scientist),并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

3 标签
#AI #Google #agent
1 分钟
阅读全文

Test-Time Scaling 相关论文解读

本文介绍了Test-Time Scaling(测试时扩展)的概念,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

4 标签
#AI #Test-Time Scaling #论文 +1
5666 字 23 分钟
阅读全文

DeepSeek 开源 LLM 对闭源 LLM 的影响

本文介绍了DeepSeek开源LLM对闭源LLM的影响,包括性能基准测试和竞争、成本效益、开源可用性和定制、市场动态和战略转变、创新与社区发展、环境影响以及AI研究和应用的转变。

5 标签
#AI #DeepSeek #开源 +2
2118 字 9 分钟
阅读全文

OpenAI 推理模型最佳实践总结

本文总结了OpenAI推理模型最佳实践。

4 标签
#AI #OpenAI #推理模型 +1
682 字 3 分钟
阅读全文

DeepSeek 微调

本文介绍了如何使用合成推理数据集微调DeepSeek-R1模型.

4 标签
#AI #DeepSeek #论文 +1
345 字 2 分钟
阅读全文

DeepSeek V3 论文解读

本文介绍了深度求索(DeepSeek)公司推出的新一代推理模型DeepSeek-V3,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

4 标签
#AI #DeepSeek-V3 #论文 +1
1169 字 5 分钟
阅读全文

字节跳动OmniHuman-1 开源项目解读

字节跳动开源的OmniHuman-1项目,并对其技术原理、功能特点、应用前景和伦理风险进行了详细解读。

5 标签
#人像视频生成 #字节跳动 #OmniHuman-1 +2
865 字 4 分钟
阅读全文

DeepSeek R1 论文解读

本文介绍了深度求索(DeepSeek)公司推出的新一代推理模型DeepSeek-R1,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

5 标签
#AI #深度思考 #DeepSeek-R1 +2
7683 字 31 分钟
阅读全文

DeepSeek R1 Paper Review

A comprehensive review of the DeepSeek R1 paper

5 标签
#AI #DeepThinking #DeepSeek +2
1 分钟
阅读全文

Cursor Rules 使用指南

Cursor 的 .cursor/rules 使用指南:单一规则文件 vs 目录结构的用法和最佳实践

4 标签
#Cursor #AI #编程工具 +1
576 字 3 分钟
阅读全文

欢迎来到我的AI博客

这是一个专注于AI领域的技术博客,包含论文解读、技术分析、项目介绍等内容

3 标签
#AI #博客 #学习
265 字 2 分钟
阅读全文

Stephen Wolfram:计算宇宙的拓荒者

Stephen Wolfram的生平、贡献和思想,包括计算不可约性理论和Mathematica等工具

5 标签
#Stephen Wolfram #科学家 #企业家 +2
4141 字 17 分钟
阅读全文

Pangu Deep Dive - 论文深度解析

Pangu相关论文的深度解析和资源链接

4 标签
#论文 #Pangu #深度学习 +1
8 字 1 分钟
阅读全文