RPG:从“对话”到“蓝图”,用图谱指导AI思考
RPG:从“对话”到“蓝图”,用图谱指导AI思考
首页
欢迎来到我的 AI 博客!这里专注于 AI 领域的前沿发展,包括论文解读、技术分析、项目分享等内容。
RPG:从“对话”到“蓝图”,用图谱指导AI思考
智谱AI(GLM)产品线收集整理分析
与AI领域的专家学者和从业者的深度对话
腾讯AI产品线收集整理分析
Meta发布的一项名为“代码世界模型”(Code World Model, CWM)的全新研究,正试图从根本上解决当前代码AI面临的一大痛点。
Chrome DevTools MCP是谷歌基于模型上下文协议开发的服务器,它将Chrome浏览器的开发者工具能力开放给AI编码助手。
记录我的思考
Claude Code Spec Workflow, 也支持MCP方式
Spec Kit:基于规范驱动开发的工具包
Specification-Driven Development (SDD) - 规范驱动开发
PromptPilot 核心工作原理与方法论详解
本文介绍Google Gemini Nano Banana模型的创意应用案例。
本文介绍了苹果公司开源的FastVLM-WebGPU模型,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。
微软发布,11 节课,教授开始构建人工智能代理所需了解的一切知识
home page: …
微软开源的 Agent Lightning 项目,它的核心价值在于为开发者和研究者提供了一个强大的工具,用于训练和优化 AI Agent(智能代理),特别是几乎不需要修改现有 Agent 代码就能实现显著的性能提升。
这个项目有以下重 …
AI在商业中的现状2025:学习与转型的鸿沟 报告原文
Qwen Wan大模型是阿里云推出的一个通用大模型,旨在提供强大的语言理解和生成能力。
Wan2.2-S2V开源发布! 一个专为电影级音频驱动角色动画设计的140亿参数模型。该模型旨在超越简单的“数字人”对话,提供达到 …
这门课程得到吴恩达的推荐,以下是关于MIT课程《如何用AI(几乎)做任何事》(How to AI (Almost) Anything)的详细信息整理,结合课程官网内容和公开资料,帮助你快速掌握核心内容与资源获取方式: 课程链接
Zen MCP Server 开源项目分析
Magic UI MCP Server 开源项目分析
Gemini 2.5 Pro 在 IMO 2025 数学奥林匹克竞赛中的高级数学推理能力评估
Context Engineering Intro 是一个全面的模板,用于实现上下文工程,这是通过为 AI 编码助手提供完整上下文来更高效地处理任务的技术。
Context Engineering 是大型语言模型(LLM)应用中的系统性技术,旨在通过动态构建、管理和优化输入模型的信息负载(包括指令、记忆、工具输出、外部知识等),提升模型在复杂任务中的性能、稳定性和可靠性。
目录
Python 库学习
顶尖的数学可视化教育网站,包含Neural Networks系列视频
李沐亲自解说语音大模型AudioLLM训练的底层思路
Every联合创始人兼CEO Dan Shipper分享AI-first工作流程,解析为什么每家公司都需要AI运营主管
本文介绍了Manus项目经验的上下文工程精华内容,总结为6个问题和解决方案。
Claude Code 是 Claude 的命令行工具,用于代理编码,提供灵活的、可定制的、可脚本化的和安全的编程方式。
本文介绍了MoonshotAI公司Kimi-K2模型简介和相关有意思的用法。
本文全面梳理了ChatGPT智能体的核心技术架构、功能特点及应用场景,综合自OpenAI官方发布及权威媒体报道。
Taskmaster AI - 通过AI任务管理来提升开发效率,支持多种开发工具,如Cursor、Windsurf、VS Code、Claude Code CLI等。
douyin-mcp-server 开源项目分析
TradingAgents 开源项目分析
MiniMax-M1 模型技术报告
MiniMax
本文介绍了百度开源的ERNIE 4.5模型,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。
Context7 是一个用于 LLM 和 AI 编码编辑器的 MCP 服务器,可以提供最新的代码文档和代码示例,使得生成的代码更准确、版本相关且避免过时或虚假信息。非常适合配合AI编码助手使用更新版本的API。
Gemini CLI 开源项目分析
SkyworkAI DeepResearchAgent
微软/Meta/OpenAI Distinguished Engineer- Philip Su访谈
本文介绍了Google I/O 2025 大会亮点。
DeerFlow - 字节跳动开源的Deep Research
本文介绍了Microsoft Build 2025 趋势洞察。
昇腾AI芯片与英伟达GPU的技术对比
OpenEvolve相关开源项目和资源链接
全方位解读Qwen3的论文技术报告
论文介绍了强化自博弈推理的零数据范式,通过自博弈生成任务和验证,实现无需依赖人工标注数据或预设任务的自主学习推理。
OpenAI关于企业级AI应用的详细简报
本文介绍了模型上下文协议(MCP),并对其技术原理、主要贡献、当前优劣、生态系统现状,并与Google A2A等相关技术进行比较,展望其未来发展趋势。
本文介绍了模型上下文协议(MCP),并对其技术原理、主要贡献、当前优劣、生态系统现状,并与Google A2A等相关技术进行比较,展望其未来发展趋势。
本文介绍了多智能体强化学习(MARL)在多智能体系统(MAS)中的应用:理论、算法、应用与展望。
Python 的 orjson 库
Python 3.x 高级语法与语言特性深度剖析
关于编程能力对比分析一撇
本文介绍了Google关于AGI安全的技术报告,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。
Deep Research 深度研究
Cursor AI 最佳实践:提升编码效率与代码质量的权威指南
本文介绍了Google公司A2A协议详细解读。
AI Agent Gateway
本文介绍了Llama 4 模型系列详细解读。
CAMEL工具包是一个模块化框架,旨在通过统一接口扩展AI智能体的能力,使其能够连接外部服务、数据源和计算工具。它提供了多种工具包,涵盖搜索、学术、社交媒体、数据分析、媒体处理、开发、金融和生产力等领域,帮助开发者加 …
本文介绍了深度求索(DeepSeek)公司推出的新一代推理模型QwQ-32B,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。
本文介绍了Chain of Draft(CoD)论文,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。
本文介绍了微调的常见挑战及其克服方法,并详细介绍了如何使用Unsloth在消费级GPU上对DeepSeek-R1进行微调。
本文介绍了Google开发的AI协同科学家系统(AI co-scientist),并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。
本文介绍了Test-Time Scaling(测试时扩展)的概念,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。
本文总结了OpenAI推理模型最佳实践。
字节跳动开源的OmniHuman-1项目,并对其技术原理、功能特点、应用前景和伦理风险进行了详细解读。
本文介绍了来自李飞飞团队的Simple Test-Time Scaling论文,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。
每日AI技术动态汇总,包括新模型、新框架、新应用、新标准、新开源项目、新论文、科技访谈、技术报告、论坛会议和行业趋势
这里收录了 AI 领域最新、最重要的学术论文解读,包括但不限于:
这里收录了所有与 DeepSeek(深度求索)相关的内容,包括:
STORM - 通过检索和多视角提问来合成主题大纲和维基百科类文章
Peng Tan - AI 领域研究者,专注于大模型、多代理系统和上下文工程
字节跳动UI-TARS桌面应用项目
openmanus相关资源链接
knowledge tools相关资源链接
Karpathy DeepDive LLM视频课程
google deepresearch相关资源链接
gemini相关资源链接
emos相关资源链接
deep dive into LLMs like ChatGPT相关资源链接
claudia相关资源链接
claude mcp server相关资源链接
ai usa impact相关资源链接
本文档旨在全面剖析 LangGraph 的技术架构与底层实现。LangGraph 是一个用于构建有状态、可循环、多参与者(Multi-agent)应用的强大框架,它作为 LangChain 生态的关键 …
WorldScore 是首个统一评估基准,专注于评估 3D、4D 和视频模型在世界生成任务中的表现。它的出现填补了现有基准在多场景、多序列长度和动态 …
The Surprising Effectiveness of Test-Time Training for Abstract Reasoning
下面是一张表格,总结了scaling law各种曲线和相关参数之间的关系,有助于对比它们各自的设计理念和重点关注的参数。
py-spy 是一个专为 Python 设计的采样型性能分析器(sampling profiler),它的主要作用是:
在不中断、无侵入、不修改代码的情况下,实时分析正在运行的 Python 程序的性能瓶颈!
一个模块化且高效的检索、重排序和 RAG 框架,专为最新的检索、排序和 RAG 任务模型设计。
Rankify 是一个 Python 工具包,专为统一的检索、重排序和检索增强生成(RAG)研究而构建。该工具包集成了 40 …
Neo4j推出了2025年首个版本的LLM知识图谱构建器(LLM Knowledge Graph Builder),这是一个开源工具,旨在从非结构化数据中提取知识并构建知识 …
RD-Agent是一个数据驱动的AI研发自动化框架,其核心理念是将研发过程分解为两个关键组件:
qlib …
LangChain 是一个强大的框架,旨在简化和加速基于大型语言模型 (LLM) 的应用程序的开发。它的技术架构和实现围绕着模块化、可组合性和标准化接口的核心思想。
以下是对 LangChain 技术 …
项目: Youtube Analysis Platform Context(技术栈):
Python FastAPI 服务 基于 TypeScript 的 Create React App 前端 本地 PostgreSQL …
根据我搜索到的信息,AutoGen 最新版本(特别是 0.4 版本及更高版本)引入了许多新特性和改进,主要集中在以下几个方面:
核心架构和 API (Core & API) …
Cursor 的 .cursor/rules
既可以是单一规则文件,也可以是目录结构,支持更细粒度的规则管理。
但实际用法取决于你用的 Cursor 版本和你的项目需求:
Trends – Artificial Intelligence (AI) May 30, 2025 Mary Meeker / Jay Simons / Daegwon Chae / Alexander Krey
我们着手整理与人工智能相 …
This article details a project aiming to recreate the heroes of the Han Dynasty within 15 days, challenging the limits …
绘制这张图中角色的1/7比例商业化手办,写实风格,真实环境。手巾摆放在电脑桌上,配有圆形透明亚克力底座,底座上无文字。电脑桌旁边放置一只印有原画风格插画的精美玩具包装盒。
transform the image to …
https://microsoft.github.io/agent-lightning/latest/
https://gemini.google.com/app/9ece70bdfdaea0dc …
graph TD
subgraph GCP ["Google Cloud Platform"]
direction LR
subgraph GlobalInfrastructure …
产品线分为: 模型,AI平台(开发和部署,比如Vertex AI, AI Studio),AI应用(Gemini app, NotebookLM, Learn about, DeepResearch,Astra)
多模态大 …
当然,以下是修改后的技术中文内容,准备发布:
大模型 RAG(检索增强生成)应用演进之路与技术解析:
大型语言模型(LLM)的检索增强生成(RAG)应用,其演进历程是一部不断突破局限、追求卓越性能与灵活性的奋斗史。从最初的朴素检索到如今的模 …
在多智能体系统(MAS)和社会模拟领域,最近有几个重要的项目和研究方向引起了广泛关注。以下是一些关键的项目和研究方向的概述:
1. 斯坦福大学 (Stanford) - “Generative …
部分工具(如文本浏览器、文本检查器)直接借鉴了Magentic-One的设计,实现了文本文件解析和简易Web浏览。
多智能体系统(Multi-Agent Systems, MAS)作为人工智能(AI)和分布式系统领域的一个重要范式,近年来受到了广泛关注 1。本报告旨在基于 …
来自智谱清言的“沉思”,prompt是“调查并比较不同的人工智能多智能体系统”
多智能体系统(MAS, Multi-Agent Systems)是人工智能领域中的重要研究方向,它由多个具有自主性的智 …
DeepSeek R1 的技术流程可总结为以下范式: 1.DeepSeek R1-Zero 的生成: 基于 DeepSeek V3-Base 模型,通过强化学习(RL),直接训练出 DeepSeek …
https://github.com/jwasham/coding-interview-university
有很多针对这些 …
BMAD-METHOD 和 GitHub Spec Kit 是两种用于 AI 驱动软件开发的新兴框架,但它们在理念、结构和适用场景上有明显差异:
做12张上海像素风图片,竖屏,然后用智能多帧穿起来。
把下面的上海景点做出像素图片,竖屏,然后用智能多帧穿起来。
东方明珠广播电视塔 金茂大厦 环球金融中心 上海中心大厦 南京路步行街 城隍庙 世博会博物馆 上海博物馆 豫园 静安 …
https://www.youtube.com/watch?v=zjkBMFhNj_g 该视频讲稿系统地介绍了大型语言模型(LLMs)。首先,它从基本概念入 …
在信息检索中,**查询扩展(Query Expansion)**的核心作用是通过补充或优化用户原始查询的关键词,提升系统对用户需求的理解范围和匹配精度。简单来说,它像一个“智能助手”,帮助搜索引擎 …
核心观点: 神经网络之所以被认为几乎能学习任何东西,其核心在于它们的通用近似能力 (Universal Approximation Capability)。这主要由通用近似定理 (Universal …
Vector 数据库在自然语言处理、Image Recognition、推荐系统和语义搜索等各个领域发挥着举足轻重的作用,并随着 LLM 的日益普及而变得更加重要。
这些数据库具有非凡的价值, …
Transformer 模型学习指南 I. 复习大纲
引言 •序列转换模型的局限性(循环神经网络和卷积神经网络)。 •Transformer 模型的提出:完全基于注意力机制,摒弃循环和卷积。 •Transformer 模型的优点:并行化 …
尝试调整搜索条件或浏览其他分类