首页

欢迎来到我的 AI 博客!这里专注于 AI 领域的前沿发展,包括论文解读、技术分析、项目分享等内容。

Context Engineering

#Context Engineering #LLM #AI

Context Engineering 是大型语言模型(LLM)应用中的系统性技术,旨在通过动态构建、管理和优化输入模型的信息负载(包括指令、记忆、工具输出、外部知识等),提升模型在复杂任务中的性能、稳定性和可靠性。

阅读全文

Claude Code 介绍

#Agent #Claude #Code

Claude Code 是 Claude 的命令行工具,用于代理编码,提供灵活的、可定制的、可脚本化的和安全的编程方式。

阅读全文

ERNIE 4.5 技术报告解读

#Opensource #ERNIE-4.5 #论文 #技术

本文介绍了百度开源的ERNIE 4.5模型,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

阅读全文

Context7

#Context7 #MCP

Context7 是一个用于 LLM 和 AI 编码编辑器的 MCP 服务器,可以提供最新的代码文档和代码示例,使得生成的代码更准确、版本相关且避免过时或虚假信息。非常适合配合AI编码助手使用更新版本的API。

阅读全文

QwQ-32B Qwen推理大模型解读

#AI #深度思考 #QwQ-32B #大模型 #Qwen

本文介绍了深度求索(DeepSeek)公司推出的新一代推理模型QwQ-32B,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

阅读全文

Chain of Draft 论文解读

#AI #Chain of Draft #论文 #技术

本文介绍了Chain of Draft(CoD)论文,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

阅读全文

微调

#training #finetuning #DeepSeek-R1 #Unsloth #LoRA

本文介绍了微调的常见挑战及其克服方法,并详细介绍了如何使用Unsloth在消费级GPU上对DeepSeek-R1进行微调。

阅读全文

Google AI协同科学家系统

#AI #Google #agent

本文介绍了Google开发的AI协同科学家系统(AI co-scientist),并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

阅读全文

Test-Time Scaling 相关论文解读

#AI #Test-Time Scaling #论文 #技术

本文介绍了Test-Time Scaling(测试时扩展)的概念,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

阅读全文

Simple Test-Time Scaling 论文解读

#opensource #reasoning #SFT #论文 #Finetuning

本文介绍了来自李飞飞团队的Simple Test-Time Scaling论文,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

阅读全文