Peng Tan's AI Blog

training

微调

本文介绍了微调的常见挑战及其克服方法，并详细介绍了如何使用Unsloth在消费级GPU上对DeepSeek-R1进行微调。

training

微调

本文介绍了微调的常见挑战及其克服方法，并详细介绍了如何使用Unsloth在消费级GPU上对DeepSeek-R1进行微调。

📅 2025-02-26 ⏱️ 7 分钟 📝 2421 字

#training #finetuning #DeepSeek-R1

large_models

DeepSeek FlashMLA 代码解读

本文介绍了深度求索（DeepSeek）公司FlashMLA代码详细解读。

large_models

DeepSeek FlashMLA 代码解读

本文介绍了深度求索（DeepSeek）公司FlashMLA代码详细解读。

📅 2025-02-24 ⏱️ 10 分钟 📝 3881 字

#AI #deepseek #FlashMLA

technologies

Language Server Protocol (LSP)

Language Server Protocol (LSP) 是一种标准化协议，用于让编辑器和语言能力解耦。

technologies

Language Server Protocol (LSP)

Language Server Protocol (LSP) 是一种标准化协议，用于让编辑器和语言能力解耦。

📅 2025-02-23 ⏱️ 8 分钟 📝 2821 字

#lsp #language server #protocol

product

Google AI协同科学家系统

本文介绍了Google开发的AI协同科学家系统（AI co-scientist），并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

📅 2025-02-20 ⏱️ 6 分钟 📝 2303 字

#AI #Google #agent

papers

Test-Time Scaling 相关论文解读

本文介绍了Test-Time Scaling（测试时扩展）的概念，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

papers

Test-Time Scaling 相关论文解读

本文介绍了Test-Time Scaling（测试时扩展）的概念，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

📅 2025-02-19 ⏱️ 15 分钟 📝 5666 字

#AI #Test-Time Scaling #论文

technologies

DeepSeek 开源 LLM 对闭源 LLM 的影响

本文介绍了DeepSeek开源LLM对闭源LLM的影响，包括性能基准测试和竞争、成本效益、开源可用性和定制、市场动态和战略转变、创新与社区发展、环境影响以及AI研究和应用的转变。

technologies

DeepSeek 开源 LLM 对闭源 LLM 的影响

📅 2025-02-18 ⏱️ 6 分钟 📝 2118 字

#AI #DeepSeek #开源

technologies

OpenAI 推理模型最佳实践总结

本文总结了OpenAI推理模型最佳实践。

technologies

OpenAI 推理模型最佳实践总结

本文总结了OpenAI推理模型最佳实践。

📅 2025-02-14 ⏱️ 2 分钟 📝 682 字

#AI #OpenAI #推理模型

papers

DeepSeek V3 论文解读

本文介绍了深度求索（DeepSeek）公司推出的新一代推理模型DeepSeek-V3，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

papers

DeepSeek V3 论文解读

本文介绍了深度求索（DeepSeek）公司推出的新一代推理模型DeepSeek-V3，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

📅 2025-02-14 ⏱️ 3 分钟 📝 1169 字

#AI #DeepSeek-V3 #论文

papers

DeepSeek 微调

本文介绍了如何使用合成推理数据集微调DeepSeek-R1模型.

papers

DeepSeek 微调

本文介绍了如何使用合成推理数据集微调DeepSeek-R1模型.

📅 2025-02-14 ⏱️ 1 分钟 📝 345 字

#AI #DeepSeek #论文

papers

Simple Test-Time Scaling 论文解读

本文介绍了来自李飞飞团队的Simple Test-Time Scaling论文，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

papers

Simple Test-Time Scaling 论文解读

本文介绍了来自李飞飞团队的Simple Test-Time Scaling论文，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

📅 2025-02-10 ⏱️ 6 分钟 📝 2248 字

#opensource #reasoning #SFT

微调

DeepSeek FlashMLA 代码解读

Language Server Protocol (LSP)

Test-Time Scaling 相关论文解读

DeepSeek 开源 LLM 对闭源 LLM 的影响

OpenAI 推理模型最佳实践总结

DeepSeek V3 论文解读

DeepSeek 微调

Simple Test-Time Scaling 论文解读

数字分身