Deepseek

large_model

mHC: Redefining Deep Learning Scalability - DeekSeek

2026年伊始，DeepSeek团队带来了mHC（流形约束超连接）,这项技术完美解决了传统残差连接提升性能的超连接技术因破坏稳定性而难以实用的阿喀琉斯之踵.

large_model

mHC: Redefining Deep Learning Scalability - DeekSeek

2026年伊始，DeepSeek团队带来了mHC（流形约束超连接）,这项技术完美解决了传统残差连接提升性能的超连接技术因破坏稳定性而难以实用的阿喀琉斯之踵.

📅 2026-01-01 ⏱️ 8 分钟 📝 2907 字

#AI #DeepSeek #mHC

papers

DeepSeekMath-V2 技术白皮书：迈向自验证数学推理

本文介绍了DeepSeekMath-V2，旨在克服传统上依赖最终答案的数学推理奖励机制的局限性。其核心创新在于通过训练一个专门的证明验证器来评估推导的逻辑严谨性，从而实现自我可验证的数学推理能力。该系统引入了元验证过程，以确保验证器识别的错 …

papers

DeepSeekMath-V2 技术白皮书：迈向自验证数学推理

本文介绍了DeepSeekMath-V2，旨在克服传统上依赖最终答案的数学推理奖励机制的局限性。其核心创新在于通过训练一个专门的证明验证器来评估推导的逻辑严谨性，从而实现自我可验证的数学推理能力。该系统引入了元验证过程，以确保验证器识别的错误是准确的，并利用此验证器作为奖励模型来训练生成器进行自我评估和迭代优化。这种生成与验证的协同作用创建了一个循环，通过扩展计算规模来自动标注难以验证的新证明，从而提高了系统的能力。

📅 2025-11-29 ⏱️ 17 分钟 📝 6424 字

#AI #DeepSeek #Math