large_modelsGemini 2.5 Pro 在 IMO 2025 中的高级数学推理能力评估Gemini 2.5 Pro 在 IMO 2025 数学奥林匹克竞赛中取得优异成绩,关键在于结合了强大的数学推理能力与自我验证迭代流程,有效避免逻辑错误和表面化思维,实现了接近人类专家的严谨解题表现。📅 2025-08-14 ⏱️ 7 分钟 📝 2442 字#IMO #LLM #数学推理
modelsAudioLLM - 李沐亲自解说语音大模型训练的底层思路李沐亲自解说语音大模型AudioLLM训练的底层思路📅 2025-07-29 ⏱️ 8 分钟 📝 3142 字#AI #AudioLLM #李沐
large_modelsKimi-K2 简介和有意思的用法本文介绍了MoonshotAI公司Kimi-K2模型简介和相关有意思的用法。large_modelsKimi-K2 简介和有意思的用法本文介绍了MoonshotAI公司Kimi-K2模型简介和相关有意思的用法。📅 2025-07-19 ⏱️ 8 分钟 📝 3086 字#AI #Kimi #Kimi-K2
large_modelsERNIE 4.5 技术报告解读本文介绍了百度开源的ERNIE 4.5模型,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。📅 2025-06-30 ⏱️ 21 分钟 📝 8051 字#Opensource #ERNIE-4.5 #论文
large_modelsGoogle Gemini Veo 3 动画案例简单介绍Google Gemini Veo 3和一些有趣的动画案例large_modelsGoogle Gemini Veo 3 动画案例简单介绍Google Gemini Veo 3和一些有趣的动画案例📅 2025-05-21 ⏱️ 8 分钟 📝 2824 字#Veo 3 #case #video model
large_modelsQwQ-32B Qwen推理大模型解读本文介绍了深度求索(DeepSeek)公司推出的新一代推理模型QwQ-32B,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。📅 2025-03-06 ⏱️ 2 分钟 📝 761 字#AI #深度思考 #QwQ-32B
large_modelsDeepSeek FlashMLA 代码解读本文介绍了深度求索(DeepSeek)公司FlashMLA代码详细解读。large_modelsDeepSeek FlashMLA 代码解读本文介绍了深度求索(DeepSeek)公司FlashMLA代码详细解读。📅 2025-02-24 ⏱️ 10 分钟 📝 3881 字#AI #deepseek #FlashMLA
papersDeepSeek V3 论文解读本文介绍了深度求索(DeepSeek)公司推出的新一代推理模型DeepSeek-V3,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。papersDeepSeek V3 论文解读本文介绍了深度求索(DeepSeek)公司推出的新一代推理模型DeepSeek-V3,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。📅 2025-02-14 ⏱️ 3 分钟 📝 1169 字#AI #DeepSeek-V3 #论文