Large_models

large_models

Gemini 2.5 Pro 在 IMO 2025 中的高级数学推理能力评估

Gemini 2.5 Pro 在 IMO 2025 数学奥林匹克竞赛中取得优异成绩，关键在于结合了强大的数学推理能力与自我验证迭代流程，有效避免逻辑错误和表面化思维，实现了接近人类专家的严谨解题表现。

📅 2025-08-14 ⏱️ 7 分钟 📝 2442 字

#IMO #LLM #数学推理

models

AudioLLM - 李沐亲自解说语音大模型训练的底层思路

李沐亲自解说语音大模型AudioLLM训练的底层思路

📅 2025-07-29 ⏱️ 8 分钟 📝 3142 字

#AI #AudioLLM #李沐

large_models

Kimi-K2 简介和有意思的用法

本文介绍了MoonshotAI公司Kimi-K2模型简介和相关有意思的用法。

large_models

Kimi-K2 简介和有意思的用法

本文介绍了MoonshotAI公司Kimi-K2模型简介和相关有意思的用法。

📅 2025-07-19 ⏱️ 8 分钟 📝 3086 字

#AI #Kimi #Kimi-K2

large_models

ERNIE 4.5 技术报告解读

本文介绍了百度开源的ERNIE 4.5模型，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

📅 2025-06-30 ⏱️ 21 分钟 📝 8051 字

#Opensource #ERNIE-4.5 #论文

large_models

Google Gemini Veo 3 动画案例

简单介绍Google Gemini Veo 3和一些有趣的动画案例

large_models

Google Gemini Veo 3 动画案例

简单介绍Google Gemini Veo 3和一些有趣的动画案例

📅 2025-05-21 ⏱️ 8 分钟 📝 2824 字

#Veo 3 #case #video model

large_models

Qwen3 Tech Report解读

全方位解读Qwen3的论文技术报告

📅 2025-05-13 ⏱️ 12 分钟 📝 4406 字

#AI #Qwen3 #大模型

large_models

Llama 4 模型系列

本文介绍了Llama 4 模型系列详细解读。

📅 2025-04-03 ⏱️ 20 分钟 📝 7603 字

#AI #Llama #LLM

large_models

QwQ-32B Qwen推理大模型解读

本文介绍了深度求索（DeepSeek）公司推出的新一代推理模型QwQ-32B，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

📅 2025-03-06 ⏱️ 2 分钟 📝 761 字

#AI #深度思考 #QwQ-32B

large_models

DeepSeek FlashMLA 代码解读

本文介绍了深度求索（DeepSeek）公司FlashMLA代码详细解读。

large_models

DeepSeek FlashMLA 代码解读

本文介绍了深度求索（DeepSeek）公司FlashMLA代码详细解读。

📅 2025-02-24 ⏱️ 10 分钟 📝 3881 字

#AI #deepseek #FlashMLA

papers

DeepSeek V3 论文解读

本文介绍了深度求索（DeepSeek）公司推出的新一代推理模型DeepSeek-V3，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

papers

DeepSeek V3 论文解读

本文介绍了深度求索（DeepSeek）公司推出的新一代推理模型DeepSeek-V3，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

📅 2025-02-14 ⏱️ 3 分钟 📝 1169 字

#AI #DeepSeek-V3 #论文

Kimi-K2 简介和有意思的用法

Google Gemini Veo 3 动画案例

DeepSeek FlashMLA 代码解读

DeepSeek V3 论文解读

数字分身