Large_models

large_models

小米大模型全景调研 2025

基于最新的公开信息与技术披露，小米在大模型领域的端侧轻量化与云端推理优化双轮驱动的完整分析

large_models

小米大模型全景调研 2025

基于最新的公开信息与技术披露，小米在大模型领域的端侧轻量化与云端推理优化双轮驱动的完整分析

📅 2025-12-19 ⏱️ 4 分钟 📝 1311 字

#xiaomi #llm #端侧AI

papers

DeepSeekMath-V2 技术白皮书：迈向自验证数学推理

本文介绍了DeepSeekMath-V2，旨在克服传统上依赖最终答案的数学推理奖励机制的局限性。其核心创新在于通过训练一个专门的证明验证器来评估推导的逻辑严谨性，从而实现自我可验证的数学推理能力。该系统引入了元验证过程，以确保验证器识别的错 …

papers

DeepSeekMath-V2 技术白皮书：迈向自验证数学推理

本文介绍了DeepSeekMath-V2，旨在克服传统上依赖最终答案的数学推理奖励机制的局限性。其核心创新在于通过训练一个专门的证明验证器来评估推导的逻辑严谨性，从而实现自我可验证的数学推理能力。该系统引入了元验证过程，以确保验证器识别的错误是准确的，并利用此验证器作为奖励模型来训练生成器进行自我评估和迭代优化。这种生成与验证的协同作用创建了一个循环，通过扩展计算规模来自动标注难以验证的新证明，从而提高了系统的能力。

📅 2025-11-29 ⏱️ 17 分钟 📝 6424 字

#AI #DeepSeek #Math

large_models

Gemini Nano Banana Pro：技术奇点、生态重构与行业影响全景解析

Google Gemini Nano Banana Pro（Gemini 3 Pro Image）把图像生成从“凭感觉出图”提升为“有推理、有规划的工业级生产工具”：它基于 Gemini 3 的多模态推理和实时搜索能力，在生成前先理解语义与布局、保证细节一致性，同时支持 4K 画质、强文本渲染和多图参考控制，重点服务品牌物料、信息图表、教育与游戏等专业生产场景，并通过云端算力、Workspace/Vertex AI/Adobe 等生态整合与合规水印，把 AI 出图真正变成企业级内容生产基础设施。

📅 2025-11-22 ⏱️ 13 分钟 📝 5181 字

#image #Gemini #Nano Banana Pro

papers

DeepSeek-OCR：重塑AI长文本处理

本文介绍了DeepSeek-OCR，一种革命性的AI模型，能够将长文本处理效率提升数十倍，从而实现对超长文档的快速处理。

📅 2025-10-21 ⏱️ 11 分钟 📝 4014 字

#AI #DeepSeek #OCR

large_models

Veo 3 零样本学习和推理 - Google Gemini

这篇来自 Google DeepMind 的论文 **《视频模型是零样本学习者和推理者》（Video models are zero-shot learners and reasoners）** 探讨了视频生成技术是否正在像大语言模型 …

large_models

Veo 3 零样本学习和推理 - Google Gemini

这篇来自 Google DeepMind 的论文 **《视频模型是零样本学习者和推理者》（Video models are zero-shot learners and reasoners）** 探讨了视频生成技术是否正在像大语言模型（LLM）改变自然语言处理那样，成为通用的视觉基础模型-这意味着视觉领域迎来 **GPT 时刻**。

📅 2025-10-21 ⏱️ 4 分钟 📝 1545 字

#Veo 3 #zero-shot learn #video model

large_models