papers

DeepSeekMath-V2 技术白皮书:迈向自验证数学推理

本文介绍了DeepSeekMath-V2,旨在克服传统上依赖最终答案的数学推理奖励机制的局限性。其核心创新在于通过训练一个专门的证明验证器来评估推导的逻辑严谨性,从而实现自我可验证的数学推理能力。该系统引入了元验证过程,以确保验证器识别的错 …
papers

DeepSeekMath-V2 技术白皮书:迈向自验证数学推理

本文介绍了DeepSeekMath-V2,旨在克服传统上依赖最终答案的数学推理奖励机制的局限性。其核心创新在于通过训练一个专门的证明验证器来评估推导的逻辑严谨性,从而实现自我可验证的数学推理能力。该系统引入了元验证过程,以确保验证器识别的错误是准确的,并利用此验证器作为奖励模型来训练生成器进行自我评估和迭代优化。这种生成与验证的协同作用创建了一个循环,通过扩展计算规模来自动标注难以验证的新证明,从而提高了系统的能力。
📅 2025-11-29 ⏱️ 3 分钟 📝 555 字
#AI #DeepSeek #Math
Gemini Nano Banana Pro:技术奇点、生态重构与行业影响全景解析
large_models

Gemini Nano Banana Pro:技术奇点、生态重构与行业影响全景解析

Google Gemini Nano Banana Pro(Gemini 3 Pro Image)把图像生成从“凭感觉出图”提升为“有推理、有规划的工业级生产工具”:它基于 Gemini 3 的多模态推理和实时搜索能力,在生成前先理解语义与布局、保证细节一致性,同时支持 4K 画质、强文本渲染和多图参考控制,重点服务品牌物料、信息图表、教育与游戏等专业生产场景,并通过云端算力、Workspace/Vertex AI/Adobe 等生态整合与合规水印,把 AI 出图真正变成企业级内容生产基础设施。
📅 2025-11-22 ⏱️ 6 分钟 📝 1246 字
#image #Gemini #Nano Banana Pro
large_models

Gemini 2.5 Computer Use Model

Gemini 2.5 Computer Use Model 是基于视觉理解的AI代理,通过持续的感知-行动循环实现自动化任务处理。
large_models

Gemini 2.5 Computer Use Model

Gemini 2.5 Computer Use Model 是基于视觉理解的AI代理,通过持续的感知-行动循环实现自动化任务处理。
📅 2025-10-07 ⏱️ 3 分钟 📝 447 字
#gemini #Computer Use #浏览器