论文

DeepSeek-OCR：重塑AI长文本处理

本文介绍了DeepSeek-OCR，一种革命性的AI模型，能够将长文本处理效率提升数十倍，从而实现对超长文档的快速处理。

2025-10-21

4 标签

#AI #DeepSeek #OCR +1

4014 字 17 分钟

阅读全文

ERNIE 4.5 技术报告解读

本文介绍了百度开源的ERNIE 4.5模型，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

2025-06-30

4 标签

#Opensource #ERNIE-4.5 #论文 +1

8051 字 33 分钟

阅读全文

Reinforced Self-play Reasoning with Zero Data 论文解读

论文介绍了强化自博弈推理的零数据范式，通过自博弈生成任务和验证，实现无需依赖人工标注数据或预设任务的自主学习推理。

2025-05-11

3 标签

#AI #论文 #Reinforced

6183 字 25 分钟

阅读全文

Reinforced Self-play Reasoning with Zero Data 论文解读

论文介绍了强化自博弈推理的零数据范式，通过自博弈生成任务和验证，实现无需依赖人工标注数据或预设任务的自主学习推理。

2025-05-11

3 标签

#AI #论文 #Reinforced

1 分钟

阅读全文

多智能体强化学习（MARL）在多智能体系统（MAS）中的应用：理论、算法、应用与展望

本文介绍了多智能体强化学习（MARL）在多智能体系统（MAS）中的应用：理论、算法、应用与展望。

2025-04-26

7 标签

#AI #多智能体 #强化学习 +4

16955 字 68 分钟

阅读全文

Cursor AI 最佳实践：提升编码效率与代码质量的权威指南

2025-04-12

4 标签

#Cursor #AI #论文 +1

17 分钟

阅读全文

Chain of Draft 论文解读

本文介绍了Chain of Draft（CoD）论文，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

2025-03-01

4 标签

#AI #Chain of Draft #论文 +1

3349 字 14 分钟

阅读全文

Test-Time Scaling 相关论文解读

本文介绍了Test-Time Scaling（测试时扩展）的概念，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

2025-02-19

4 标签

#AI #Test-Time Scaling #论文 +1

5666 字 23 分钟

阅读全文

DeepSeek 微调

本文介绍了如何使用合成推理数据集微调DeepSeek-R1模型.

2025-02-14

4 标签

#AI #DeepSeek #论文 +1

345 字 2 分钟

阅读全文

DeepSeek V3 论文解读

本文介绍了深度求索（DeepSeek）公司推出的新一代推理模型DeepSeek-V3，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

2025-02-14

4 标签

#AI #DeepSeek-V3 #论文 +1

1169 字 5 分钟

阅读全文

Simple Test-Time Scaling 论文解读

本文介绍了来自李飞飞团队的Simple Test-Time Scaling论文，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

2025-02-10

5 标签

#opensource #reasoning #SFT +2

2248 字 9 分钟

阅读全文

DeepSeek R1 论文解读

本文介绍了深度求索（DeepSeek）公司推出的新一代推理模型DeepSeek-R1，并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

2025-02-10

5 标签

#AI #深度思考 #DeepSeek-R1 +2

7683 字 31 分钟

阅读全文

Pangu Deep Dive - 论文深度解析

Pangu相关论文的深度解析和资源链接

2024-01-01

4 标签

#论文 #Pangu #深度学习 +1

8 字 1 分钟

阅读全文

DeepSeek-OCR：重塑AI长文本处理

ERNIE 4.5 技术报告解读

Reinforced Self-play Reasoning with Zero Data 论文解读

Reinforced Self-play Reasoning with Zero Data 论文解读

多智能体强化学习（MARL）在多智能体系统（MAS）中的应用：理论、算法、应用与展望

Cursor AI 最佳实践：提升编码效率与代码质量的权威指南

Chain of Draft 论文解读

Test-Time Scaling 相关论文解读

DeepSeek 微调

DeepSeek V3 论文解读

Simple Test-Time Scaling 论文解读

DeepSeek R1 论文解读

Pangu Deep Dive - 论文深度解析

没有找到相关文章