Large_models

ERNIE 4.5 技术报告解读

#Opensource #ERNIE-4.5 #论文 #技术

本文介绍了百度开源的ERNIE 4.5模型,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

阅读全文

QwQ-32B Qwen推理大模型解读

#AI #深度思考 #QwQ-32B #大模型 #Qwen

本文介绍了深度求索(DeepSeek)公司推出的新一代推理模型QwQ-32B,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

阅读全文

DeepSeek 微调

#AI #DeepSeek #论文 #技术

本文介绍了如何使用合成推理数据集微调DeepSeek-R1模型.

阅读全文

DeepSeek V3 论文解读

#AI #DeepSeek-V3 #论文 #技术

本文介绍了深度求索(DeepSeek)公司推出的新一代推理模型DeepSeek-V3,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

阅读全文

DeepSeek R1 论文解读

#AI #深度思考 #DeepSeek-R1 #论文 #技术

本文介绍了深度求索(DeepSeek)公司推出的新一代推理模型DeepSeek-R1,并对其技术原理、主要贡献、论文方法、评估结果和局限性进行了详细解读。

阅读全文