docs: update contributors
English Readme • | 中文 Readme
面向广泛 AI 研究爱好者群体的 DeepSeek 系列工作解读、扩展和复现,致力于传播 DeepSeek 在 AGI 实践之路上的创新性成果,并提供从 0 代码实现,打造 LLM 前沿技术教学项目。
我们将 DeepSeek-R1 及其系列工作拆分为三个重要部分:
与大众的关注性价比优势不同,我们关注 DeepSeek 在实践 AGI 之路的创新性工作,致力于将 DeepSeek 现有公开工作细分拆解,向更广泛的 AI 研究爱好者讲述清楚其中的创新方法细节,同时我们会对比介绍同期其他类似工作(如 Kimi-K1.5),呈现 AGI 之路的不同可能性
我们也将结合其他社区的工作,探索 DeepSeek-R1 的复现方案,提供中文复现教程
1.1 MoE 简介 @姜舒凡
1.2 MoE 结构的代码实现
1.3 DeepSeek MoE @姜舒凡
2.1.1 LLM and Reasoning
2.1.2 推理效果可视化
2.1.3 OpenAI-o1与Inference Scaling Law
2.1.4 Qwen-QwQ and Qwen-QVQ
2.1.5 DeepSeek-R1 and DeepSeek-R1-Zero
2.1.6 Kimi-K1.5
2.2.1 CoT,ToT,GoT
2.2.2 蒙特卡洛树搜索 @姜舒凡
2.2.3 强化学习概念速览
2.2.4 DPO
2.2.5 PPO
2.2.6 GRPO
3.1 FlashMLA
3.2 DeepEP
3.3 DeepGEMM
3.4 DualPipe & EPLB
3.5 3FS
Datawhale-R1
我们衷心感谢以下开源工作,使我们能够构建这个项目:
DeepSeek
Open-R1
trl
mini-deepseek-r1
TinyZero
flash-attn
modelscope
vllm
扫描下方二维码关注公众号:Datawhale
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。
注:默认使用CC 4.0协议,也可根据自身项目情况选用其他协议
DeepSeek 系列工作解读、扩展和复现。
Unlock-DeepSeek
English Readme • | 中文 Readme
面向广泛 AI 研究爱好者群体的 DeepSeek 系列工作解读、扩展和复现,致力于传播 DeepSeek 在 AGI 实践之路上的创新性成果,并提供从 0 代码实现,打造 LLM 前沿技术教学项目。
项目受众
项目亮点
我们将 DeepSeek-R1 及其系列工作拆分为三个重要部分:
与大众的关注性价比优势不同,我们关注 DeepSeek 在实践 AGI 之路的创新性工作,致力于将 DeepSeek 现有公开工作细分拆解,向更广泛的 AI 研究爱好者讲述清楚其中的创新方法细节,同时我们会对比介绍同期其他类似工作(如 Kimi-K1.5),呈现 AGI 之路的不同可能性
我们也将结合其他社区的工作,探索 DeepSeek-R1 的复现方案,提供中文复现教程
目录
§1 MoE: DeepSeek 所坚持的架构
1.1 MoE 简介 @姜舒凡
1.2 MoE 结构的代码实现
1.3 DeepSeek MoE @姜舒凡
§2 Reasoning: DeepSeek-R1 的核心能力
2.1 推理模型介绍
2.1.1 LLM and Reasoning
2.1.2 推理效果可视化
2.1.3 OpenAI-o1与Inference Scaling Law
2.1.4 Qwen-QwQ and Qwen-QVQ
2.1.5 DeepSeek-R1 and DeepSeek-R1-Zero
2.1.6 Kimi-K1.5
2.2 推理模型关键算法原理
2.2.1 CoT,ToT,GoT
2.2.2 蒙特卡洛树搜索 @姜舒凡
2.2.3 强化学习概念速览
2.2.4 DPO
2.2.5 PPO
2.2.6 GRPO
§3 Infra: DeepSeek 训练高效且便宜的关键
3.1 FlashMLA
3.2 DeepEP
3.3 DeepGEMM
3.4 DualPipe & EPLB
3.5 3FS
§reproduction: 对于重要工作的代码复现
Datawhale-R1
核心贡献者
参与贡献
提交规范
致谢
我们衷心感谢以下开源工作,使我们能够构建这个项目:
DeepSeek
Open-R1
trl
mini-deepseek-r1
TinyZero
flash-attn
modelscope
vllm
关注我们
扫描下方二维码关注公众号:Datawhale
LICENSE
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。
注:默认使用CC 4.0协议,也可根据自身项目情况选用其他协议