Update README.md
如果你想从0手写代码,构建大语言模型,本项目很适合你。 本项目 “LLMs From Scratch” 是由 Datawhale 提供的一个从头开始构建类似 ChatGPT 大型语言模型(LLM)的实践教程。 我们旨在通过详细的指导、代码示例和深度学习资源,帮助开发者和研究者掌握创建大语言模型和大语言模型架构的核心技术。 本项目包括了从0逐步构建GLM4\Llama3\RWKV6的教程,从0构建大模型,一起深入理解大模型原理。
在基础知识部分,我们基于”rasbt/LLMs-from-scratch”提供了一个如何从头开始实现类似ChatGPT的大语言模型(LLM)的详细教程,特别感谢@rasbt。
如果你想快速入门,请参考Codes路径下的notebook,简洁的代码可以帮助你快速入门。
如果你想详细学习,请参考Translated_Book路径下的notebook,提供了更为详细的相关知识。
👨💻 代码实现: 该项目包含了创建GPT-like大语言模型的全部代码,涵盖了编码、预训练和微调过程。
📖 逐步学习: 教程通过清晰的文本、图表和示例,分步骤教授如何创建自己的LLM。
💡 教育目的: 该方法主要用于教育,帮助学习者训练和开发小型但功能性的模型,这与创建像ChatGPT这样的大型基础模型的方法相似。
🔧 简洁易懂的代码: 利用简洁且可运行的notebook代码,即使只有PyTorch基础,也能完成大模型的构建。
🤔 深入理解模型原理: 通过本教程,读者可以深入理解大型语言模型的工作原理。
📖 详细章节安排如下:
./Model_Architecture_Discussions
注:规划未来任务,并通过 Issue 形式对外发布。
项目受众
项目亮点
如果你对 Datawhale 很感兴趣并想要发起一个新的项目,欢迎查看 Datawhale 贡献指南。
希望这个项目能够帮助你更好地理解和构建大型语言模型! 🌐
扫描下方二维码关注公众号:Datawhale
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。
注:默认使用CC 4.0协议,也可根据自身项目情况选用其他协议
仅需Python基础,从0构建大语言模型;从0逐步构建GLM4\Llama3\RWKV6, 深入理解大模型原理
©Copyright 2023 CCF 开源发展委员会 Powered by Trustie& IntelliDE 京ICP备13000930号
动手学LLM
LLMs From Scratch: Hands-on Building Your Own Large Language Models
📘 项目介绍
如果你想从0手写代码,构建大语言模型,本项目很适合你。 本项目 “LLMs From Scratch” 是由 Datawhale 提供的一个从头开始构建类似 ChatGPT 大型语言模型(LLM)的实践教程。 我们旨在通过详细的指导、代码示例和深度学习资源,帮助开发者和研究者掌握创建大语言模型和大语言模型架构的核心技术。 本项目包括了从0逐步构建GLM4\Llama3\RWKV6的教程,从0构建大模型,一起深入理解大模型原理。
🌟 项目亮点
🚀 主要内容
(1)基础知识
在基础知识部分,我们基于”rasbt/LLMs-from-scratch”提供了一个如何从头开始实现类似ChatGPT的大语言模型(LLM)的详细教程,特别感谢@rasbt。
如果你想快速入门,请参考Codes路径下的notebook,简洁的代码可以帮助你快速入门。
如果你想详细学习,请参考Translated_Book路径下的notebook,提供了更为详细的相关知识。
👨💻 代码实现: 该项目包含了创建GPT-like大语言模型的全部代码,涵盖了编码、预训练和微调过程。
📖 逐步学习: 教程通过清晰的文本、图表和示例,分步骤教授如何创建自己的LLM。
💡 教育目的: 该方法主要用于教育,帮助学习者训练和开发小型但功能性的模型,这与创建像ChatGPT这样的大型基础模型的方法相似。
🔧 简洁易懂的代码: 利用简洁且可运行的notebook代码,即使只有PyTorch基础,也能完成大模型的构建。
🤔 深入理解模型原理: 通过本教程,读者可以深入理解大型语言模型的工作原理。
📖 详细章节安排如下:
- dataloader.ipynb
- exercise-solutions.ipynb
- multihead-attention.ipynb
- exercise-solutions.ipynb
- gpt.py
- exercise-solutions.ipynb
- train.py
- generate.py
- exercise-solutions.ipynb
- code-part2.ipynb
- DDP-script.py
- exercise-solutions.ipynb
(2)模型架构的讨论和搭建
./Model_Architecture_Discussions
目录。📅 Roadmap
注:规划未来任务,并通过 Issue 形式对外发布。
👫 参与贡献
项目受众
项目亮点
如果你对 Datawhale 很感兴趣并想要发起一个新的项目,欢迎查看 Datawhale 贡献指南。
希望这个项目能够帮助你更好地理解和构建大型语言模型! 🌐
贡献者名单(教程部分)
关注我们
扫描下方二维码关注公众号:Datawhale
LICENSE
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。
注:默认使用CC 4.0协议,也可根据自身项目情况选用其他协议