🎯 适合人群
希望深入学习Llama 3大模型原理、代码实现、部署、微调及评估的学员。
🎓 你将会学到
- 🧠 深入理解大模型:掌握Transformer与LLM核心原理,包括注意力机制、多头注意力、编码器-解码器结构等。
- 🛠️ Llama 3技术精髓:学习Llama 3模型的进化历程、技术细节(如RMSNorm、SwiGLU、RoPE、GQA、KVCache等)及代码实现。
- 🚀 实战部署与微调:在阿里云上部署Llama 3模型,使用llama_factory工具进行LoRA和QLoRA微调。
- 📊 项目实战:从数据集准备到训练、推理、评估的全流程指导,涵盖中文增强和医疗问答两大应用方向。
📖 课程简介
本课程全面覆盖了从Transformer和LLM基础到Llama 3模型深入解析及实战应用的全流程。不仅系统讲解了技术原理,还通过代码解析和实战项目,深度剖析了相关技术在工程落地中的关键环节。
📝 课程目录
🌐 Transformer与LLM基础
- 🎬 01、课程介绍
- 🎬 02-10、Transformer原理详解(注意力机制、自注意力、架构概述、Encoder/Decoder等)
- 🎬 11-15、Transformer代码解读(Encoder、Decoder、超参设置、训练示例等)
🧠 LLM文本生成与微调技术
- 🎬 16-17、结合中文注释代码深入解读
- 🎬 18-25、LLM推理方式、文本生成模式、策略及过程
- 🎬 26-30、大模型开发阶段划分、SFT微调、微调方法(LoRA、QLoRA)
🦙 Llama 3模型解析
- 🎬 31-34、Llama模型进化史、Llama 3模型类型、生态及架构
- 🎬 35-47、Llama 3关键技术解析(RMSNorm、SwiGLU、RoPE、GQA、KVCache等)
- 🎬 48-50、各文件功能及代码解析(completion/chat应用脚本、generation.py、model.py等)
💻 实战部署与微调
- 🎬 51-54、阿里云实例创建、Ollama与vLLM部署Llama 3
- 🎬 55-57、llama_factory介绍、安装及模型下载、LoRA微调训练
- 🎬 58-60、Llama 3中文增强大模型推理、评估及lora文件合并
🏥 项目实战:医疗问答
- 🎬 61-62、数据集准备及lora微调
- 🎬 63-65、Llama 3医疗问答大模型推理、QLoRA微调及推理
📚 课件资料
(包含课程PPT、代码示例、数据集等)
© 版权声明
模型版权归作者所有,仅供娱乐,请于下载后24小时内删除。侵权联系 mxgf.cc@foxmail.com
THE END
暂无评论内容