TinyGPT 是一个在 Mac 本地从头预训练儿童故事续写模型的项目。它具有以下特点:

  1. 完整的训练流程:涵盖预训练、SFT 到 DPO。
  2. 低门槛:无需云端 GPU,兼容 Mac M 芯片。
  3. 为学习而生:内置 teacher AI 引导式教学,使用经典算法做入门实现,有类型注释。

开始步骤如下:

  • 在 Cursor、Claude Code 或任何带 Bash Tool 的环境中输入 @teacher 带我预训练,让老师带你完成预训练。
  • 预训练:手搓 10M 的超小模型。
  • SFT (WIP):Qwen3-0.6B 版加法器。
  • DPO (WIP):反向安全对齐,Qwen3-0.6B 越狱破限。

项目链接:GitHub - glidea/tinygpt

更多详情请参考: -

image
image

标签: none

评论已关闭