《Transformer通关秘籍》订阅必读 | 目录大纲简介

AI大模型 Transformer 自然语言处理 深度学习 Python编程 AI应用 注意力机制 词嵌入 位置编码 后处理
《Transformer通关秘籍》专栏深入探讨了Transformer架构在AI大模型中的核心地位及其广泛应用。专栏不仅介绍了Transformer的背景、底层技术和算法原理,还提供了大量经典AI大模型的使用方法和体验链接,帮助读者理解大模型的落地应用。专栏内容涵盖从文本预处理到后处理的完整流程,详细拆解了Token化、词嵌入、注意力机制、位置编码等关键技术,并提供了代码实现和实用工具。订阅者还可获得《AI大模型实验室》专栏、实用大模型应用方法以及多份高质量学习资料。专栏持续更新,紧跟大模型技术发展,适合对AI大模型感兴趣的读者深入学习。
文章内容
思维导图
常见问题
社交分享

0、写在前面 & 专栏简介

大模型的发展早已势不可挡了。

你可能在很多场合都听到过 Transformer 的名字,你肯定也了解过这两年无论是国内还是国外,AI 大模型的发展非常迅速,已经在很多传统领域掀起了革命性的创新热潮。

在 AI 大模型面世后,人们纷纷使用 AI 大模型进行绘画和文章创作、自媒体创作(如小红书文案和配图)、代码续写、网页内容整理、思维导图制作、PPT制作甚至用 AI 制作短视频。可以说,你所能想到的工作和生活场景,几乎都有 AI 大模型参与的身影。一句话:大模型可以落地并为你提效的场景太多了!

事实上,这些火爆、高效充满“智能”的大模型,无论是国外的GPT系列,还是 Meta (原FaceBook)的 LLaMa系列,还是国内的 Kimi、讯飞星火、百度文心、清华智浦、商汤小浣熊等大模型,基本上都是基于 Transformer 架构演化而来的。

可以说, Transformer 架构是目前主流 AI 大模型的核心。

本专栏便将围绕着 Transformer 这一架构,来拆解自然语言处理和 AI 大模型有关的背景、底层技术和算法原理。

在拆解的过程中,会有很多相关背景知识的介绍。希望你再阅读完本专栏后,不仅可以对以 Transformer 架构为核心的大模型有一定的了解,还可以对大模型的底层细节和技术背景有更加深刻的认识。

本专栏定位虽然是聚焦在算法和技术方面的内容,但为了让你在阅读过程中不至于过于枯燥,我会给出许多经典 AI 大模型的使用方法和体验链接,包括在网页上直接使用 AI 大模型,以及使用 Python 代码调用相关大模型的 API 接口等,当然,也会会给出一些好玩的大模型应用。

1、专栏学习模式

目前本专栏的内容已经完成了更新,也经过了多次校正和内容的修改。

根据以往读者的反馈,现提供 3 种针对本专栏的学习模式,你可以根据自己的实际情况来选择适合自己的学习模式。

  • 模式一

模式一为订阅学习模式,你可以直接订阅本专栏进行学习和阅读,订阅完成后,所有内容可以终身阅读。

该模式适合自学能力强的同学。

🍎注:该模式不包含答疑服务。

  • 模式二

在模式一的基础上,提供答疑服务。

你如果在学习过程中遇到相关难点、理解不透彻的点、或者其他与 AI 视觉有关(可以是不属于本专栏的内容),都可以加我微信 ddcsggcs 预约答疑咨询。

  • 模式三(原训练营模式)

这种模式提供个人集中训练,个人集中训练包含两个方面:

  • 第一方面对本专栏的所有技术的背景和算法原理进行介绍。我会亲自对本专栏内容进行讲解和答疑,会用最短的时间帮你快速梳理完本专栏内容,快速入门大模型技术。
  • 第二方面为实战内容,会将本专栏的内容和国内知名大模型进行结合,以代码实操的形式完成大模型的架构编写、权值加载和模型推理,效果就是你可以和自己手写的大模型进行对话。

所以,模式三是一个基于本专栏衍生出来的实战课程,并且课程为 1对1 辅导模式,时长大致为 1.5 个月。

如果你是零基础、并且你不想浪费时间在折腾算法和代码调试上,那么本模式非常适合你。我会带你快速抓重点、快速搭建大模型技术入门的知识框架

加入模式三后,你会拥有以下特权

  • 享终身 VIP 沟通交流服务,享优先响应特权(限与AI相关的咨询),深度链接作者。
  • 如相关内容仍有疑问,可以随时预约进行答疑(终身售后)。
  • 享作者其他所有付费专栏(金额>100) 5 折购买权。
  • 享作者其他所有付费内容(金额<=100)免费赠送权益。
  • 如你希望参加模式 3 的学习,请不要在此订阅,我会赠送你本专栏所有文章的免费阅读权益。

关于模式二中的答疑和模式三的学习细节内容,如果你感兴趣,可以加我微信 **ddcsggcs **咨询了解。

祝你看完本专栏,可以快速完成 AI 视觉的知识破冰,快速完成知识积累。

2、订阅须知

专栏文章只有订阅后才可阅读。订阅完成后,所有内容可以终身阅读,无期限限制。

订阅前请你仔细阅读后面的目录,确认一下专栏内容是否适合你,如果合适的话再进行订阅。

  • 如果你自己不确定是否合适,可以加我微信 ddcsggcs 沟通一下再做决定。
  • 如果你很清楚的知道本专栏是在讲什么,那么就不要犹豫直接订阅吧,这绝对是你非常超值的一次订阅。

2.1、订阅赠送

订阅本专栏,会赠送以下订阅权益。

🚩 赠送一:赠送《AI大模型实验室》专栏,实验室的内容会手把手带你完成 AI 大模型的破冰和进阶练习。该专栏包含以下内容,会不定期更新,AI 大模型实验室的入口链接在这里

🚩 赠送二:会赠送很多好玩、实用的大模型应用方法,相关内容会在本专栏进行更新,汇总部分在下面好玩实用的大模型章节。

🚩 **赠送三:**赠送 20 多份高质量的 AI、Python、c++ 学习的电子书和资料,订阅本专栏完成后,加我微信 **ddcsggcs **免费领取。

如果你对以上内容感兴趣,也对 AI 大模型非常感兴趣,你可以继续往下看本专栏的文章目录。

3、专栏更新事宜

  1. 2024 年 05 月对本专栏开始更新,内容会围绕着大模型和 Transformer 架构进行。由于大模型的技术发展非常迅速,如国内外有最新的技术和大模型发布,本专栏也会及时更新。
  2. 本专栏目前基本完成更新,共计10w多字,最长的一篇近5000字,详细拆解了大模型中的各种底层技术细节。
  3. 专栏涉及的代码都会公开,暂定放在 Gitee 上托管,订阅专栏后可以看到 Gitee 链接。
  4. 另外,如果你订阅了本专栏后,也可以学习一下另一个已完结的专栏《AI视觉入门与调优》,该专栏已更新完成,共100+篇文章,专栏定位为小白可以学习的AI知识,里面拆解了深度学习的基础概念AI 视觉常见的算法,有不少内容对学习本专栏有益。

4、专栏大纲

温馨提示:下面大纲中,存在链接跳转的文章为已更新文章。

4.1、好玩实用的大模型(订阅赠送中的<赠送二>的内容)

这里搜罗了在本专栏更新过程中发现的一些好玩、实用的大模型应用。

包括但不限于使用 AI 大模型完成文生图文生视频图生视频智能体游戏等等,汇聚在这里,属于本专栏赠送二的内容。

  1. AI 大模型初体验(网页版)

这里整理了国内外知名 AI 公司发布的 AI 大模型的使用链接,以及相关模型的介绍,都汇总在上面的链接中。目前包括:百度文心一言、腾讯混元、阿里通义千问、讯飞星火、清华智谱清言(chatGLM)、月之暗面 Kimi、OpenAI GPT系列、POE、Llama系列、快手可灵等。 2. AI 大模型初体验:使用 Python 调用 ChatGLM 3. AI 大模型初体验:在笔记本上,利用 CPU 上部署 LLaMa2 4. AI 大模型初体验:使用 Python 调用 LLaMa3 5. 有趣的 AI 应用:利用 AI 生成视频(网页版) 6. 有趣的 AI 应用:利用 AI 生成各种风格的漫画 7. 实用的 AI 应用:手把手带你使用 AI 完成网页内容的总结 8. 实用的 AI 应用:文生视频国产 Sora 平替 9. 实用的 AI 应用:体验 MidJourney 绘画

4.2、环境配置相关

  1. 选配:安装 Ubuntu 系统 (非必须)
  2. 快速访问 Hugging Face (必看)
  3. 环境配置与代码仓库 (必看)

4.3、预处理阶段(基础)

该阶段完成输入句子(单词)到向量空间的表达,可以认为是大模型进行推理之前的,文本预处理阶段,这一阶段的流程如下图所示。

### 4.3.1、Token 相关

4.3.2、词嵌入(Word Embedding)相关

4.4、Transformer 主干架构原理、背景和技术相关

4.5、后处理相关

该部分对应的是 Transformer 推理完成后,对输出的原始得分进行后处理的内容,后处理的目的是为了让 AI 大模型输出的文本(Response)更加符合人类的需求,同时保持多样性。

4.6、一些模型结构介绍


5、专栏合伙人计划

本专栏已开启合伙人计划。

订阅本专栏后,你可点击专栏中的“分享有礼”按钮,参加本专栏专属的合伙人计划,生成你的专属海报或链接,分享到朋友圈或发送给朋友。

别人从你的专属海报或链接订阅专栏后,你将直接获得订单50%的收益,收益发放至小报童钱包,直接可以提现。

欢迎分享给周围有需要的小伙伴,一起学习一起加油!

思维导图生成中,请稍候...

问题 1: 什么是 Transformer 架构,为什么它如此重要?
回答: Transformer 架构是目前主流 AI 大模型的核心,几乎所有知名的 AI 大模型(如 GPT 系列、LLaMa 系列等)都是基于它演化而来的。它推动了自然语言处理和 AI 大模型的快速发展,并在多个领域实现了革命性创新。

问题 2: 本专栏的主要内容是什么?
回答: 本专栏围绕 Transformer 架构,拆解自然语言处理和 AI 大模型的背景、底层技术和算法原理,同时提供经典 AI 大模型的使用方法和体验链接,帮助读者深入理解大模型的底层细节和技术背景。

问题 3: 订阅本专栏有哪些额外权益?
回答: 订阅本专栏将赠送《AI大模型实验室》专栏、实用的大模型应用方法,以及 20 多份高质量的 AI、Python、C++ 学习电子书和资料。

问题 4: 专栏的更新频率和内容量如何?
回答: 专栏从 2024 年 5 月开始更新,目前已基本完成,共计 10 万多字,最长的一篇近 5000 字,详细拆解了大模型的各种底层技术细节。涉及的代码也会公开托管在 Gitee 上。

问题 5: 专栏适合哪些读者?
回答: 本专栏适合对 AI 大模型和 Transformer 架构感兴趣的读者,尤其是希望深入了解大模型底层技术和算法原理的人。如果对内容不确定,可以通过微信沟通确认是否适合。

问题 6: 专栏是否提供代码和实操内容?
回答: 是的,专栏涉及的代码都会公开,暂定托管在 Gitee 上。同时,专栏还会提供经典 AI 大模型的使用方法和体验链接,包括网页版和 Python 代码调用 API 的实操内容。

问题 7: 专栏是否包含好玩的大模型应用?
回答: 是的,专栏会搜罗并更新一些好玩、实用的大模型应用,如文生图、文生视频、图生视频、智能体游戏等,这些内容属于订阅赠送的权益之一。

问题 8: 如何参与专栏的合伙人计划?
回答: 订阅专栏后,可以点击专栏主页右上角的合伙人计划,生成专属海报或链接,分享给朋友。别人通过你的链接订阅后,你将获得订单 50% 的收益,收益可直接提现。

问题 9: 专栏是否提供其他相关学习资源?
回答: 是的,订阅专栏后,还可以学习另一个已完结的专栏《AI视觉入门与调优》,该专栏共 100+ 篇文章,拆解了深度学习的基础概念和 AI 视觉常见算法,对学习本专栏有益。

问题 10: 如何获取订阅赠送的电子书和资料?
回答: 订阅本专栏完成后,添加微信 ddcsggcs 即可免费领取 20 多份高质量的 AI、Python、C++ 学习电子书和资料。