《计算机视觉入门与调优》专栏订阅前,请你必读

计算机视觉 AI算法 深度学习 神经网络 模型优化 编程实战 AI入门 技术专栏
《计算机视觉入门与调优》专栏旨在帮助读者从零基础入门AI视觉,深入理解经典算法如ResNet、YoLo、Unet等,并通过代码实战掌握算法实现与调优技巧。专栏包含100篇文章,涵盖算法背景、原理、代码实现及性能优化,适合有编程基础或零基础的读者。专栏提供三种学习模式,包括自学、辅导模式及VIP服务,帮助读者快速构建AI视觉知识框架。此外,订阅专栏还可获赠配套书籍《AI视觉入门与调优》及《AI大模型实验室》内容,进一步提升学习效果。专栏内容经过多次打磨与读者反馈,确保高质量与实用性,适合学生、转行人员及AI从业者提升技能。
文章内容
思维导图
常见问题
社交分享

专栏赠书活动

活动时间:2025年02月26日 - 2025年03月5日

活动方式:订阅本专栏 24 小时后,可免费获赠一本与本专栏配套的纸质出版书籍一本《AI视觉入门与调优》,书籍照片如下。

书籍介绍链接:https://mp.weixin.qq.com/s/FeDKjH7PXaCY9Z7qs_kSVQ

书籍领取方式:加专栏作者微信:ddcsggcs(备注:专栏赠书)领取书籍。

写在前面

在很多年前,第一次接触 AI 和深度学习,接触的就是计算机视觉。

那时,自己有一些图像处理的基础,但也仅此而已,Python 和 C++几乎没有接触,反而是MatLab 用的非常熟练。

工作后,开始在许多 AI 芯片上适配 AI 视觉算法。你听说过的 ResNet 系列、YoLo 系列、Unet 系列以及现在大火的 Transformer 大模型等都适配过,涉及的算法也几乎都手写过,也针对性的做过优化。

工作多年,偶有朋友问起:

  • AI算法到底该怎么学呢?
  • 如果我是零基础,我该怎么入门 AI 视觉呢?
  • 那些看着就头大的公式,到底该怎么理解才对呢?

回想自己最初接触AI算法时的情形,即时到现在,我依然觉得:入门学习 AI 算法时,不必太在意过多的细节和公式

你可能会问,不学公式,那学什么呢?

学算法背景,学技术原理,学知识架构。

当你对AI中常见的技术或者算法有了一个大致的认识、有了一个清晰的背景了解后,你便可以深入理解某一算法的细节,甚至可以去尝试用代码手写一下这些算法了。

因为此时你知道你写的这个算法是做什么的:你很清楚你在干什么

所以,一些朋友在找我咨询如何学习的时候,我一般都是这样告诉他:

在初学时,最重要的是理解为什么是这些算法?理解为什么 ResNet 这类的神经网络可以完成一张图像的识别?这些神经网络又是如何通过多个算法的相互作用,完成类比于人眼观察甚至人脑感知的功能的?

当你把这些了解清楚后,公式自然就懂了;懂了之后,剩下的就是熟练。

这远比上来就记公式,但是背后的原理却一无所知理解的更加深刻。

这也是我当初,初学AI算法尤其是AI视觉相关的算法,踩过不少坑之后得出的经验。

等你从一个AI初学者真正入门之后,相信你也会有类似的感悟。

所以,我整理了本专栏的内容。

一方面,希望把自己对于AI视觉经典算法的理解写出来;另一方面,也希望可以带你真正入门AI视觉,无论是对算法的背景理解还是对算法的实现细节。

专栏经过了半年多的打磨,也经过了几百位朋友的反馈,不断地校正内容,现在趋于完善。

共包含了100篇左右的文章,同时也配有非常详细的且可以直接运行的代码。

文章包含了对 AI 算法的通俗讲解、原理解析、也有对配套代码的讲解,最后还有针对神经网络模型的性能调优部分。

如果你有一定的计算机基础知识和编程经验,那非常合适直接上手学习。如果从来没有做过编程,没有任何编程经验,文章也会给出一些手把手的代码环境搭建指导,但是你可能要花一定的时间来学习编程的基础知识。

另外,专栏内涉及的所有代码都有详细的注释,代码也都全部上传至代码仓库,由 git 托管,且代码全部可以运行,你可以随时下载代码进行模拟测试,真正可以做到边学变练。

在订阅本专栏的内容之前,建议你仔细看一下下方的目录

如果你觉得内容对你有帮助,那你可以直接订阅专栏学习,订阅后可以终身阅读。当作一本电子工具书也是不错的。另外,如果你订阅完,记得加我的微信:ddcsggcs。


🚩 订阅本专栏,会赠送《AI大模型实验室》的内容,实验室包含以下内容,也会不定期更新。AI 大模型实验室的入口链接在这里

专栏学习模式

目前本专栏的内容已经完成了更新,也经过了多次校正和内容的修改。

根据以往读者的反馈,现提供 3 种针对本专栏的学习模式,你可以根据自己的实际情况来选择适合自己的学习模式。

  • 模式一

订阅学习模式,你可以直接订阅本专栏进行学习和阅读。

该模式适合自学能力强的同学。

  • 模式二(辅导模式)

这种模式提供个人集中训练。

我亲自对专栏内容进行讲解和答疑,会用最短的时间帮你快速梳理完本专栏内容,快速入门 AI 视觉。该模式为辅导,时长大致为一个月,可根据你的实际情况进行调整。

如果你是零基础、并且你不想浪费时间在折腾算法和代码调试上,那么模式二非常适合你。我会带你快速抓重点、快速搭建AI视觉入门的知识框架

加入模式二后,你会拥有以下特权

  • 享终身 VIP 沟通交流服务,享优先响应特权(限与AI相关的咨询),深度链接作者。
  • 如相关内容仍有疑问,可以随时预约进行答疑(终身售后)。
  • 享作者其他所有付费专栏(金额>100) 5 折购买权。
  • 享作者其他所有付费内容(金额<=100)免费赠送权益。

关于模式二的细节内容,如果你感兴趣,可以加我微信 **ddcsggcs **咨询了解。

祝你看完本专栏,可以快速完成 AI 视觉的知识破冰,快速完成知识积累。

温馨提示:本专栏的文章内容请按文章的序号进行阅读。


请你往下看 >>> 专栏目录

图像背景知识

  1. 先理解图像和像素
  2. 为什么要用灰度图?
  3. 彩色RGB图以及图像中通道的概念
  4. 彩色YUV图的作用
  5. OpenCV介绍、环境搭建及代码实战

传统计算机视觉(CV)初探

  1. 传统CV之均值滤波
  2. 传统CV之高斯滤波
  3. 传统CV之高斯滤波实战
  4. 传统CV之边缘检测
  5. 传统CV之图像分割(大津算法)
  6. 传统CV之利用大津算法实战完成图像分割

深度学习基础

  1. 机器学习和深度学习的关系
  2. 深度学习之神经网络
  3. 深度学习之训练和推理
  4. 深度学习之正向传播和反向传播
  5. 深度学习之损失函数
  6. AI推理的性能:那些推理框架
  7. 深度学习实战:完成一个CNN模型的训练和推理

模型与算法

  1. 什么是 Resnet50 神经网络?
  2. Resnet50 神经网络为什么这么重要?
  3. Resnet50 中共包含哪些经典算法?
  4. 卷积 - 为什么是卷积?
  5. 卷积 - 什么是卷积的Feature Map(特征图)?
  6. 卷积 - 如何正确理解感受野?
  7. 卷积 - 真正搞懂矩阵乘法的本质
  8. 卷积 - 实际上是一个特征提取器
  9. 卷积 - 卷积特征的可视化和一个神奇的网站
  10. 卷积 - 卷积的基础运算公式推导
  11. 卷积参数 - padding 的作用
  12. 卷积参数 - stride 的作用
  13. 卷积参数 - dilation 的作用以及什么是空洞卷积
  14. 卷积参数 - 特征图在长宽方向的公式推导
  15. 变种卷积 - 什么是分组卷积?
  16. 实战 - 从零手写基础卷积算法
  17. 卷积 - 算法总结
  18. 池化 - 什么是池化运算
  19. 池化 - 池化与卷积的区别
  20. 池化 - 池化的特征不变性
  21. 池化 - 平均池化和全局平均池化
  22. 实战 - 从零手写最大池化
  23. BatchNorm - 什么是批归一化以及它到底在解决什么问题?
  24. BatchNorm - 经典面试题:AI训练和推理中的批归一化有什么区别?
  25. 实战 - 从零手写BatchNorm算法
  26. BatchNorm为什么可以和卷积进行算法融合?
  27. 激活函数 - 非线性的重要性
  28. 激活函数 - relu激活函数
  29. 激活函数 - sigmoid激活函数
  30. 激活函数 - 什么是梯度消失和梯度爆炸?
  31. Resnet - 残差结构和它的作用
  32. 实战 - 利用 conv + bn + relu + add 从零手写残差结构
  33. 全连接 - 图像特征的全局融合
  34. 全连接 - 隐层特征与样本空间的线性映射
  35. 实战 - 手写全连接算法
  36. Softmax的底层原理
  37. 损失函数和Softmax
  38. Resnet50模型中的下采样是什么?

模型实战1 - 最初版本

  1. python 环境搭建
  2. resnet50 模型的下载
  3. resnet50 模型的权值和参数保存
  4. resnet50 模型的权值和参数加载
  5. python - 手写卷积、bn、池化、全连接、激活、ResBlock
  6. python - 从零手写并搭建 resnet50 神经网络
  7. 图片预处理:Resize and Crop(裁剪和缩放)
  8. 图片预处理:Normalize(归一化)
  9. python - 利用手写的模型成功预测识别一张图片
  10. python - 代码仓库的使用说明
  11. AI 模型性能评估指标:彻底搞懂吞吐和延时的概念
  12. python - 第一版手写代码的性能评估
  13. python - 利用向量内积优化卷积计算
  14. C++ - 代码仓库的使用说明
  15. C++ - 环境搭建和一些库的安装
  16. C++ - 代码格式规范的一个工具使用
  17. C++ - 代码编译和运行介绍
  18. C++ - 开始进行一次基于C++的模型推理吧

模型性能优化2 - 运算向量化

  1. avx2:什么是计算向量化
  2. avx2向量指令集介绍
  3. avx2向量寄存器介绍
  4. avx2数据 load/store 向量化操作介绍
  5. 利用 avx2 向量指令集优化卷积运算
  6. 评估优化前后的性能差距

模型性能优化3 - 权值预加载

  1. 计算机基础:数据流加载以及为什么要做权值预加载
  2. 手写的模型如何模拟权值预加载操作?
  3. 评估权值预加载带来的模型推理的性能提升

模型性能优化4 - 动态内存移除

  1. 介绍:操作系统中内存申请的性能
  2. 优化:字符串拼接与内存性能
  3. 优化:移除推理路径上的内存操作
  4. 评估移除所有动态内存操作带来的性能提升

模型性能优化5 - 代码生成(CodeGen)

  1. 代码生成初探
  2. 对resnet50的c++实现进行代码生成
  3. 利用JIT编译技术完成对生成的代码的编译
  4. 在推理流程中加载动态库中的Infer函数
  5. 评估代码生产操作带来的性能提升

模型性能优化6 - 多线程编程

  1. 多线程概念简介
  2. 利用多线程编程优化模型性能
  3. 评估使用多线程优化带来的性能提升

小册内容总结

  1. C++模型的性能优化一览
  2. 我对 AI 模型调优的经验和认识
  3. 小册内容总结

仓库代码说明

  1. 仓库代码使用说明

本专栏平均一篇高质量文章不到1元,性价比超高!

本专栏内容丰富,从算法原理的入门介绍,到算法使用动机和算法细节的解析,再到基于算法的代码实战,全部包含。

围绕着Resnet50这一经典图像分类神经网络,会带你从零手写该AI模型,完成图像的正确分类,并且作为提高,对模型进行 4 个版本的性能调优。

专栏的行文设计会带你将基础知识打牢,无论你是学生还是想要转行从事AI视觉,还是已有一些基础AI基础想提高自己,都很适合。

大模型专栏介绍

本专栏更新完成后,我便开始着手基于 Transformer 架构的大语言模型的技术专栏撰写,与本专栏类似,大语言模型的技术专栏将从零开始讲解大模型相关的背景知识和技术原理。

目前基于 Transformer 架构的大模型技术专栏已经完成更新,整理成文,你可以点击这个链接查看:《Transformer 通关秘籍》。

你可能在很多文章中看到过 Transformer 架构的文章,也了解到目前大模型在各行各业都发展迅速,无论是国外的GPT4,还是FaceBook 的 LLaMa,还是国内的Kimi,讯飞星火,百度文心一言等大模型,还是开源的chatGLM等,这些模型都是基于Transformer结构而发展来的。

可以说, transformer 架构是目前大模型的核心。该专栏的目的,就是帮你打通理解 Transformer 架构技术的最后一公里,帮你彻底搞清楚该架构的技术点,以及该算法为什么可以作为大模型的基础架构来使用。

在专栏中,我会结合目前已有的大模型,给出非常多的使用示例和背景、原理讲解。

如果你对大语言模型的技术感兴趣,可以扫描下方的二维码,关注 Transformer 专栏。

思维导图生成中,请稍候...

问题 1: 订阅专栏后,如何领取赠书?
回答: 订阅专栏 24 小时后,添加作者微信 ddcsggcs,备注“专栏赠书”,即可免费领取一本配套的纸质书籍《AI视觉入门与调优》。

问题 2: 专栏适合哪些读者?
回答: 专栏适合有计算机基础知识和编程经验的读者,也适合零基础但愿意花时间学习编程的读者。文章提供了手把手的代码环境搭建指导。

问题 3: 专栏的内容结构是怎样的?
回答: 专栏包含 100 篇左右的文章,涵盖 AI 算法的通俗讲解、原理解析、代码实战以及神经网络模型的性能调优。所有代码都有详细注释,并上传至代码仓库,支持边学边练。

问题 4: 专栏的学习模式有哪些?
回答: 提供两种学习模式:模式一为自学模式,适合自学能力强的读者;模式二为辅导模式,作者亲自讲解和答疑,适合零基础或想快速入门的读者。

问题 5: 专栏的代码是否可以运行?
回答: 是的,专栏内所有代码都经过详细注释,并上传至代码仓库,由 git 托管,全部可以运行,读者可以随时下载代码进行模拟测试。

问题 6: 专栏是否提供终身阅读权限?
回答: 是的,订阅专栏后可以终身阅读,内容可以作为一本电子工具书随时查阅。

问题 7: 专栏是否包含大模型相关的内容?
回答: 是的,订阅本专栏还会赠送《AI大模型实验室》的内容,该实验室不定期更新,涵盖大模型相关的技术原理和背景知识。

问题 8: 专栏的性价比如何?
回答: 专栏平均每篇高质量文章不到 1 元,内容丰富,性价比超高,适合学生、转行从事 AI 视觉的读者以及已有一定 AI 基础想提高的读者。

问题 9: 专栏是否提供代码仓库的使用说明?
回答: 是的,专栏提供了详细的代码仓库使用说明,帮助读者快速上手代码的下载和运行。

问题 10: 专栏是否涉及模型性能优化?
回答: 是的,专栏不仅涵盖算法原理和代码实战,还深入讲解了模型性能优化的多个版本,包括运算向量化、权值预加载、动态内存移除等。