- 1.第一天:Python环境搭建与必备基础:1-Python环境配置
- 3.2-Python库安装工具 ,P3)
- 2.【AI算法工程师成长路线图】
- 4.3-Notebook工具使用 ,P4)
- 5.4-Python简介 ,P5)
- 6.5-Python数值运算 ,P6)
- 7.6-Python字符串操作 ,P7)
- 8.7.1-索引结构 ,P8)
- 9.7.2-List基础结构 ,P9)
- 10.8-List核心操作 ,P10)
- 11.9-字典基础定义 ,P11)
- 12.10-字典的核心操作 ,P12)
- 13.11-Set结构 ,P13)
- 14.12-赋值机制 ,P14)
- 15.13-判断结构 ,P15)
- 16.14-循环结构 ,P16)
- 17.15-函数定义 ,P17)
- 18.16-模块与包 ,P18)
- 19.17-异常处理模块 ,P19)
- 20.18-文件操作 ,P20)
- 21.19-类的基本定义 ,P21)
- 22.20-类的属性操作 ,P22)
- 23.21-时间操作 ,P23)
- 24.22-Python练习题-1 ,P24)
- 25.23-Python练习题-2 ,P25)
- 26.24-Python练习题-3 ,P26)
- 27.25-Python练习题-5 ,P27)
- 28.第二天:快速上手OpenCV:1-Python与Opencv配置安装 ,P28)
- 29.2-Notebook与IDE环境 ,P29)
- 30.1-计算机眼中的图像 ,P30)
- 31.2-视频的读取与处理 ,P31)
- 32.3-ROI区域 ,P32)
- 33.4-边界填充 ,P33)
- 34.5-数值计算 ,P34)
- 35.1-腐蚀操作 ,P35)
- 36.2-膨胀操作 ,P36)
- 37.3-开运算与闭运算 ,P37)
- 38.4-梯度计算 ,P38)
- 39.5-礼帽与黑帽 ,P39)
- 40.1-Sobel算子 ,P40)
- 41.2-梯度计算方法 ,P41)
- 42.3-scharr与lapkacian算子 ,P42)
- 43.图像阈值 ,P43)
- 44.1-图像平滑处理 ,P44)
- 45.2-高斯与中值滤波 ,P45)
- 46.1-Canny边缘检测流程 ,P46)
- 47.2-非极大值抑制 ,P47)
- 48.3-边缘检测效果 ,P48)
- 49.1-图像金字塔定义 ,P49)
- 50.2-金字塔制作方法 ,P50)
- 51.1-轮廓检测方法 ,P51)
- 52.2-轮廓检测结果 ,P52)
- 53.3-轮廓特征与近似 ,P53)
- 54.1-模板匹配方法 ,P54)
- 55.2-匹配效果展示 ,P55)
- 56.【项目实战-信用卡数字识别】1-总体流程与方法讲解 ,P56)
- 57.2-环境配置与预处理 ,P57)
- 58.3-模板处理方法 ,P58)
- 59.4-输入数据处理方法 ,P59)
- 60.5-模板匹配得出识别结果 ,P60)
- 61.【项目实战-文档扫描OCR识别】1-整体流程演示 ,P61)
- 62.2-文档轮廓提取 ,P62)
- 63.3-原始与变换坐标计算 ,P63)
- 64.4-透视变换结果 ,P64)
- 65.5-tesseract-ocr安装配置 ,P65)
- 66.6-文档扫描识别效果 ,P66)
- 67.第三天:深度学习-神经网络基础:1-深度学习要解决的问题 ,P67)
- 68.2-深度学习应用领域 ,P68)
- 69.3-计算机视觉任务 ,P69)
- 70.4-视觉任务中遇到的问题 ,P70)
- 71.5-得分函数 ,P71)
- 72.6-损失函数的作用 ,P72)
- 73.7-前向传播整体流程 ,P73)
- 74.4-返向传播计算方法 ,P74)
- 75.5-神经网络整体架构 ,P75)
- 76.6-神经网络架构细节 ,P76)
- 77.7-神经元个数对结果的影响 ,P77)
- 78.8-正则化与激活函数 ,P78)
- 79.9-神经网络过拟合解决方法 ,P79)
- 80.第四天:深度学习框架PyTorch入门:1-PyTorch实战课程简介 ,P80)
- 81.2-PyTorch框架发展趋势简介 ,P81)
- 82.3-框架安装方法(CPU与GPU版本) ,P82)
- 83.4-PyTorch基本操作简介 ,P83)
- 84.自动求导机制 ,P84)
- 85.线性回归DEMO-数据与参数配置 ,P85)
- 86.线性回归DEMO-训练回归模型 ,P86)
- 87.常见tensor格式 ,P87)
- 88.Hub模块简介 ,P88)
- 89.【项目实战-气温预测】1-气温数据集与任务介绍 ,P89)
- 90.2-按建模顺序构建完成网络架构 ,P90)
- 91.3-简化代码训练网络模型 ,P91)
- 92.4-分类任务概述 ,P92)
- 93.5-构建分类网络模型 ,P93)
- 94.6-DataSet模块介绍与应用方法 ,P94)
- 95.第五天:掌握卷积神经网络模型(cnn):1-卷积神经网络应用领域 ,P95)
- 96.2-卷积的作用 ,P96)
- 97.3-卷积特征值计算方法 ,P97)
- 98.4-得到特征图表示 ,P98)
- 99.5-步长与卷积核大小对结果的影响 ,P99)
- 100.6-边缘填充方法 ,P100)
- 101.7-特征图尺寸计算与参数共享 ,P101)
- 102.8-池化层的作用 ,P102)
- 103.9-整体网络架构 ,P103)
- 104.10-VGG网络架构 ,P104)
- 105.11-残差网络Resnet ,P105)
- 106.12-感受野的作用 ,P106)
- 107.【项目实战:基于CNN构建识别模型(cnn)】0-1-卷积网络参数定义 ,P107)
- 108.0-2-网络流程解读 ,P108)
- 109.1-Vision模块功能解读 ,P109)
- 110.2-分类任务数据集定义与配置 ,P110)
- 111.3-图像增强的作用 ,P111)
- 112.4-数据预处理与数据增强模块 ,P112)
- 113.5-Batch数据制作 ,P113)
- 114.【项目实战:搭建图像识别模块(cnn)】1-迁移学习的目标 ,P114)
- 115.2-迁移学习策略 ,P115)
- 116.8-加载训练好的网络模型 ,P116)
- 117.9-优化器模块配置 ,P117)
- 118.10-实现训练模块 ,P118)
- 119.【项目实战-基于PyTorch框架构建花朵识别模型】1-训练结果与模型保 ,P119)
- 120.2-加载模型对测试数据进行预测 ,P120)
- 121.3-额外补充-Resnet论文解读 ,P121)
- 122.4-额外补充-Resnet网络架构解读 ,P122)
- 123.第六天:图像分割实战:1.1-语义分割与实例分割概述 P123)
- 124.2.2-分割任务中的目标函数定义 P124)
- 125.3.3-MIOU评估标准 P125)
- 126.4.1-卷积神经网络应用领域 P126)
- 127.5.2-卷积的作用 P127)
- 128.6.3-卷积特征值计算方法 P128)
- 129.7.4-得到特征图表示 P129)
- 130.8.5-步长与卷积核大小对结果的影响 P130)
- 131.9.6-边缘填充方法 P131)
- 132.10.7-特征图尺寸计算与参数共享 P132)
- 133.11.8-池化层的作用 P133)
- 134.12.9-整体网络架构 P134)
- 135.13.10-VGG网络架构 P135)
- 136.14.11-残差网络Resnet P136)
- 137.15.12-感受野的作用 P137)
- 138.16.1-Unet网络编码与解码过程 P138)
- 139.17.2-网络计算流程 P139)
- 140.18.3-Unet升级版本改进 P140)
- 141.19.4-后续升级版本介绍 P141)
- 142.20.1-医学细胞数据集介绍与参数配置 P142)
- 143.21.2-数据增强工具 P143)
- 144.22.3-Debug模式演示网络计算流程 P144)
- 145.23.4-特征融合方法演示 P145)
- 146.24.5-迭代完成整个模型计算任务 P146)
- 147.25.6-模型效果验证 P147)
- 148.26.1-任务目标与网络整体介绍 P148)
- 149.27.2-显著性检测任务与目标概述 P149)
- 150.28.3-编码器模块解读 P150)
- 151.29.4-解码器输出结果 P151)
- 152.30.5-损失函数与应用效果 P152)
- 153.31.1-deeplab分割算法概述 P153)
- 154.32.2-空洞卷积的作用 P154)
- 155.33.3-感受野的意义 P155)
- 156.34.4-SPP层的作用 P156)
- 157.35.5-ASPP特征融合策略 P157)
- 158.36.6-deeplabV3Plus版本网络架构 P158)
- 159.37.1-PascalVoc数据集介绍 P159)
- 160.38.2-项目参数与数据集读取 P160)
- 161.39.3-网络前向传播流程 P161)
- 162.40.4-ASPP层特征融合 P162)
- 163.41.5-分割模型训练 P163)
- 164.42.1-数据集与任务概述 P164)
- 165.43.2-项目基本配置参数 P165)
- 166.44.3-任务流程解读 P166)
- 167.45.4-文献报告分析 P167)
- 168.46.5-补充:视频数据源特征处理方法概述 P168)
- 169.47.6-补充:R(2plus1)D处理方法分析 P169)
- 170.48.0-课程简介 P170)
- 171.49.0-Mask-Rcnn开源项目简介 P171)
- 172.50.0-开源项目数据集 P172)
- 173.51.0-参数配置 P173)
- 174.52.1-FPN层特征提取原理解读 P174)
- 175.53.2-FPN网络架构实现解读 P175)
- 176.54.3-生成框比例设置 P176)
- 177.55.4-基于不同尺度特征图生成所有框 P177)
- 178.56.5-RPN层的作用与实现解读 P178)
- 179.57.6-候选框过滤方法 P179)
- 180.58.7-Proposal层实现方法 P180)
- 181.59.8-DetectionTarget层的作用 P181)
- 182.60.9-正负样本选择与标签定义 P182)
- 183.61.10-RoiPooling层的作用与目的 P183)
- 184.62.11-RorAlign操作的效果 P184)
- 185.63.12-整体框架回顾 P185)
- 186.64.1-Labelme工具安装 P186)
- 187.65.2-使用labelme进行数据与标签标注 P187)
- 188.66.3-完成训练数据准备工作 P188)
- 189.67.4-maskrcnn源码修改方法 P189)
- 190.68.5-基于标注数据训练所需任务 P190)
- 191.69.6-测试与展示模块 P191)
《Python+机器学习+深度学习人工智能系列课程》简介
本课程是一套面向人工智能入门及进阶学习者的系统性实战课程,以 “基础工具→核心理论→框架应用→项目落地” 为逻辑主线,全面覆盖 Python 编程、计算机视觉、深度学习核心算法及实战开发技能。课程通过六天循序渐进的内容设计,从零基础逐步过渡到复杂模型开发,助力学习者掌握从数据处理到人工智能应用落地的完整技术链条,尤其聚焦计算机视觉领域的核心技术与实战能力培养。
一、课程定位与目标
本课程专为希望入门人工智能、计算机视觉方向的学习者设计,无论是零基础编程爱好者、高校学生,还是希望转型 AI 领域的技术从业者,都能通过课程系统掌握:
Python 编程核心语法与数据处理能力;
图像处理基础技术与 OpenCV 工具应用;
深度学习核心理论(神经网络、卷积神经网络、图像分割等);
主流框架 PyTorch 的实战开发能力;
从数据预处理到模型训练、部署的完整项目开发流程;
主流 AI 应用场景(图像识别、OCR、语义分割等)的解决方案设计与实现。
二、核心内容模块详解
模块一:Python 基础与工具准备(第一天)
课程开篇从人工智能开发的 “地基” 入手,夯实 Python 编程基础,确保学习者具备后续技术学习的工具能力。
环境搭建与核心工具:涵盖 Python 环境配置、库安装工具(pip)、Notebook 与 IDE 使用,为开发环境保驾护航;
Python 核心语法:系统讲解数值运算、字符串操作、索引结构、列表(List)、字典(Dictionary)、集合(Set)等数据结构,深入解析赋值机制、判断结构、循环结构等控制逻辑,以及函数定义、模块与包管理、异常处理、文件操作等核心编程技能;
面向对象基础:介绍类的定义与属性操作,为后续框架源码理解奠定基础;
实战巩固:通过 3 组针对性练习题,强化语法应用能力,确保学习者熟练掌握 Python 编程范式。
模块二:OpenCV 图像处理与实战(第二天)
聚焦计算机视觉基础工具 OpenCV 的应用,从图像底层原理到实战项目,构建图像处理核心能力。
图像处理基础:解析 “计算机眼中的图像” 本质,讲解图像读取与显示、视频处理、ROI(感兴趣区域)提取、边界填充等基础操作,掌握图像数值计算逻辑;
形态学操作:深入讲解腐蚀、膨胀、开运算、闭运算、梯度计算、礼帽与黑帽等形态学处理技术,理解图像噪声去除、轮廓提取的底层逻辑;
特征提取与增强:涵盖 Sobel、Scharr、Laplacian 等梯度算子,图像阈值处理、高斯滤波、中值滤波等平滑技术,以及 Canny 边缘检测的完整流程(非极大值抑制、边缘连接等);
高级技术:讲解图像金字塔构建、轮廓检测与特征分析、模板匹配等进阶方法;
项目实战:通过 “信用卡数字识别” 和 “文档扫描 OCR 识别” 两个项目,综合应用图像处理技术。前者实现数字模板匹配与识别全流程,后者涵盖文档轮廓提取、透视变换、Tesseract-OCR 配置与文字识别,让学习者体验从技术到应用的落地过程。
模块三:神经网络基础(第三天)
搭建深度学习理论框架,解析神经网络的核心原理与训练逻辑。
深度学习入门:明确深度学习的核心目标(解决复杂非线性问题)、应用领域(计算机视觉、自然语言处理等),聚焦计算机视觉任务类型(分类、检测、分割等)及常见挑战;
核心原理:详解得分函数(模型输出与标签映射)、损失函数(模型优化目标)、前向传播(数据流经网络的计算流程)、反向传播(梯度计算与参数更新)的数学逻辑与实现方法;
网络架构设计:分析神经网络层数、神经元数量对模型性能的影响,讲解正则化(防止过拟合)、激活函数(引入非线性能力)等关键技术,以及过拟合的解决策略(数据增强、早停、正则化等)。
模块四:PyTorch 框架入门(第四天)
聚焦主流深度学习框架 PyTorch 的实战应用,掌握模型构建与训练的核心工具。
框架基础:介绍 PyTorch 的发展优势、环境配置(CPU/GPU 版本),详解张量(Tensor)操作、自动求导机制(Autograd)等核心特性;
基础任务实践:通过线性回归案例,演示数据准备、模型定义、训练流程(损失计算、优化器更新)的完整链路;
数据处理工具:讲解 DataSet 模块的作用与应用,掌握自定义数据集的构建方法;
项目实战:以 “气温预测” 项目为例,完整演示从网络架构设计、数据预处理到模型训练与预测的全流程,强化框架应用能力。
模块五:卷积神经网络(CNN)与图像识别(第五天)
深入卷积神经网络核心技术,掌握图像识别的模型设计与实战开发。
CNN 核心原理:解析卷积操作的本质(特征提取)、特征值计算方法、步长与卷积核大小对特征图的影响,讲解边缘填充(Padding)、参数共享等关键机制;
网络组件:详解池化层(下采样与特征聚合)、经典网络架构(VGG、ResNet)的设计逻辑,分析残差连接解决的 “梯度消失” 问题,理解感受野对特征提取的意义;
实战技能:掌握迁移学习策略(加载预训练模型、微调适配新任务)、数据增强(提升模型泛化能力)、Batch 数据制作等工程技巧;
项目实战:通过 “基于 CNN 的图像识别模型”“花朵识别模型” 等项目,完整实现从网络参数定义、数据集配置、图像增强、模型训练到预测部署的全流程,并解读 ResNet 论文与架构细节,强化理论与实践结合能力。
模块六:图像分割进阶与实战(第六天)
聚焦图像分割前沿技术,深入主流算法与实战落地,覆盖语义分割、实例分割等复杂任务。
分割任务基础:区分语义分割与实例分割目标,讲解 MIOU 评估标准,解析分割任务中的损失函数设计;
主流分割算法:
U-Net 系列:详解编码 - 解码架构、特征融合逻辑,以及 U-Net 升级版本的改进策略;
DeepLab 系列:解析空洞卷积(扩大感受野)、SPP 层(多尺度特征融合)、ASPP 模块原理,深入 DeepLabV3Plus 架构细节;
Mask R-CNN:解读 FPN 层特征提取、RPN 层候选框生成、RoIAlign 操作等核心模块,掌握实例分割的完整流程;
数据与工具:介绍 PascalVoc 等经典数据集,讲解 Labelme 标注工具的使用,掌握自定义数据集的标注与准备方法;
项目实战:涵盖医学细胞分割、显著性检测、基于 Mask R-CNN 的自定义任务训练等项目,演示从数据标注、网络调试、特征融合到模型训练与效果验证的全流程,强化复杂场景下的问题解决能力。
三、课程特点
循序渐进的学习路径:从 Python 基础到深度学习框架,从简单图像处理到复杂分割模型,难度阶梯式上升,零基础学习者可逐步适应;
强实战导向:包含 6 个完整项目(信用卡识别、文档扫描 OCR、气温预测、花朵识别、医学图像分割、实例分割),每个技术点均配套代码演示与效果验证,确保 “学即能用”;
技术栈全面覆盖:涵盖 Python、OpenCV、PyTorch、经典网络(VGG/ResNet)、前沿算法(U-Net/DeepLab/Mask R-CNN),构建完整 AI 技术体系;
理论与实践结合:既讲解核心原理(如反向传播、卷积计算),又深入源码实现(如 PyTorch 自动求导、网络架构细节),配套论文解读,提升技术深度;
工程能力培养:强调数据预处理、增强策略、模型调优、部署测试等工程细节,贴近工业界实际开发需求。
