还剩28页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
深度学习教学案例课件目录010203深度学习简介与发展历程基础理论与关键技术经典模型详解了解深度学习的基本概念、历史发展与重要里程掌握神经网络结构、损失函数、优化算法等核心深入理解、、等经典模型架构CNN RNNTransformer碑知识040506训练技巧与优化方法典型应用案例最新研究与未来趋势学习解决训练挑战、迁移学习与模型压缩技术探索计算机视觉、自然语言处理等领域的实际应了解前沿发展方向与深度学习的社会影响用总结与学习建议第一章深度学习简介与发展历程从感知机到大型语言模型,探索深度学习的演进历程什么是深度学习?深度学习是机器学习的一个分支,通过模仿人脑神经网络的多层结构,实现复杂模式的识别与学习其核心特点是能够自动提取数据特征,无需人工设计特征提取器,直接从原始数据中学习表示从年的感知机到现代的深度神经网络,经历了理论突破与算力提1958升的双重驱动,实现了从简单分类到创造性生成的能力跨越深度学习的里程碑年年20122017在竞赛中以超过的优势战胜架构发表,彻底改变自然语言处理领域,AlexNet ImageNet10%Transformer传统方法,标志深度学习时代的正式到来为大型语言模型奠定基础1234年年后20142020(生成对抗网络)的提出,开创了生成模型新范、、等大规模预训练模型GAN GPT-3DALL-E ChatGPT式,引发图像生成领域革命爆发,能力突破人类想象AI这些里程碑事件不仅推动了技术进步,也深刻改变了人们对人工智能能力的认知和期待每一次突破都源于算法创新、数据规模扩大和计算能力提升的共同作用深度学习发展时间轴神经网络理论时期年感知机提出,奠定神经网络理论基础1943-1969寒冬AI年遇到理论瓶颈,研究停滞1970-1985复苏期年反向传播算法推广,神经网络重获关注1986-2006爆发期至今加速、大数据、算法创新推动深度学习全面爆发2012GPU第二章基础理论与关键技术深入理解神经网络的数学基础与核心技术神经网络基础结构输入层隐藏层接收原始数据,每个节点代表一个输处理信息的核心,层数越多,网络越入特征如图像中的像素点,文本中深每层由多个神经元组成,通过激的词向量活函数引入非线性输出层产生最终预测结果,如分类问题中的类别概率,回归问题中的预测值神经网络通过前向传播计算预测值,再通过反向传播调整权重,不断逼近最优解常用激活函数,解决梯度消失问题ReLU:fx=max0,x,输出范围Sigmoid:fx=1/1+e^-x0,1,输出范围Tanh:fx=e^x-e^-x/e^x+e^-x-1,1损失函数与优化算法常用损失函数优化算法交叉熵损失()随机梯度下降()Cross EntropySGD适用于分类问题,衡量预测概率每次使用小批量数据更新参数,分布与真实分布的差异平衡效率与精度优化器Adam自适应学习率方法,结合动量与均方误差()优点MSE RMSProp适用于回归问题,测量预测值与学习率调整策略真实值的平方差学习率衰减、余弦退火等动态调整方法过拟合与正则化过拟合现象正则化Dropout模型在训练数据上表现极佳,但在测试数据上性能大幅下降原因是模型学习了训练数据中的噪声,而非真实规训练过程中随机关闭一部分神经元,防止网络过度依赖特定特征测试时使用所有神经元但缩放权重律正则化数据增强L2在损失函数中添加权重平方和惩罚项,鼓励模型学习更小的权重值,提高泛化能力通过旋转、缩放、裁剪等变换扩充训练数据,提高模型对各种变化的鲁棒性第三章经典模型详解深入解析各类神经网络模型的结构与特点卷积神经网络()CNN核心特性CNN局部感受野权值共享每个神经元只连接输入的一个局部区同一特征图中的神经元共享相同的权域,大幅减少参数数量重,进一步减少参数池化操作通过下采样减少特征维度,增强平移不变性在图像识别、物体检测、图像分割等计算机视觉任CNN务中取得了巨大成功,是深度学习最成熟的应用领域之一经典架构CNN最早成功应用的,用于手写数字识别LeNet-51998CNN深度学习爆发的引擎,首次证明深度的强大能力AlexNet2012CNN引入残差连接,成功训练超深网络,解决梯度消失问题ResNet2015循环神经网络()与变种RNN标准RNN处理序列数据的经典模型,通过隐藏状态保存历史信息但存在长序列梯度消失问题,难以捕获长距离依赖长短期记忆网络()LSTM引入记忆单元和多个门控机制(输入门、遗忘门、输出门),有效解决长期依赖问题门控循环单元()GRU的简化版本,只有更新门和重置门,参数更少但性能相当,训练更快LSTM应用场景语言模型机器翻译时间序列预测预测文本序列中下一个词的将源语言序列转换为目标语股票价格、天气、用电量等概率分布言序列趋势预测与自注意力机制Transformer模型于年提出,彻底颠覆了传统序列处理方式,抛弃了Transformer2017的递归结构,完全基于注意力机制构建RNN核心创新自注意力机制通过计算序列中每个位置与所有位置的关联度,实现并行计算与全局依赖建模代表模型BERT双向编码器,擅长理解文本语义Transformer架构的突破性优势并行计算,训练效率更高系列单向解码器,擅长文本生成•GPT捕获全局依赖,不受距离限制•统一框架,将所有任务转化为文本到文本生成T5NLP可扩展性强,支持超大规模模型•生成模型12生成对抗网络()变分自编码器()GAN VAE由生成器和判别器组成的博弈系统,通将输入编码为概率分布,从分布中采样过对抗训练生成逼真样本生成新样本,实现连续空间的插值生成生成高质量人脸图像•StyleGAN隐空间规则化,提高生成多样性无需配对数据的图像••CycleGAN转换生成过程更稳定,但质量略逊于•有监督的图像到图像转换GAN•Pix2Pix3扩散模型通过逐步添加噪声再逐步去噪的过程学习数据分布,目前图像生成的最强模型、、•DALL-E2Stable DiffusionMidjourney结合文本条件,实现文本到图像生成•第四章训练技巧与优化方法解决深度网络训练难题,提升模型性能训练深度网络的挑战梯度消失与爆炸局部最小值与鞍点反向传播时,梯度可能会随着层数增优化过程可能陷入局部最小值或鞍点,加而指数级减小(消失)或增大(爆无法找到全局最优解炸)解决方案动量优化、随机梯度下降、解决方案梯度裁剪、批归一化、残学习率调度差连接、合适的激活函数批归一化与层归一化随着网络层数增加,训练难度呈指数级增长,需要特殊通过归一化层输入分布,加速训练收敛,提高稳定性技术保证稳定性变种、、、BatchNorm LayerNormGroupNorm InstanceNorm迁移学习与微调预训练模型优势利用大规模数据预训练的模型已学习通用特征,可作为下游任务的起点减少所需训练数据量•加快收敛速度•提高最终性能•微调策略根据目标任务和可用资源选择适当微调方法特征提取冻结预训练层,只训练新层•全模型微调低学习率更新所有参数•分层微调不同层使用不同学习率•领域自适应解决源域与目标域分布差异问题对抗域适应•自监督对齐•渐进式迁移•迁移学习是资源受限场景下的关键技术,特别适用于医疗影像、工业检测等专业领域,能有效解决数据稀缺问题网络压缩与加速为什么需要模型压缩?主要压缩与加速技术随着深度学习模型规模不断扩大,部署面临诸多挑战网络剪枝移动设备存储空间有限•移除不重要的连接或神经元,减少参数量边缘计算设备算力受限•彩票假设大型网络中存在小型子网络,性能相当实时应用对延迟要求高•云端部署成本与能耗考量•知识蒸馏大型教师模型指导小型学生模型学习,传递知识软目标提供更丰富的监督信号量化与低精度计算将位浮点数转为位或更低精度表示328大幅减少内存占用和计算量第五章典型应用案例探索深度学习在各领域的实际应用与成功案例计算机视觉案例目标检测同时实现物体定位与分类的任务系列单阶段检测器,速度快,实时性好YOLO两阶段检测器,精度高Faster R-CNN应用自动驾驶、安防监控、零售分析•图像分割像素级别的分类,精确识别物体边界编码器解码器架构,医学图像分析首选U-Net-在目标检测基础上添加分割分支Mask R-CNN应用医疗影像分析、遥感图像处理•医疗影像分析辅助医生诊断的重要工具肺部中的肺结节检测,准确率超过•CT95%眼底图像中的糖尿病视网膜病变分级•病理切片中的癌细胞识别与计数•自然语言处理案例机器翻译与文本生成情感分析与问答系统情感分析识别文本中表达的情感倾向、强度与具体情绪应用社交媒体监测、产品评价分析、客户满意度调研智能问答基于检索或生成的问答系统,提供精准答案应用客服机器人、知识库查询、智能助手技术ChatGPT基于的大规模语言模型,通过强化学习对齐人类偏好Transformer应用交互式对话、内容创作、知识检索谷歌神经机器翻译()利用深度网络实现端到端翻译,大幅提升翻译质量GNMT LSTM系列模型能生成连贯、逻辑一致的长文本,应用于创意写作、内容创作、代码生成GPT等强化学习与游戏AI深度强化学习基础围棋突破AlphaGo结合深度学习与强化学习,通过与环境交互学习最优策略年战胜世界冠军李世石,年战胜柯洁20164-120173-0核心算法、、等,解决高维状态空间问题关键技术蒙特卡洛树搜索、策略网络与价值网络结合DQN A3C PPO1234强化学习项目算法Minecraft AlphaZero挑战赛在有限资源下学习挖掘钻石等复杂任务通用棋类算法,完全自学习,在围棋、国际象棋和将棋中全MineRL AI面超越人类结合分层强化学习与模仿学习,处理极其复杂的状态空间零人类知识,纯自我对弈,探索更普遍的人工智能方法对抗攻击与安全防护对抗攻击类型白盒攻击黑盒攻击攻击者完全了解模型结构与参数,通过梯度计算设计攻击者只能访问模型输入输出,通过查询接口探索对对抗样本抗样本如、、等算法如边界攻击、查询高效攻击等FGSM PGDDeepFool物理攻击在现实世界中的干扰,如特制贴纸、特殊纹理可解释与安全AI如对自动驾驶中的路标识别攻击增强系统的可解释性有助于识别潜在攻击和安全漏洞AI防御策略关键技术显著性图、LIME、SHAP值、概念激活向量可解释不仅提高安全性,也增强用户信任,有助于模型调试与改进AI对抗训练将对抗样本纳入训练数据,提高鲁棒性输入净化通过预处理或去噪移除对抗扰动模型集成组合多个模型决策,降低单点脆弱性第六章最新研究与未来趋势探索深度学习的前沿进展与未来发展方向自监督学习与无监督学习传统监督学习的局限需要大量标注数据,成本高昂且效率低下人工标注可能引入偏见,且难以扩展到新任务自监督学习的突破从数据本身自动生成监督信号,无需人工标注预训练微调范式,大幅提高数据利用效率-代表模型、、、BERT SimCLRMAE CLIP大规模预训练模型数万亿参数模型捕获丰富的语言和视觉知识少样本学习能力强,迁移到下游任务高效代表模型、、、GPT-3/4PaLM ClaudeGemini未来发展方向多模态自监督学习整合文本、图像、音频等知识引导的自监督结合结构化知识与自监督持续自监督学习动态环境中不断更新知识终身学习与元学习灾难性遗忘问题元学习学会如何学习神经网络在学习新任务时倾向于覆盖旧任务的知识,导致性能急剧下降训练模型在短时间内适应新任务,实现快速学习者的能力算法MAML寻找对多个任务都敏感的初始化参数少量梯度步骤就能适应新任务ProtoNet基于原型的度量学习在嵌入空间中比较样本相似度应用前景缓解策略个性化推荐系统、医疗诊断弹性权重合并()保护重要参数•EWC经验回放存储旧任务样本定期重训机器人快速适应新环境•知识蒸馏保留旧模型知识•深度学习的社会影响与伦理公平性与偏见隐私保护系统可能继承并放大训练数据中的社会偏见,深度学习模型可能记忆训练数据中的敏感信息,AI导致对特定群体的不公平对待存在隐私泄露风险案例招聘筛选系统性别偏见案例模型反向提取训练数据••解决方向公平性度量、去偏技术解决方向差分隐私、联邦学习••透明度与可解释性教育与就业深度模型的黑盒特性限制了在高风险领域的应的发展正在改变教育内容与就业市场,需要新AI用和监管型人才培养模式案例医疗诊断决策解释案例传统工作岗位自动化••解决方向可解释研究、审计工具解决方向终身学习、跨学科教育•AI•人工智能技术的快速发展要求我们同步推进伦理准则与监管框架建设,确保技术造福人类而非带来伤害研究人员、企业和政策制定者需要共同努力,建立负责任的发展生态AI第七章总结与学习建议构建有效的学习策略,持续提升深度学习技能深度学习学习路径与资源推荐系统学习路径实践建议01从小项目开始数学基础选择范围明确的小项目,快速获得反馈和成就感线性代数、概率统计、微积分、优化理论推荐手写数字识别、简单情感分析、股价预测02编程技能复现经典论文、、数据处理Python PyTorch/TensorFlow实现论文中的模型,深入理解算法细节从、等里程碑模型入手ResNet BERT03机器学习基础参与开源社区监督无监督学习、评估方法、特征工程/贡献代码,与同行交流,快速跟进前沿进展04推荐、生态Hugging FacePyTorch深度学习理论神经网络、优化算法、正则化技术持续学习与展望深度学习领域发展迅猛,保持学习习惯至关重要05专业领域深入关注顶会论文、、、•CVPR NeurIPSICLR ACL参与线上讨论、学术社区•Reddit Twitter计算机视觉、、强化学习等专项学习NLP尝试跨学科结合与自身专业领域结合应用•推荐学习资源期待你成为深度学习的下一个引领者!李宏毅深度学习教程全面且通俗易懂的视频课程,上有完整资料GitHub《动手学深度学习》结合理论与代码实践的互动教材,支持多种深度学习框架竞赛平台通过实际项目提升技能,学习顶尖方案Kaggle。
个人认证
优秀文档
获得点赞 0