还剩58页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
深度学习人工智能领域中最前沿的技术,模拟人脑神经网络结构解决复杂问题从数据中自动学习特征,无需手动特征工程课程大纲基础理论神经网络架构、激活函数、前向与反向传播主要模型CNN、RNN、Transformer、GAN实际应用计算机视觉、自然语言处理、语音识别前沿技术迁移学习、模型压缩、可解释性什么是深度学习?多层神经网络数据驱动通过多层次架构自动提取特征从大量数据中学习规律端到端学习直接从原始数据到最终结果深度学习的历史11943McCulloch-Pitts神经元模型提出21986反向传播算法推广32006Hinton提出深度信念网络42012AlexNet在ImageNet比赛中取得突破深度学习传统机器学习vs传统机器学习深度学习需手动特征工程自动特征提取较少数据可训练需大量数据计算要求较低高计算资源深度学习的应用领域计算机视觉自然语言处理语音技术图像识别、目标检测机器翻译、情感分析语音识别、语音合成游戏与决策AlphaGo、自动驾驶深度学习的基础神经网络输入层接收原始数据隐藏层提取特征,层数越多,抽象程度越高输出层产生最终预测结果神经元模型1输入信号来自其他神经元的信息2权重参数控制各输入的重要性3偏置项调整激活阈值4激活函数引入非线性变换激活函数为神经网络引入非线性变换,使网络具有拟合复杂函数的能力前向传播输入数据加权求和激活转换输出结果原始特征向量对输入与权重做点积通过激活函数处理传递给下一层反向传播算法前向计算计算损失1获得预测结果与真实标签比较2参数更新反向传递43梯度下降优化计算梯度损失函数1均方误差MSE回归问题常用2交叉熵分类问题首选3Hinge Loss支持向量机使用4Focal Loss解决类别不平衡优化算法梯度下降计算梯度1求损失函数对各参数的偏导参数更新2沿梯度反方向更新迭代优化3重复直至收敛随机梯度下降()SGD批量梯度下降随机梯度下降小批量梯度下降全量数据计算梯度单样本更新批次数据更新稳定但速度慢快速但波动大平衡速度与稳定性深度学习框架介绍PyTorch TensorFlowMXNet Keras动态计算图,研究友好静态图,生产部署强多语言支持高层API,上手简单入门PyTorch张量操作类似NumPy,支持GPU加速动态计算图定义即运行,灵活调试自动微分自动计算梯度丰富生态模型库、部署工具入门TensorFlow计算图构建模型训练多平台部署静态图设计,高效执行支持分布式训练移动设备、浏览器支持可视化工具TensorBoard监控训练卷积神经网络()概述CNN1局部连接共享卷积核提取特征2空间层次结构逐层抽象视觉特征3平移不变性对位置偏移具有鲁棒性4参数共享大幅减少参数量的基本结构CNN全连接层池化层分类决策激活函数降维、抽象卷积层增加非线性特征提取卷积层详解卷积核步长填充滑动窗口,特征检测器控制滑动间隔保持特征图大小池化层详解最大池化平均池化提取最显著特征平滑特征降低计算量保留背景信息经典架构CNN LeNet-5卷积层C16个5×5卷积核池化层S22×2最大池化卷积层C316个5×5卷积核全连接层120→84→10经典架构CNN AlexNet1更深网络5个卷积层,3个全连接层2ReLU激活替代Sigmoid,减缓梯度消失3Dropout随机失活,防止过拟合4数据增强翻转、裁剪扩充训练集经典架构CNN VGGNet全连接层14096→4096→1000卷积块523个3×3卷积层卷积块3-43各3个3×3卷积层卷积块1-24各2个3×3卷积层经典架构CNN GoogLeNetInception模块1×1卷积并行多尺度卷积降维减少计算量辅助分类器全局平均池化缓解梯度消失替代全连接层经典架构CNN ResNet残差块解决梯度消失超深架构添加跳跃连接简化深层优化支持152层实用网络循环神经网络()概述RNN1序列建模2隐状态处理时序或序列数据存储历史信息3参数共享4可变长度各时间步使用相同权重处理不定长输入输出的基本结构RNN接收输入更新状态1当前时刻数据结合历史信息2传递状态生成输出43传给下一时刻当前预测结果长短期记忆网络()LSTM输入门遗忘门输出门控制新信息进入选择遗忘旧信息控制信息输出记忆单元长期存储信息门控循环单元()GRULSTM GRU三个门控机制两个门控机制记忆单元与隐状态分离更新门和重置门参数更多结构更简单高效序列到序列模型()Seq2Seq编码器将输入序列编码为向量中间状态传递上下文信息解码器生成目标序列注意力机制选择性关注动态关注输入的重要部分计算权重通过相似度评分确定重要性信息汇聚根据权重聚合信息解决长依赖缓解序列过长问题架构Transformer自注意力多头注意力位置编码捕捉序列内部关系学习多种特征关系注入序列位置信息并行计算高效增强表示能力解决位置丢失问题模型简介BERT1双向编码同时利用左右上下文2预训练任务掩码语言模型与句子关系预测3微调策略适应下游任务4强大性能刷新多项NLP任务记录模型系列GPT1GPT-1基础自回归语言模型2GPT-2扩大规模,零样本学习3GPT-31750亿参数,少样本学习4GPT-4多模态能力,推理增强生成对抗网络()概述GAN生成器判别器生成逼真样本区分真假样本从随机噪声创造数据提供梯度指导欺骗判别器学习数据分布的基本结构GAN随机噪声生成样本1生成器输入模拟真实数据2优化更新判别评估43对抗训练真假概率DCGAN深度卷积结构卷积替代全连接层批归一化稳定训练过程LeakyReLU判别器激活函数去池化层转置卷积上采样条件()GAN CGAN条件输入类别标签或属性条件控制引导生成过程目标生成特定条件的样本循环()GAN CycleGAN无配对数据循环一致性双向转换不需要一一对应样本保持内容不变形域A↔域B互相转换深度强化学习概述1agent与环境通过交互学习最优策略2奖励信号指导学习方向3深度网络近似值函数或策略4探索与利用平衡新尝试与已知收益和Q-learning DQNε-贪心策略目标网络平衡探索与利用经验回放稳定训练过程Q值函数存储并重用历史经验估计状态-动作价值策略梯度方法值函数方法策略梯度学习状态或状态-动作价值直接学习策略间接得到策略连续动作空间友好可学习随机策略方法Actor-Critic优势函数Actor Critic策略网络,选择动作价值网络,评估动作减少评估方差双网络协作互相提升性能深度学习在计算机视觉中的应用深度学习彻底改变计算机视觉领域,实现超人类精度的视觉理解能力图像分类任务定义识别图像主体类别主流模型ResNet、EfficientNet评估指标准确率、Top-5准确率数据集ImageNet、CIFAR目标检测两阶段方法单阶段方法先提取候选区域直接预测目标再分类与回归速度更快代表Faster R-CNN代表YOLO、SSD图像分割语义分割实例分割全景分割像素级类别划分区分同类不同物体结合语义与实例分割深度学习在自然语言处理中的应用机器翻译情感分析文本摘要跨语言文本转换理解文本情绪倾向生成关键内容概括对话系统智能交互与问答词嵌入技术One-hot编码稀疏高维向量分布式表示密集低维向量语义关系捕捉词汇间相似性迁移学习预训练词向量情感分析1文本预处理分词、去噪、规范化2特征提取词嵌入、上下文表示3分类模型CNN、RNN或Transformer4多粒度分析文档、句子、方面级别机器翻译源语言编码理解源语言含义语义转换跨语言语义映射目标语言生成流畅自然表达深度学习在语音识别中的应用声学特征提取1梅尔频率倒谱系数MFCC声学模型2CNN+RNN识别音素语言模型3预测词序列概率解码搜索4寻找最佳转录文本深度学习在推荐系统中的应用协同过滤基于用户-物品交互内容特征理解物品属性序列推荐捕捉用户兴趣演变多目标优化平衡点击率与满意度模型压缩与加速剪枝量化知识蒸馏移除冗余连接降低参数精度小模型学习大模型高效架构轻量级网络设计迁移学习源任务预训练大规模数据学习通用特征知识迁移权重初始化或特征提取目标任务微调小数据适应新任务少样本学习元学习度量学习学习如何学习学习相似性度量模型初始化策略基于样本间关系代表MAML代表Prototypical Networks深度学习的可解释性特征可视化注意力图局部解释理解网络关注点显示决策区域分析单个预测因素深度学习的前沿发展前沿趋势自监督学习、多模态融合、神经架构搜索、联邦隐私学习、生成式AI课程总结与展望主流模型实际应用掌握CNN、RNN、Transformer等解决视觉、语言、语音等问题基础理论未来方向扎实理解深度学习核心概念自监督、多模态、可解释性2314。
个人认证
优秀文档
获得点赞 0