还剩58页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
深度学习技术探索人工智能的前沿技术,了解神经网络如何改变我们的世界课程概述课程目标学习内容12掌握深度学习核心理论与实践神经网络基础到前沿应用全覆技能盖考核方式3理论测试与实践项目相结合第一章深度学习基础人工智能发展历程从图灵测试到现代AI机器学习与深度学习关系子集关系与核心区别深度学习优势自动特征提取与模型能力人工智能发展历程图灵测试(年)11950机器智能评估的开创性概念达特茅斯会议(年)21956人工智能学科正式诞生冬天(年)3AI1974-1993两次研究低谷与资金减少深度学习兴起(年至今)42006计算能力与数据推动新繁荣机器学习与深度学习的关系深度学习1神经网络多层结构表示学习2自动学习数据表示机器学习3从数据中学习模式人工智能4模拟人类智能的广泛领域深度学习的优势自动特征提取无需手工设计特征端到端学习直接从原始数据到最终输出强大表示能力可学习复杂非线性关系迁移学习能力知识可跨任务迁移第二章神经网络基础前向传播激活函数信息流动与计算过程生物神经元与人工神经元引入非线性变换从自然到人工的智能单元生物神经元与人工神经元生物神经元结构权重和偏置树突、细胞体、轴突组成决定神经元对输入的响应强度人工神经元模型输入、权重、求和、激活激活函数激活函数引入非线性,使网络能学习复杂模式前向传播输入层原始数据进入网络隐藏层加权求和后通过激活函数输出层产生最终预测结果第三章深度神经网络训练反向传播算法2计算梯度的高效方法损失函数1衡量模型预测与真实值差距优化算法3更新参数以减小损失损失函数均方误差交叉熵损失损失MSE Hinge回归问题常用分类任务首选支持向量机与边界优化反向传播算法前向计算1从输入到输出计算损失2评估预测质量反向传递误差3应用链式法则计算梯度优化算法Momentum累积梯度加速收敛优化器Adam随机梯度下降SGD自适应学习率,更稳定基础算法,波动大第四章卷积神经网络CNN的基本结构卷积层1CNN2专为处理网格数据设计使用滤波器提取空间特征池化层3降维并保留重要信息的基本结构CNN输入层1原始图像数据卷积层2提取局部特征激活函数层3引入非线性池化层4降低维度,提高鲁棒性全连接层5综合特征进行分类卷积层卷积核概念步长和填充特征图提取局部特征的滤波器控制特征图尺寸卷积结果表示提取的特征池化层全局池化最大池化整个特征图压缩为单值保留区域最大值平均池化计算区域平均值经典架构CNN1LeNet-51998首个成功的,手写数字识别CNN2AlexNet2012深度学习复兴,冠军ImageNet3VGGNet2014简单统一结构,卷积堆叠3x34ResNet2015残差连接突破层数限制第五章循环神经网络RNN基本结构长短期记忆网络门控循环单元RNN LSTMGRU处理序列数据的网络解决长期依赖问题的简化变体LSTM基本结构RNN循环连接展开的时间反向传播RNN状态在时间步间传递多时间步的计算图贯穿时间的梯度计算长短期记忆网络LSTM输出门输入门筛选输出内容记忆单元遗忘门长期存储信息控制新信息更新决定丢弃哪些信息门控循环单元GRU重置门更新门与比较LSTM控制忽略先前状态程度控制新旧信息比例更简单,参数更少第六章生成对抗网络GAN基本原理生成器网络GAN1生成器与判别器对抗学习创造逼真样本2训练过程判别器网络43博弈平衡达成区分真假数据的基本原理GAN零和博弈生成器目标判别器目标一方收益等于另一方损失生成判别器无法识别的样本准确区分真实与生成样本生成器和判别器判别器网络结构生成器网络结构损失函数设计二分类器判别真假从随机噪声创造数据对抗目标的数学表达的训练过程GAN固定训练G D判别器学习区分真假固定训练D G生成器改进生成质量重复迭代达到纳什均衡评估生成质量、等指标FID IS第七章深度强化学习强化学习基础智能体与环境交互Q-learning经典表格式强化学习算法深度网络Q DQN深度学习与强化学习结合强化学习基础智能体通过试错学习与环境交互的最优策略Q-learning值更新公式贪心策略经验回放Qε-当前值学习率时间差分误差平衡探索与利用存储并重用历史交互数据Q+×深度网络Q DQN神经网络替代表Q目标网络处理高维状态空间稳定训练过程Double DQN减轻值过估计Q第八章迁移学习迁移学习概念预训练模型微调技术知识跨领域应用已学习通用表示的网络针对特定任务的适应迁移学习概念领域自适应处理分布差异知识迁移多任务学习源任务学习帮助目标任务同时学习多个相关任务213预训练模型预训练模型预训练模型系列模型ImageNet BERTGPT视觉任务基础模型双向语言理解生成式预训练转换器微调技术冻结层策略锁定前层,仅训练后层学习率调整不同层使用不同学习率渐进式微调逐步解冻更多层第九章模型压缩与加速模型剪枝知识蒸馏12移除冗余连接与神经元小模型学习大模型知识量化技术3降低参数精度模型剪枝权重剪枝通道剪枝结构化剪枝移除小权重连接移除整个特征通道保持规则结构的剪枝知识蒸馏训练教师模型1大型复杂网络提取软标签2教师模型概率输出训练学生模型3模仿教师知识的小网络量化技术定点量化二值化网络浮点数转换为整数权重限制为+1/-1量化感知训练训练过程模拟量化效果第十章深度学习框架TensorFlow PyTorchMXNet开发的端到端的动态计算支持的高效框Google FacebookAmazon平台图框架架TensorFlow开发的完整生态系统,从研究到生产部署GooglePyTorch动态计算图机制autograd运行时构建的计算图自动微分追踪操作类nn.Module构建神经网络的基础MXNet命令式编程即时执行操作符号式编程接口Gluon静态定义计算图高级简化开发API第十一章计算机视觉应用图像分割目标检测像素级别的精确识别图像分类定位并分类多个物体识别图像主要内容图像分类数据集评估指标实现示例与准确率与错误率迁移学习应用ImageNet CIFAR-10Top-5目标检测评估指标衡量检测质量mAP二阶段检测器一阶段检测器精度高Faster R-CNN与速度快YOLO SSD图像分割语义分割实例分割全景分割与像素分类区分个体统一处理FCN U-Net MaskR-CNN PanopticFPN第十二章自然语言处理应用词嵌入序列到序列模型1文本数值表示变长序列转换2注意力机制Transformer43自注意力架构关注重要信息词嵌入维度空间训练速度语义捕获词嵌入将单词映射到低维向量空间,捕获语义关系序列到序列模型机器翻译语言间转换文本摘要生成关键内容概述对话系统生成上下文相关回复注意力机制与Transformer位置编码保留序列顺序信息自注意力多头注意力序列内部关系建模并行处理不同特征第十三章语音识别与合成语音特征提取声学模型12从原始波形获取特征特征映射到音素语言模型3音素序列转换为文本语音特征提取将声音波形转换为深度学习模型可处理的表示声学模型混合模型模型HMM-DNN CTC结合统计模型与神经网络端到端训练无需对齐模型RNN-T流式识别的转录器语言模型应用BERT模型N-gram上下文感知的语言理解神经网络语言模型基于词序列概率更强的泛化能力第十四章深度学习前沿元学习图神经网络神经架构搜索学会如何学习处理图结构数据自动设计网络结构元学习快速适应1少量样本学习新任务算法MAML2学习最优初始化参数算法Reptile3的一阶近似简化MAML图神经网络应用场景图注意力网络GAT图卷积网络GCN社交网络、分子结构、知识图谱注意力加权的邻居聚合邻域聚合操作神经架构搜索搜索空间定义可能网络架构的集合搜索策略强化学习或进化算法算法DARTS可微分架构搜索总结与展望理论基础模型架构1深度学习核心原理、、等CNN RNNGAN2前沿方向应用领域43更高效、更可解释视觉、语言、语音处理。
个人认证
优秀文档
获得点赞 0