还剩48页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
机器学习与应用课程目标掌握机器学习核心技术与应用场景内容覆盖基础理论、主流算法、前沿应用学习方式理论结合实践,培养实际解决问题能力机器学习发展历程年代11950-70感知机模型诞生早期人工智能热潮年代21980-90神经网络研究复兴算法突破BP年至今32000深度学习崛起算力革命与大数据机器学习基本概念传统编程机器学习核心要素规则明确定义从数据中学习高质量数据人工设计逻辑自动发现模式适合场景算法有限规则集合持续优化模型泛化能力建设监督学习简介核心概念分类任务输入数据有标签预测离散类别学习输入输出映射关系如垃圾邮件识别-回归任务预测连续数值如房价预测非监督学习简介聚类分析自动发现数据分组降维技术简化特征空间异常检测识别不寻常模式应用场景客户细分、图像压缩强化学习简介智能体环境奖励做出决策的实体提供状态和反馈指导学习方向应用游戏、自动驾驶AI机器学习核心流程数据采集数据预处理获取高质量数据清洗与转换评估与部署模型训练性能测试与应用调整参数优化数据预处理方法缺失值处理删除或插补缺失数据数据标准化统一特征尺度范围异常值处理识别并去除离群点编码转换将分类变量数值化特征工程与重要性特征创造构建新的有效特征特征选择筛选相关性高特征特征降维精简特征空间原始数据收集高质量数据源线性回归原理目标函数设定建立线性关系y=wx+b最小二乘法最小化预测值与实际值差距参数求解通过梯度下降或闭式解模型应用预测房价、销量等连续值逻辑回归分类算法线性组合z=wx+b转换Sigmoid概率输出p=1/1+e^-z决策边界判定为正类p
0.5近邻算法()K KNN1距离计算2邻居选择欧氏距离或曼哈顿距离选取个最近样本K3类别投票4K值优化少数服从多数原则交叉验证选择最佳K支持向量机()SVM123最大间隔支持向量核技巧寻找最优分类超平面确定边界的关键样本处理非线性分类问题决策树与随机森林决策树随机森林层级规则结构多棵树集成信息增益选择分裂点抽样建立子树易解释但易过拟合投票决定结果集成学习方法贝叶斯分类器均值()聚类k K-means初始化随机选择个聚类中心K分配样本归入最近中心类别更新重新计算各类中心位置收敛重复直至中心稳定主成分分析()PCA标准化数据零均值单位方差计算协方差矩阵分析特征相关性特征值分解求解主成分方向降维映射投影至主成分空间层次聚类方法自下而上(聚合)自上而下(分裂)合并最相似点拆分差异大群体应用领域树状图结构生物分类、文档聚类直观显示聚类层次高斯混合模型()GMM概率分布算法EM多个高斯分布组合期望步骤估计分布软聚类方法最大化步骤优化参数优势比更灵活K-means可表达复杂形态分布神经网络基础结构输入层接收特征数据隐藏层非线性特征转换输出层产生预测结果反向传播调整权重优化误差激活函数的选择Sigmoid TanhReLU输出范围输出范围计算快速0,1-1,1易梯度消失梯度较大防梯度消失深度学习崛起背景算力提升大数据积累并行计算加速训练海量训练数据可用GPU算法改进竞赛推动新激活函数与优化方法等比赛促进发展ImageNet卷积神经网络()原理CNN卷积层提取局部特征模式池化层降维与位置不变性全连接层整合高级特征分类输出激活计算概率SoftMax循环神经网络()结构RNN基本结构LSTM GRU时间维度连接长短期记忆简化版LSTM隐状态记忆信息门控机制更少参数梯度容易消失或爆炸解决长依赖问题训练速度更快自编码器()与Autoencoder数据压缩编码器压缩特征至低维表示潜在空间数据精简表示解码器重建原始数据应用降噪、异常检测生成对抗网络()GAN随机输入生成器生成初始噪声向量创造逼真样本对抗训练判别器互相提升能力鉴别真伪样本迁移学习思路预训练模型微调策略大数据集训练基础能力冻结早期层保留特征提取通用特征表示调整后期层适应目标应用场景数据稀缺领域减少训练时间与成本强化学习核心算法深度强化学习神经网络表达复杂策略策略梯度法直接优化决策策略学习Q学习动作价值函数蒙特卡洛方法从完整序列学习模型训练与优化技巧过拟合与欠拟合欠拟合过拟合模型过于简单模型过于复杂训练集表现差训练集表现好测试集表现差测试集表现差解决增加模型复杂度解决正则化、早停参数调优与自动搜索网格搜索系统尝试参数组合随机搜索随机采样参数空间贝叶斯优化基于历史结果指导搜索进化算法模拟自然选择过程机器学习实验平台Scikit-learn TensorFlowPyTorch传统机器学习库工业级框架动态计算图简洁易用支持生产部署研究友好设计API评估指标与性能衡量指标类别常用指标适用场景分类准确率、精确率、召二分类多分类问题/回率、F1回归、、、连续值预测MSE MAER²RMSE聚类轮廓系数、兰德指数无监督分组排序、搜索与推荐MAP NDCG机器学习在计算机视觉中的应用图像分类目标检测语义分割识别图像主体内容定位与识别多个对象像素级别分类人脸识别身份验证与分析自然语言处理()应用NLP语音与音频智能处理推荐系统原理与应用协同过滤内容过滤基于用户或物品相似性基于物品特征匹配混合方法深度学习结合多种策略优势从行为序列挖掘兴趣4智能医疗中的机器学习96%皮肤癌检测超越普通医生水平90%肺部X光分析肺炎与结节检出率78%辅助诊断多种疾病预测准确率65%医疗效率提升医生工作流程改善金融风控与智能投资信用评分欺诈检测量化交易预测还款风险异常交易识别自动执行策略智能制造与质量检测质量追溯生产优化全流程质量管控预测性维护智能调整生产参数视觉检测提前预知设备故障发现产品表面缺陷机器学习在交通领域智能交通管理自适应信号灯控制出行规划实时路径优化安全驾驶风险预警系统机器人与自动化控制感知层决策层环境数据获取处理数据做出判断学习层控制层优化改进控制策略执行动作完成任务安全与伦理挑战AI算法公平性避免对特定群体歧视隐私保护保障用户数据安全法律责任明确事故归责界限安全边界防止滥用与失控AI大模型与热潮AIGC文本生成图像生成音频生成创作内容、对话助手艺术创作、产品设计音乐创作、声音克隆与智能化机器学习AutoML自动特征工程智能发现有效特征模型选择自动筛选最佳算法超参数优化高效搜索最优参数神经架构搜索自动设计网络结构量子机器学习展望量子优势量子算法现实挑战指数级计算加速量子量子退相干问题SVM解决复杂优化问题量子神经网络硬件规模限制机器学习未来发展趋势通用人工智能多领域泛化能力多模态融合跨感知模式协同高效计算低能耗神经架构可解释性增强透明决策机制课程实践与项目设计总结与展望知识储备实践能力创新思维持续学习新技术解决实际问题跨界融合应用团队协作复杂项目协同。
个人认证
优秀文档
获得点赞 0