还剩48页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
机器学习概览人工智能前沿技术探索赋能行业智慧升级重塑数字未来机器学习的定义本质概念核心原理让计算机无需明确编程即可学习基于数学统计建模通过数据识别模式自动改进从经验中优化算法表现机器学习的发展历史诞生期复兴期1950s1990-2000s图灵测试提出算法突破SVM第一个神经网络诞生互联网大数据积累1234低谷期爆发期至今1970-80s2010寒冬深度学习革命AI研究资金锐减计算能力大幅提升机器学习与人工智能关系人工智能AI模拟人类智能的广义学科机器学习ML的核心技术子集AI深度学习DL的特定分支方法ML为什么需要机器学习数据洪流处理远超人类处理能力的大规模数据分析模式识别能力发现隐藏在数据中的复杂关系自动化决策减少人为干预提高效率持续优化系统能随时间自我调整改进机器学习的主要应用领域语音识别图像识别推荐系统自动驾驶智能助手、语音指令系统人脸识别、医学成像分析个性化内容、产品推荐环境感知、路径规划现实场景中的机器学习医疗健康金融风控疾病预测欺诈检测医学影像诊断信用评分智能客服智能制造自动问答质量预测情感分析设备维护机器学习的分类监督学习有标签数据训练无监督学习无标签数据挖掘强化学习奖惩机制指导半监督学习结合少量标签与大量无标签数据监督学习介绍80%X→Y使用比例核心模式当前应用最广泛类型输入特征映射到目标输出2主要任务分类与回归无监督学习介绍聚类分析降维技术相似数据自动分组减少数据复杂度异常检测关联规则识别离群点发现数据间隐藏关系强化学习简介智能体环境决策执行单元提供状态信息奖励行动行动评价反馈智能体的选择机器学习流程数据获取收集清洗标注特征工程提取变换选择模型训练算法选择参数优化评估部署性能检验实际应用特征工程特征提取从原始数据中抽取有用信息特征变换标准化、归一化、独热编码特征选择剔除冗余特征减少维度特征创建组合现有特征构建新特征评价指标与模型选择分类指标精确率真正例真正例假Precision/+正例召回率真正例真正例假Recall/+负例分数精确率与召回率的调F1和平均回归指标平均绝对误差MAE均方根误差RMSE验证方法交叉验证折、留一法K线性回归数学原理应用案例寻找最佳拟合直线房价预测最小化预测值与实际值误差平方和销售额预测形式温度关系建模y=wx+b逻辑回归近邻算法()K KNN距离计算值选择多数表决K欧氏距离邻居数量设定分类采用投票曼哈顿距离通常为奇数回归取平均值支持向量机()SVM最大间隔超平面寻找最佳分隔边界决策树根节点决策最具区分度的特征分支规则基于信息增益叶节点预测分类或数值结果优缺点易理解但易过拟合随机森林多棵决策树构成森林每棵树使用随机数据子集投票或平均提高稳定性梯度提升树()GBDT残差学习框架实现每棵树学习前一棵树的误差XGBoost序列化建树过程LightGBMCatBoost朴素贝叶斯条件概率基于贝叶斯定理特征独立性假设简化计算复杂度垃圾邮件过滤词频分析判断邮件类型计算高效训练速度快参数少均值聚类K随机初始化选取个初始聚类中心K分配样本每个点归属最近中心更新中心重新计算各类均值迭代优化直至中心点稳定主成分分析()PCA降维原理数据可视化噪声过滤投影到主要方差方向高维数据二维展示保留主要信息去除冗余神经网络基础输入层隐藏层接收数据特征非线性变换处理反向传播输出层调整网络权重生成预测结果深度学习简介多层结构层数更多抽象能力更强并行计算加速训练过程GPU大数据驱动需要海量训练样本卷积神经网络()CNN卷积层特征提取过滤器池化层降维提取主要特征全连接层综合特征分类预测循环神经网络()RNN记忆能力保留序列历史信息循环连接当前输出影响后续状态变种LSTM解决长期依赖问题语言建模文本生成机器翻译生成式模型自编码器学习数据压缩表示重建输入数据变分自编码器VAE生成连续潜在空间概率分布建模生成对抗网络GAN生成器与判别器博弈创造逼真内容扩散模型逐步去噪过程、DALL-E StableDiffusion集成学习方法方法方法方法Bagging BoostingStacking并行训练多个基学习器序列化训练基学习器多层模型堆叠随机森林典型代表关注难分样本元学习器整合基学习器预测降低方差减少过拟合、例子AdaBoost GBDT自动机器学习()AutoML自动特征工程模型搜索特征选择与转换自动筛选最佳算法平台工具超参数优化、H2O Auto-sklearn自动调参找最优配置Google AutoML迁移学习预训练模型知识迁移减少目标任务数据需求加快模型收敛速度图像识别案例人脸识别图像自动标注医学图像安防监控、身份验证内容组织、智能检索疾病筛查、辅助诊断语音识别案例声音信号处理提取音频特征声学模型声音到音素映射语言模型句法语义分析应用场景智能助手、会议记录、字幕生成自然语言处理案例文本分类情感分析对话系统新闻分类产品评论分析智能客服垃圾信息过滤社交媒体监测聊天机器人推荐系统案例协同过滤基于用户相似性推荐内容过滤基于物品属性匹配混合推荐多种策略结合优化应用领域电商、视频、音乐、新闻金融风控案例医疗健康案例疾病预测糖尿病风险评估心脏病预警模型医学影像肺部CT分析皮肤病变识别基因分析药物反应预测个性化治疗方案自动驾驶案例环境感知摄像头雷达激光雷达数据融合高精地图厘米级定位导航路径规划最优行驶路线计算控制执行转向加速制动精确控制智能制造案例视觉质检产品缺陷自动检测精度高于人工检查设备预测性维护提前预警故障风险减少停机时间生产计划优化资源调度自动化提升生产效率智能供应链需求预测库存优化降低物流成本机器学习前沿进展架构自监督学习Transformer自注意力机制无需人工标注并行处理序列数据从数据本身学习表示领域革命性突破大幅减少标注成本NLP大模型与生成式AI参数规模数十亿到千亿具备强大知识表示能力创造性内容生成能力联邦学习本地训练模型上传数据不离开设备仅共享模型参数更新分发服务器聚合全局模型下发各方合并多方模型无监督自监督新趋势对比学习预训练模型AlphaFold学习数据相似性表示蛋白质结构预测突破大规模语料自我学习机器学习面临的挑战黑盒透明性难以解释深度模型决策过程数据偏见训练数据不平衡导致结果歧视隐私安全数据使用与个人隐私保护能源消耗大模型训练需巨量计算资源未来发展方向多模态学习1视觉语言听觉综合理解小样本学习2更少数据更快适应通用人工智能跨领域任务迁移能力机器学习学习资源一览经典教材在线课程《机器学习》周志华吴恩达机器学习《深度学习》计算机视觉Ian GoodfellowCS231n《统计学习方法》李航李宏毅深度学习开源工具与平台学习路径与成长建议1打好基础数学统计编程基础2理论学习算法原理系统掌握3项目实战真实数据动手实践4社区交流开源贡献比赛参与总结与互动答疑核心概念回顾机器学习核心原理主流算法分类应用领域总结行业场景实践案例解决方案思路前沿动态最新研究突破技术发展趋势互动环节开放问题讨论学习资源分享。
个人认证
优秀文档
获得点赞 0