还剩48页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
机器学习在图像识别中的应用数据驱动算法创新应用多元··图像识别技术改变世界赋能各行各业图像识别简介定义起源1让机器理解视觉信息的技术早期算法2模式识别与特征工程应用场景3医疗、安防、零售、工业机器学习简介无监督学习聚类与降维监督学习强化学习分类与回归任务决策与控制系统图像识别市场规模亿40023%全球市场规模中国年增长率年预计美元总值市场复合增速20243主要驱动力医疗、安防、零售图像识别技术发展回顾基础算法阶段年1960-1990手工特征高峰年2000-2012深度学习爆发年至今2012图像识别的常见任务分类检测分割识别图像主体类别定位多个目标位置像素级精确划分数据驱动的图像识别大规模数据集标注质量、等训练基影响模型表现高达ImageNet COCO20%础数据增强提升模型泛化能力标准流程与主流框架数据收集与标注构建训练与测试集预处理与增强归一化、裁剪、旋转模型训练与评估调参优化、验证效果部署与监控生产环境优化维护特征提取的发展历程传统手工特征、、SIFT HOGLBP浅层学习特征词袋模型、稀疏编码深度学习特征卷积网络自动提取监督学习在图像识别的应用工作原理典型任务评估指标利用标注数据训练模型图像分类准确率••目标检测召回率••输入与期望输出间建立映射图像回归分数••F1反向传播优化参数无监督学习的价值图像聚类自编码器无标签数据分组图像压缩与重建发现潜在相似性特征学习与降维生成对抗网络生成逼真图像增强训练样本半监督与弱监督图像识别少量标注数据伪标签技术降低标注成本利用模型自动标注2噪声标签处理一致性正则化减轻标注错误影响等算法Mean Teacher图像识别数据预处理方法去噪、缩放、归一化、增强、变换图像识别性能评估指标指标名称适用场景计算方式准确率分类任务正确预测比例Top-1/Top-5目标检测平均精度均值mAP分割任务交并比IoU二分类评价曲线下面积AUC ROC深度神经网络基础多层网络多层次特征提取基本感知机神经元基本单元权重与激活非线性映射能力卷积神经网络()原理CNN局部感受野权值共享池化操作多层特征卷积核捕获局部特征减少参数量降维与不变性浅层纹理到深层语义现代图像识别里程AlexNet碑年冠军2012ImageNet错误率降至15%多加速训练GPU突破计算瓶颈激活函数推广ReLU缓解梯度消失引领深度学习热潮催生后续研究与VGG GoogLeNet网络VGG GoogLeNet简化卷积核结构模块创新Inception卷积堆叠设计多尺度特征提取3x3层深度参数量大幅降低16-19与残差网络ResNet深层网络退化问题层数增加性能反而下降残差连接突破跳跃连接x+Fx性能突破层网络错误率低于1527%广泛影响成为当代主流backbone迁移学习与预训练模型大规模预训练百万图像训练ImageNet特征迁移冻结底层提取特征微调适应针对目标任务调整轻量级网络快速推理与移动端MobileNet ShuffleNetEfficientNet深度可分离卷积通道混洗机制复合缩放方法大幅减少计算量提高信息流动效率平衡网络各维度目标检测主流算法YOLO特点性能指标应用场景YOLO单阶段端到端达以上自动驾驶•mAP50%•实时检测速度安防监控••可达FPS45+全图特征理解工业检测••轻量版适合移动端原理与应用Faster R-CNN区域建议网络提出潜在目标区域RoI Pooling统一特征尺寸分类与回归精确识别与定位语义与实例分割精确到像素级别的识别技术生成对抗网络应用GAN图像合成风格迁移超分辨率艺术创作AI生成逼真的人物照片跨域转换低分辨率图像增强等工具CycleGAN Midjourney图像分类真实案例97%90+商用分类准确率类别数ImageNet高质量图像条件下超过个分类10005准确率Top-5超过人类水平人脸识别算法及其进化特征点定位人脸个关键点提取68DeepFace深度学习提升准确率FaceNet三元组损失突破性进展移动端优化轻量级人脸识别部署目标检测实际场景城市交通智慧零售工业检测车辆识别与流量分析客流监测与行为分析产品瑕疵自动识别图像分割医疗应用病理学图像分析细胞结构自动标记医学影像诊断异常识别CT/MRI心脏超声分析心室边界精确描绘肿瘤区域标注辅助医生诊断提速35%遥感图像智能分析安防视觉识别AI+实时监控能力典型场景公共场所摄像头智能分析火灾烟雾检测•闯入行为识别•秒级响应异常行为人员倒地报警•全天候无间断监测人群聚集监测•无人驾驶车辆感知视觉系统激光雷达多摄像头环视感知精确距离测量场景理解多传感器融合交通标志与道路识别综合环境理解智慧物流自动分拣机器人分拣条码识别系统集成高速抓取与投放高速准确读取信息全流程自动化处理零售行业图像识别实践商品识别顾客分析无需条码自动结算人流热力图生成智能货架缺货检测消费者行为洞察无人店铺亚马逊技术Go拿取即买体验农业与环境监测应用无人机监测病虫害识别产量预测灾害预警···工业质检与生产智能手机中的图像识别相册分类场景识别人像模式文档扫描···文档与文字识别()OCR秒98%+5100+识别准确率处理速度支持语言标准印刷体文字页面全文识别多语种文本提取A4图像识别与虚拟现实增强现实虚拟现实AR VR实时场景识别与标注三维空间重建虚实融合交互体验沉浸式环境构建智能家居场景中的应用人脸门禁智能监控宠物识别家庭成员自动识别异常行为主动预警宠物行为监测分析婴儿监护哭声检测与睡姿监测主要挑战数据与标签瓶颈1伦理与隐私数据合规使用限制标注成本专业标注费用高昂数据质量高质量样本获取困难主要挑战模型泛化与鲁2棒性过拟合问题模型仅适应训练数据特征域泛化困难跨场景适应性不足对抗样本威胁微小扰动造成误判长尾分布挑战稀有类别识别困难主要挑战计算效率与资源瓶颈3前沿发展自监督与大模型自监督学习等无需标签学习表示DINO多模态融合文本引导视觉理解CLIPFoundation Model统一视觉大模型崛起小样本泛化少量数据快速适应新任务伦理与安全AI算法公平性隐私保护避免模型偏见与歧视匿名化与合规处理深度伪造检测可解释性识别生成内容理解模型决策依据AI开源生态与竞赛推动开源框架与平台驱动创新未来趋势多模态与跨领域融合视觉感知图像理解与分割语言处理文本理解与生成音频分析声音识别与生成通用智能多模态统一理解行业权威与政策环境政策名称发布机构主要影响新一代规划国务院战略定位与资源配置AI伦理准则国家标准委规范发展与应用边界AI数据安全法全国人大数据收集与使用规范智慧城市标准住建部推动城市应用AI总结与回顾技术维度应用维度生态维度从传统到深度学习医疗、工业、零售开源推动创新•••模型架构演进安防、农业、自动驾驶伦理与安全并重•••轻量高效新方向跨界融合创新场景多元化产业链形成•••问题与互动讨论现场互动资料获取技术交流欢迎提问与分享经验扫码下载完整课件加入技术社区继续探讨。
个人认证
优秀文档
获得点赞 0