还剩28页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
**学院《大数据分析技术》课程教学大纲(课程类别理论课(含课内实践))课程基本信息大数据分析技术课程名称Bigdata AnalysisTechnology课程代码0600084课程性质■必修口选修口思想政治理论课口通识课程口专业基础课程■专业核心课程课程类型□专业方向(选修)课程口集中性实践课程口创新创业与劳动教育课程口通识扩展课程考核方式□考试■考查适用专业数据科学与大数据技术开课单位数学与计算机学院开课学期第工_学期学时学分学分2总学时48理论学时16实践学时32先修课程数学分析、高等代数、概率论与数理统计、Python程序设计
二、课程简介(性质、内容、任务)性质《大数据分析技术》是应用统计学专业的一门专业核心课内容本课程主要介绍数据预处理、无监督学习、有监督学习(回归、分类)和深度学习五个模块的数据分析理论及实践,对应有数据预处理、插值与拟合、回归分析(一元和多元、线性和非线性)、logistic回归、树结构模型(决策树、随机森林、轻梯度提升机器)、支持向量机、聚类分析(模糊c均值聚类、kmeans++、KNN)、特征降维(PCA、ICA、t-SNE)、复杂网络分析及基于pytorch的深度学习(经典神经网络、深度神经网络)等数据分析技术任务:通过本课程的学习,学生可以了解数据的价值及数据分析的重要性,掌握数据预处理、机器学习、深度学习等数据分析技术,具备数据建模、python编程、应用统计、数据分析报告撰写等能力课程目标三本课程的任务是通过课堂教学和实验教学,使学生获得数据科学与大数据技术领域的基本知识,提高学生分析和解决大数据价值挖掘方面问题的能力,支撑专业学习成果中相应指标点的达成通过本课程学习,预期学生可以具备以下知识、技能或素养课程目标1(L01)熟练掌握和运用数据预处理的基本原理、基本概念、基本知识对原始数据进行数据清洗、数据集成、缺失项(及重复项、奇异项)数据的发现与处理、数据变换(标准化、归一化、离散化、编码)、数据规约等一系列操作,原始数据经预处理后成为数据成品,不能使用无监督学习完成聚类分析、特征降维、复杂网络分析等数据分析任务,不能评估聚类模型的精确性,不能通过可视化技术观不及格0-59察降维效果能熟练地建立神经网络或深度学习模型,熟练运用神经网络或深度优90-100学习方法完成因果推断、趋势预测、模式识别等数据分析任务能较好地建立神经网络或深度学习模型,能较好地运用神经网络或L04理解神经网络及深度学良80-89深度学习方法完成因果推断、趋势预测、模式识别等数据分析任务习的概念,能熟练建立神经网络或深度学习模型,熟练运用能建立神经网络或深度学习模型,能运用神经网络或深度学习方法中70-79神经网络或深度学习方法完完成因果推断、趋势预测、模式识别等数据分析任务成因果推断、趋势预测、模式基本能建立神经网络或深度学习模型,基本能较好地运用神经网络识别等数据分析任务或深度学习方法完成因果推断、趋势预测、模式识别等数据分析任及格60-69务不能建立神经网络或深度学习模型,不能运用神经网络或深度学习不及格0-59方法完成因果推断、趋势预测、模式识别等数据分析任务
2.课堂表现及书面作业课程目标评分标准能够熟练针对数据分析目的及要求,熟练地选取数据预处理方法,完成对原始数据的预处理;优90-100出勤率高,每次按时提交作业,作业字迹工整,作业内容正确;实践作业、研讨作、业,均能积极参与,对所讨论内容理解正确能够较好地针对数据分析目的及要求,较好地选取数据预处理方法,较好地完成对原始数据的预处理;出勤率较高,每次按时提交作业,作业字迹工整,作业内容正良80-89确;L01熟练运用所学数据预处理相关知识对原始数据进行数实践作业、研讨作业,均能积极参与,对所讨论内容理解正确能够针对数据分析目的及要求,能够选取数据预处理方法,完成据集成、数据清洗、数据变换、对原始数据的预处理;数据规约等操作出勤率较高,每次按时提交作业,作业字迹工整,作业内容正中70-79确;实践作业、研讨作业,均能积极参与,对所讨论内容理解正确基本能够针对数据分析目的及要求,基本能够选取数据预处理方法,基本能够完成对原始数据的预处理;及格60-69出勤率不高;实践作业、研讨作业,均能参与,对所讨论内容理解基本正确能针对数据分析任务及目的选取合适的数据预处理方法来完成对原始数据的预处理;不及格0-59出勤率低,不能按时提交作业;不参与实践作业或研讨作业能够熟练针对数据分析目的及要求,熟练地选取监督学习方法完成数据分析任务;优90J00出勤率高,每次按时提交作业,作业字迹工整,作业内容正确;实践作业、研讨作业,均能积极参与,对所讨论内容理解正确能够较好地针对数据分析目的及要求,较好地选取监督学习方法完成数据分析任务;良80-89出勤率高,每次按时提交作业,作业字迹工整,作业内容正确;实践作业、研讨作业,均能积极参与,对所讨论内容理解正确L02熟练运用所学监督学习能够针对数据分析目的及要求选取合适的监督学习方法完成数据分方法完成数据预处理、因果推析任务;断、趋势预测、分类等数据分中70-79出勤率较高,每次按时提交作业,作业字迹工整,作业内容正确;析任务,能熟练评估模型的精实践作业、研讨作业,均能较好地参与,对所讨论内容理解正确确性,能对线性回归等回归模型进行参数估计和统计检验基本能够针对数据分析目的及要求选取合适的监督学习方法完成数据分析任务;及格60-69出勤率不高,每次按时提交作业,作业字迹工整,作业基本正确;实践作业、研讨作业,基本能参与,对所讨论内容埋解基本正确不能选取监督学习方法完成数据分析任务;出勤率低,不能按时提交作业;不及格0-59不参与实践作业或研讨作业能够熟练针对数据分析目的及要求,熟练地选取无监督学习方法完成聚类分析、特征降维或复杂网络分析等任务;L03熟练运用无监督学习完优90-100出勤率高,每次按时提交作业,作业字迹工整,作业内容正确;实成聚类分析、特征降维、复杂践作业、研讨作业,均能积极参与,对所讨论内容理解正确网络分析等数据分析任务,能能够较好地针对数据分析目的及要求,较好地选取无监督学习方熟练评估聚类模型的精确性,法完成聚类分析、特征降维或复杂网络分析等任务;能熟练通过可视化技术观察降出勤率较高,每次按时提交作业,作业字迹工整,作业内容正良80-89维效果确;实践作业、研讨作业,均能积极参与,对所讨论内容理解正确能够针对数据分析•目的及要求选取无监督学习方法完成聚类分析、特征降维或复杂网络分析等任务;中70-79出勤率一般,每次能提交作业,作业字迹工整,作业内容正确;实践作业、研讨作业,能较积极参与,对所讨论内容理解正确基本能够针对数据分析目的及要求选取无监督学习方法完成聚类分析、特征降维或复杂网络分析等任务;及格60-69出勤率不高,每次能提交作业,作业内容基本正确;实践作业、研讨作业,能参与,对所讨论内容理解基本正确不能针对数据分析目的及要求选取无监督学习方法完成聚类分析、特征降维或复杂网络分析等任务;不及格0-59出勤率低,不按时提交作业;不参与实践作业或研讨作业能够熟练针对数据分析目的及要求,熟练地选取神经网络或深度学习方法完成回归或分类任务;优90-100出勤率高,每次按时提交作业,作业字迹工整,作业内容正确;实践作业、研讨作业,均能积极参与,对所讨论内容理解正确能够较好地针对数据分析目的及要求,较好地选取神经网络或深度学习方法完成回归或分类任务;出勤率较高,每次按时提交作业,作业字迹工整,作业内容正良80-89确;L04理解神经网络及深度学实践作业、研讨作业,均能积极参与,对所讨论内容理解正确习的概念,能熟练建立神经网能够针对数据分析目的及要求选取神经网络或深度学习方法完成络或深度学习模型,熟练运用回归或分类任务;神经网络或深度学习方法完成中70-79出勤率一般,每次能提交作业,作业内容正确;因果推断、趋势预测、模式识实践作业、研讨作业,能积极参与,对所讨论内容理解正确别等数据分析任务基本能够针对数据分析目的及要求选取神经网络或深度学习方法完成回归或分类任务;及格60-69出勤率不高,每次按时提交作业,作业基本正确;参与实践作业或研讨作业,对所讨论内容理解基本正确不能针对数据分析•目的及要求选取神经网络或深度学习方法完成回归或分类任务;不及格0-59出勤率低,不按时提交作业;不参与实践作业或研讨作业
3.期末考查大作业或课程论文课程目标评分标准L01:熟练掌握和运用数据能够很好地掌握数据预处理知识,对基本内容有很好的理解优90-100预处理的基本原理、基本概能够较好地掌握数据预处理知识,对基本内容有较好的理解良80-89念、基本知识完成相关数据能够掌握数据预处理知识,对基本内容有一定的理解中70-79预处理任务基本上能够掌握数据预处理知识,对基本内容有一定的了解及格60-69不能够掌握数据预处理知识,对基本内容不了解不及格0-59根据数据分析任务能熟练地选择恰当的机器学习模型,能熟练地选用适优90J00宜的模型评估方法,并能熟练地比较不同方法的优缺点L02:熟练运用所学监督学习根据数据分析任务能较好地选择恰当的机器学习模型,能较好地选用适良80-89知识完成数据预处理、回归宜的模型评估方法,并能较好地比较不同方法的优缺点和分类等数据分析任务,能根据数据分析任务能选择恰当的机器学习模型,能选用适宜的模型评估中70-79熟练评估模型的精确性,能方法,并能比较不同方法的优缺点对线性回归等回归模型进行根据数据分析任务基本能选择恰当的机器学习模型,基本能选用适宜的及格60-69参数估计和统计检验模型评估方法,并基本能比较不同方法的优缺点根据数据分析任务不能选择恰当的机器学习模型,不能选用适宜的模型不及格0-59评估方法,也不能比较不同方法的优缺点根据数据分析任务,能够熟练地选择无监督学习模型进行聚类分析、特征降维或复杂网络分析,对聚类分析能熟练选用模型精确性的评估方法,优90J00对特征降维能熟练地通过可视化技术观察降维效果根据数据分析任务,能较好地地选择无监督学习模型进行聚类分析、特征降维或复杂网络分析,对聚类分析能较好地选用模型精确性的评估方良80-89L03熟练运用无监督学习法,对特征降维能较好地地通过可视化技术观察降维效果完成聚类分析、特征降维、复根据数据分析任务,能选择无监督学习模型进行聚类分析、特征降维或杂网络分析等数据分析任复杂网络分析,对聚类分析能选用模型精确性的评估方法,对特征降维中70-79务,能熟练评估聚类模型的能通过可视化技术观察降维效果精确性,能熟练通过可视化根据数据分析任务,基本能选择无监督学习模型进行聚类分析、特征降技术观察降维效果维或复杂网络分析,对聚类分析基本能选用模型精确性的评估方法,对特及格60-69征降维基本能通过可视化技术观察降维效果根据数据分析任务,不能选择无监督学习模型进行聚类分析、特征降维或复杂网络分析,对聚类分析不能选用模型精确性的评估方法,对特征不及格0-59降维不能通过可视化技术观察降维效果L04理解神经网络及深度根据数据分析任务,能熟练地选择基于PyTorch的深度学习模型完成回声令iVi如汇台匕nit4/f z丰优90-100FTr力山归或分类等数据分析任务于<1的概,心,日匕熟练建根据数据分析任务,能较好地选择基于PyTorch的深度学习模型完成回良80-89孑甲经网络或深度学习模归或分类等数据分析任务型,熟练运用神经网络或深根据数据分析任务,能选择基于PyTorch的深度学习模型完成回归或分中70-79度学习方法完成因果推断、类等数据分析任务趋势预涮1梢#I口国1笺物则、快八以力II寺数如根据数据分析任务,基本能选择基于PyTorch的深度学习模型完成回归及格60-69柝A柘伴7TlzHit务或分类等数据分析任务根据数据分析任务,不能选择基于PyTorch的深度学习模型完成回归或不及格(0-59)分类等数据分析任务
六、教材与主要参考书目(填写说明列出获省、部级以上获奖或公认的水平较高的新教材以及有特色的公开出版的自编教材和教学参考书书名、作者、出版社、出版时间、版次等应清晰、准确网络课程资源也在此一并列出)【教材】
1.大数据分析与挖掘.石胜飞.北京人民邮电出版社,2018,第一版该教程荣誉
(1)教育部高等学校计算机类专业教学指导委员会-华为ICT产学合作项目
(2)数据科学与大数据技术专业系列规划教材
(3)华为信息与网络技术学院指定教材
2.Python机器学习基础教程.安德里亚斯・穆勒[德],莎拉・吉多[美].北京:人民邮电出版社,2018,第一版该教程荣誉图灵程序设计丛书
3.PyTorch深度学习和图神经网络.李金洪.北京人民邮电出版社,2021,第一版
4.自编讲义,大数据分析技术【主要参考书】
1.Python数据处理与挖掘.吴振宇,李春忠,李建峰.北京人民邮电出版社,20202应用多元统计分析.高惠璇.北京北京大学出版社,
2005.
3.数据科学与大数据技术导论.杜小勇.北京人民邮电出版社,
20214.Python深度学习基于PyTorch.吴茂贵,郁明敏,杨本法,李涛.北京机械工业出版社,2023,第2版七大纲编写的依据与说明(填写说明本大纲撰写的相关依据,如培养方案、专业指导委员会要求、专业认证要求、课程指导委员会要求或者专业培养需要等等其它需要说明的问题也可在此列出)本课程教学大纲是根据数据科学与大数据技术专业培养目标和基本要求,结合本课程的性质、教学的基本任务和基制定人:审核人:审核日期2023年10月本要求,及我校应用型本科院校建设及应用性人才培养方案等来制定的**学院《大数据分析技术》教学大纲(课程类别课程设计)
一、课程基本信息大数据分析技术课程名称Bigdata AnalysisTechnology课程代码0600084课程性质0必修口选修口思想政治理论课口通识课程口专业基础课程0专业核心课程课程类型□专业方向(选修)课程口集中性实践课程口创新创业与劳动教育课程口通识扩展课程考核方式□考试0考查适用专业数据科学与大数据技术开课单位数学与计算机学院开课学期6学时学分学分1学时1周先修课程数学分析、高等代数、概率论与数理统计、Python数学实验、大数据分析技术
二、课程性质、目的与任务(说明本实践课程在人才培养过程中的地位及作用,概括本课程的指导思想,提出本课程的任务通过本实践课程,学生得到哪方面的实际训练,掌握那些基本操作和技能包括对学生分析、解决问题的能力,实践能力和创新能力的培养等)性质《大数据分析技术》课程设计是数据科学与大数据专业的一门专业方向课内容本课程主要在大数据分析技术课堂教学的基础上,对源于医疗、工业、金融、农业等领域的大数据应用所学大数据分析技术开发一个数据分析工具包(Python API),并将该工具包应用于更加广泛领域的数据,提高数据分析水平,俱备初级软件开发水平任务通过本课程的学习,学生可以了解对源于生产或生活中的数据建立数学模型(主要是机器学习模型)方面的知识,掌握运用Python开发一个数据分析或可视化的自建库函数(API)的方法和流程,并将自建库函数推广应用于更广泛类型的数据,达到从数据资源中获取价值的目标,具备API开发和撰写设计说明书(或设计报告)等能力
三、课程目标及其对毕业要求的支撑本课程的任务是通过设置医卫大数据分析、有色金属工业大数据分析、金融大数据分析、农林牧副渔大数据分析等内容的课程设计,使学生获得医卫、工业、金融、农业等领域相关数据分析的基本知识,提高学生解决问题和分析问题的能力,支撑专业学习成果中相应指标点的达成通过本课程学习,预期学生可以具备以下知识、技能或素养课程目标1L01掌握监督学习方法的基本原理、基本概念和基本知识,熟练运用插值、拟合、回归分析、树结构模型、支持向量机等技术进行数据建模,进而完成数据预处理、因果推断、趋势预测、特征重要性评估等分析任务,并对模型精确性进行有效评估课程目标2L02掌握无监督学习的基本原理、基本概念和基本知识,熟练运用聚类分析、特征降维等技术进行数据建模,进而完成样本归类、标准模式库的建立等分析任务,并对模型精确性进行有效评估,对降维效果进行可视化熟练运用复杂网络分析相关知识完成社交网络、互联网搜索、信用评估和风险控制、交通流量管理、流行病学研究等领域的数据分析任务,挖掘网络中的超级节点和社区结构课程目标3L03掌握神经网络和深度学习的基本原理、基本概念和基本知识,熟练运用神经网络和深度学习建立数据分析模型,完成回归或分类等任务课程目标支撑毕业要求指标点及指标内涵支撑毕业要求指标点
2.3,
3.3对源于各领域的数据抽象建模,选择恰当的监督学习L01模型对数据进行描述和分析-数据填充、因果推断、趋势预测、
2.3,
3.3特征重要性提取等,并对模型精确性进行评估和修正
2.3,
3.3对源于各领域的数据抽象建模,选择恰当的无监督学习模型对数据进行描述和分析-特征降维、对象归类、标准模式库L
022.3,
3.3建立、社区发现、中心性分析等,并对聚类模型精确性进行评估和修正,对降维效果进行可视化
2.3,
3.3,
5.1对源于各领域的数据抽象建模,选择恰当的深度学L03习模型对数据进行描述和分析-回归、分类、预测等,并将模型
2.3,
3.3,
5.1应用于相关领域的实践注毕业要求指标点及指标内涵通用标准中的毕业要求指标点与本专业相结合进行描述四内容及要求教学内容1通过实例讲解大数据分析设计流程根据设计任务查阅资料制定设计方案,再根据数据分析的目的和要求进行数据预处理,、选择相关模型进行实验,并对模型进行评估,最后对模型进行封装2学生分组完成设计课题老师分配设计课题,学生按老师讲解的流程独立地完成所分配的课题,并按课程设计任务书推进设计工作,按时提交设计报告,并积极准备答辩在这个阶段老师采取互动的方式帮助、指导学生在方案设计、实验调试、python实现及封装过程中遇到的各种问题3答辩陈述自己的设计作品,并回答老师针对性的提问设计要求
1、通过大数据分析模型的建立、实现、调参及多方案的比较等环节掌握机器学习及深度学习等数据分析技术和工程设计方法
2、综合应用大数据分析技术课程中学到的理论知识去独立完成一个设计任务
3、通过严格的科学训练和设计实践,逐步树立严肃认真、一丝不苟、实事求是的工作作风和严谨的科学态度教学重点根据设计任务及要求对课题进行分析,通过查阅资料等了解数据背景及当前研究状况,搭建技术框架、选择合适的机器学习或深度学习模型,得到设计方案;对多方案进行评估,选择最优方案对完成数据分析任务;写出设计总结报告教学难点根据任务得到设计方案,Python实现
五、教学单元及学时分配教学单元(含思政融入)学时分配支撑教学目标教学方法与教学手段集中授课,教师利用多媒体讲解课程设计的流U
1.关于该课程设计的内通过讲解让学生掌
1.5天程,并结合实例介绍设计框架搭建、模型选择、容讲解握设计流程实验过程的要点、难点以及注意事项让学生思考并得到采取互动的方式帮助、指导学生在方案设计、实U
2.设计方案确定、实验
2.5天设计方案,并熟练实验调试、python实现及封装过程中遇到的各种问及程序封装等现设计方案题指导学生按照规范撰写课程设计报告;验收基于U
3.撰写课程设计报告及培养学生独立撰写1天设计方案进行封装的API;组织学生分组答辩、答辩设计报告的能力现场提问
六、考核方式与成绩评定标准以平时表现、设计报告、答辩等形式进行考核(-)成绩评定方法考核环节权重考核要素考核方式1(平时表现)20%根据考勤、互动、学习态度、实践等方面考核考核方式2(设计报告)50%根据设计内容是否完整、正确、报告的撰写质量考核考核方式3(答辩)30%根据内容汇报、问题回答、团队表现情况酌情给分合计100%
(二)课程目标评定权重考核方式1考核方式2考核方式3(权重合计课程目标权课程目标达成课程目标(权重:20%)(权重50%)30%)(权重100%)重度分数分配分数分配分数分配课程目标分数L0145%45454545Q1L0235%35353535Q2L0320%20202020Q3合计100%
10010010010036.5课程目标达成度计算方法1课程目标分数计算M1=A1*K1+A2*K2+A3*K3;2课程分目标达成度计算Q1=K1*该项课程目标考核方式1学生平均分+e*该项课程目标考核方式2平均分+13*该项课程目标考核方式3平均分/Ml3课程目标总达成度含n个课程目标:Q=M1XY1+M2XY2+M3XY34以上课程目标数量和考核方式数量可自行确定三评分标准
1.平时表现课程目标评分标准针对设计课题,能熟练独立地查阅关于监督学习的文献、收集资料;能快速准确地制定课程设计方案和日程安排90-100设计态度认真,遵守纪律,出勤率高积极参与组内讨论,对所讨论内容理解正确针对设计课题,能较好地查阅关于监督学习的文献、收集资料;能较快速地制定课程设计方案和日程安排80-89设计态度认真,遵守纪律,出勤率高较积极地参与组内讨论,对所讨论内容埋解正确针对设计课题,能查阅关于监督学习的文献、收集资料;能制定课程课程目标1设计方案和日程安排70-79设计态度比较认真,出勤率较高较积极地参与组内讨论,对所讨论内容埋解基本正确针对设计课题,基本能查阅关于监督学习的文献、收集资料;基本能制定课程设计方案和日程安排60-69设计态度比较认真,出勤率一般较积极地参与组内讨论,对所讨论内容理解基本正确针对设计课题,不能查阅关于监督学习的文献、收集资料;不能制定课程设计方案和日程安排设计态度一般,出勤率低不参与组内讨论0-59针对设计课题,能熟练独立地查阅关于无监督学习的文献、收集资料;能快速准确地制定课程设计方案和日程安排90-100设计态度认真,遵守纪律,出勤率高积极参与组内讨论,对所讨论内容埋解正确课程目标2针对设计课题,能较好地查阅关于无监督学习的文献、收集资料;能较快速地制定课程设计方案和日程安排80-89设计态度认真,遵守纪律,出勤率高较积极地参与组内讨论,对所讨论内容理解正确针对设计课题,能查阅关于无监督学习的文献、收集资料;能制定课程设计方案和日程安排70-79设计态度比较认真,出勤率较高较积极地参与组内讨论,对所讨论内容理解基本正确针对设计课题,基本能查阅关于无监督学习的文献、收集资料;基本能制定课程设计方案和日程安排60-69设计态度比较认真,出勤率一般较积极地参与组内讨论,对所讨论内容埋解基本正确针对设计课题,不能查阅关于无监督学习的文献、收集资料;不能制定课程设计方案和日程安排设计态度一般,出勤率低不参与组内讨论0-59针对设计课题,能熟练独立地查阅关于深度学习等相关的文献、收集资料;能快速准确地制定课程设计方案和日程安排90-100设计态度认真,遵守纪律,出勤率高积极参与组内讨论,对所讨论内容理解正确针对设计课题,能较好地查阅关于深度学习等相关的文献、收集资料;能较快速地制定课程设计方案和日程安排80-89设计态度认真,遵守纪律,出勤率高较积极地参与组内讨论,对所讨论内容埋解正确针对设计课题,能查阅关于深度学习等相关的文献、收集资料;能制课程目标3定课程设计方案和日程安排70-79设计态度比较认真,出勤率较高较积极地参与组内讨论,对所讨论内容理解基本正确针对设计课题,基本能查阅关于深度学习等相关的文献、收集资料;基本能制定课程设计方案和日程安排60-69设计态度比较认真,出勤率一般较积极地参与组内讨论,对所讨论内容理解基本正确针对设计课题,不能查阅关于深度学习等相关的文献、收集资料;不能制定课程设计方案和日程安排设计态度一般,出勤率低不参与组内0-59讨论
2.设计报告课程目标评分标准能够熟练针对设计任务及要求,熟练地选取监督学习模型搭建课题的技术框架,能熟练地实验及封装;90-100按期圆满完成规定的设计任务,工作量饱满,难度适宜;设计报告立论正确,论述充分,结论严谨合理,文字通顺,技术用语准确,符号统一,编号齐全,图表完备,书写工整规范课程目标1能够较好地针对设计任务及要求,较好地选取监督学习模型搭建课题的技术框架,能较好地实验及封装;按期较圆满地完成规定的设计任务,工作量较饱满,难度适宜;设计80-89报告立论正确,论述充分,结论较为严谨合理,文字通顺,技术用语准确,符号统一,编号齐全,图表完备,书写工整规范保存于数据仓库进行分类和管理,备后续应用(开启数据分析第一个步骤)课程目标2(L02)掌握监督学习方法的基本原理、基本概念和基本知识,熟练运用插值、拟合、回归分析、树结构模型、支持向量机等技术进行数据建模,进而完成数据预处理、因果推断、趋势预测、特征重要性评估等分析任务,并对模型精确性进行有效评估课程目标3(L03)掌握无监督学习的基本原理、基本概念和基本知识,熟练运用聚类分析、特征降维等技术进行数据建模,进而完成样本归类、标准模式库的建立等分析任务,并对模型精确性进行有效评估,对降维效果进行可视化熟练运用复杂网络分析相关知识完成社交网络、互联网搜索、信用评估和风险控制、交通流量管理、流行病学研究等领域的数据分析任务,挖掘网络中的超级节点和社区结构课程目标4(L04)理解神经网络的概念,并能延伸理解深度学习的概念熟练运用神经网络和深度学习知识建立数据分析模型,完成因果推断、趋势预测等任务支撑毕业要求指标点及贡课程目标支撑毕业要求指标点及指标内涵献度()H/M/L2-3对原始数据进行预处理数据集成、数据清洗、数据变换及数L012-3/M据归约,并对预处理完成的数据进行有效管理以备后用3-3能熟练运用有监督机器学习相关方法和原理进行数据预处理、L02因果推断和趋势预测等分析,并能对模型精确性进行评估,能对模3-3/H型进行统计检验3-3能熟练运用无监督机器学习相关方法和原理进行聚类分析、特L033-3/H征降维和复杂网络分析,并能对聚类模型精确性进行评估5-1能运用深度学习相关方法和原理进行图像分类、目标检测、文L045-1/H本分类等分析(说明将通用标准中的毕业要求指标点及指标内涵与本专业知识和能力相结合进行描述;H-高支撑、M-中支撑、L-低支撑)
四、教学内容及要求教学单元一数据预处理学时9其中实验学时6支撑课程目标
4、5填写说明某一单元包含的主要内容,不写章节,可逐项列出须包含思政融入点、教学重难点内容思政融入点重点难点数据集成培养“数据是战略资源”数据集成的概念数据集成的Python实现主要内容数据清洗意识,树立加强数据管理、数据清洗的概念数据清洗的Python实现数据安全观念数据变换数据变换的概念数据变换的Python实现数据归约填写说明实验名称、学时、目的要求、方法原理、主要实验仪器及材料、掌握要点、实验内容、实验类型(演示性、验证性、设计性、综合性、研究性等)、实验要求(必做、选做)、安全教育实验内容实1实验名称数据集成-新冠疫情数据统计验2学时3能针对设计任务及要求选取监督学习模型搭建课题的技术框架,能实验及封装;按期完成规定的设计任务,工作量较饱满;60-79设计报告立论基本正确,论述较为充分,结论较为严谨合理,文字通顺,技术用语准确,书写工整规范基本能针对设计任务及要求选取监督学习模型搭建课题的技术框架,基本能实验及封装;基本能按期完成规定的设计任务,工作量一般;60-69设计报告立论基本正确,论述较为充分,结论较为严谨合理,技术用语准确,书写较为工整规范不能针对设计任务及要求选取监督学习模型搭建课题的技术框架,不能实验及封装;0-59不能按期完成规定的设计任务,工作量不足能够熟练针对设计任务及要求,熟练地选取无监督学习模型搭建课题的技术框架,能熟练地实验及封装;按期圆满完成规定的设计任务,工作量饱满,难度适宜;90-100设计报告立论正确,论述充分,结论严谨合理,文字通顺,技术用语准确,符号统一,编号齐全,图表完备,书写工整规范能够较好地针对设计任务及要求,较好地选取无监督学习模型搭建课题的技术框架,能较好地实验及封装;按期较圆满地完成规定的设计任务,工作量较饱满,难度适宜;设计80-89报告立论正确,论述充分,结论较为严谨合理,文字通顺,技术用语准确,符号统一,编号齐全,图表完备,书写工整规范能针对设计任务及要求选取无监督学习模型搭建课题的技术框架,课程目标2能实验及封装;按期完成规定的设计任务,工作量较饱满;60-79设计报告立论基本正确,论述较为充分,结论较为严谨合理,文字通顺,技术用语准确,书写工整规范基本能针对设计任务及要求选取无监督学习模型搭建课题的技术框架,基本能实验及封装;基本能按期完成规定的设计任务,工作量一般;60-69设计报告立论基本正确,论述较为充分,结论较为严谨合理,技术用语准确,书写较为工整规范不能针对设计任务及要求选取无监督学习模型搭建课题的技术框架,不能实验及封装;0-59不能按期完成规定的设计任务,工作量不足能够熟练针对设计任务及要求,熟练地选取深度学习模型搭建课题的技术框架,能熟练地实验及封装;课程目标390-100按期圆满完成规定的设计任务,工作量饱满,难度适宜;设计报告立论正确,论述充分,结论严谨合理,文字通顺,技术用语准确,符号统一,编号齐全,图表完备,书写工整规范能够较好地针对设计任务及要求,较好地选取深度学习模型搭建课题的技术框架,能较好地实验及封装;按期较圆满地完成规定的设计任务,工作量较饱满,难度适宜;设计80-89报告立论正确,论述充分,结论较为严谨合理,文字通顺,技术用语准确,符号统一,编号齐全,图表完备,书写工整规范能针对设计任务及要求选取深度学习模型搭建课题的技术框架,能实验及封装;按期完成规定的设计任务,工作量较饱满;60-79设计报告立论基本正确,论述较为充分,结论较为严谨合理,文字通顺,技术用语准确,书写工整规范基本能针对设计任务及要求选取深度学习模型搭建课题的技术框架,基本能实验及封装;基本能按期完成规定的设计任务,工作量一般;60-69设计报告立论基本正确,论述较为充分,结论较为严谨合理,技术用语准确,书写较为工整规范不能针对设计任务及要求选取深度学习模型搭建课题的技术框架,不能实验及封装;0-59不能按期完成规定的设计任务,工作量不足
3.答辩课程目标评分标准能够熟练地陈述本组的设计思想、设计技术路线及设计结果,对监督学习模型选用理由描述恰当90-100能够熟练且准确地回答教师提出的问题,表达清晰,思维敏捷能较好地陈述本组的设计思想、设计技术路线及设计结果,对监督学习模型选用理由描述比较恰当80-89能较好地回答教师提出的问题,回答较为正确,表达清晰能陈述本组的设计思想、设计技术路线及设计结果,对监督学习模型选课程目标1用理由描述基本恰当70-79能回答教师提出的问题,回答较为正确,表达较为清晰基本能陈述本组的设计思想、设计技术路线及设计结果,基本能描述监督学习模型选用的理由60-69基本能回答教师提出的问题,回答基本正确,表达基本清晰不能陈述本组的设计思想、设计技术路线及设计结果,不能描述监督学习模型选用的理由0-59不能回答教师提出的问题,或回答不正确能够熟练地陈述本组的设计思想、设计技术路线及设计结果,对无监督学习模型选用理由描述恰当90-100能够熟练且准确地回答教师提出的问题,表达清晰,思维敏捷课程目标2能较好地陈述本组的设计思想、设计技术路线及设计结果,对无监督学习模型选用理由描述比较恰当80-89能较好地回答教师提出的问题,回答较为正确,表达清晰能陈述本组的设计思想、设计技术路线及设计结果,对无监督学习模型选用理由描述基本恰当70-79能回答教师提出的问题,回答较为正确,表达较为清晰基本能陈述本组的设计思想、设计技术路线及设计结果,基本能描述无监督学习模型选用的理由60-69基本能回答教师提出的问题,回答基本正确,表达基本清晰不能陈述本组的设计思想、设计技术路线及设计结果,不能描述无监督学习模型选用的理由0-59不能回答教师提出的问题,或回答不正确能够熟练地陈述本组的设计思想、设计技术路线及设计结果,对深度学习模型选用理由描述恰当90-100能够熟练且准确地回答教师提出的问题,表达清晰,思维敏捷能较好地陈述本组的设计思想、设计技术路线及设计结果,对深度学习模型选用理由描述比较恰当80-89能较好地回答教师提出的问题,回答较为正确,表达清晰能陈述本组的设计思想、设计技术路线及设计结果,对深度学习模型选课程目标3用理由描述基本恰当70-79能回答教师提出的问题,回答较为正确,表达较为清晰基本能陈述本组的设计思想、设计技术路线及设计结果,基本能描述深度学习模型选用的理由60-69基本能回答教师提出的问题,回答基本正确,表达基本清晰不能陈述本组的设计思想、设计技术路线及设计结果,不能描述深度学习模型选用的理由0-59不能回答教师提出的问题,或回答不正确
七、教材与主要参考书目
[1]大数据分析理论、方法及应用.史蒂文・S.斯基纳Steven S.Skiena,北京机械工业出版社,2022,第一版
[2]大数据实践45家知名企业超凡入圣的真实案例.伯纳德・马尔Bernard Marr.北京电子工业出版社,2020,第一版
[4]基于Python的大数据分析基础及实战.余本国.北京:水利水电出版社,2018,第一版
[5]大数据时代的统计学思维.刘强.北京:水利水电出版社,2018,第一版八大纲编写的依据与说明本课程教学大纲是根据数据科学与大数据技术专业培养目标和基本要求,结合本课程的性质、教学的基本任务和基制定人:审核人:日期:本要求,及我校应用型本科院校建设及应用性人才培养方案等来制定的《大数据分析技术》课程设计指导书
一、课程设计目的与任务本课程设计是为数据科学与大数据技术、应用统计学等相关专业设置的,是这些专业教学计划中实践环节的有机组成部分,在完成了数学分析(或高等数学)、高等代数(或线性代数)、概率论与数理统计、Python程序设计、大数据分析技术等课程的学习之后,接受本课程设计的综合训练,提升数据分析实践创新能力本课程设计的任务是培养学生对源于生产或生活中的数据建立数据模型,然后运用Python开发一个数据分析或可视化的自建库函数(API),并将自建库函数推广应用于更广泛类型的数据,实现从数据资源中获取价值的目标,最后撰写设计说明书(或设计报告)等方面的能力,培养方式以上机操作和实践为主通过课程设计的综合训练,让学生加深对数据科学概论、大数据分析技术等课程理论与方法的掌握,同时具备对源自生产生活实际的数据进行分析与挖掘并提供解决方案的能力,改变传统的理论教学与生产实际脱节的现象,从而解决实践创新能力相对薄弱的问题
二、课程设计组织及教学方式由指导教师向学生发放有关的课程设计背景资料,并向学生讲述课程设计的方法、步骤和要求,设计过程采取在实验室机房中集中辅导,学生独立设计的方式进行在设计的每个环节中,学生每人1台计算机独立自主地进行操作,教师则巡回指导并回答学生的问题
三、课程设计课题及步骤(-)设计课题当前本课程设计的相关课题如下表所示对下述所有课题课程设计要达到的目标是,就课题设计任务的解决过程及相关算法集成为一个PythonAPL以解决普适性问题序号课题设计任务1我国省域数字经济评估
1.数字经济受到三大定律的支配,其中第一个定律是梅特卡夫法贝数字网络的价值等于其节点数的平方请以梅特卡夫法则为准则,完成下述三问
(1)自定义网络价值;
(2)按自定义的数字网络价值计算表中各省级行政单位的数字网络的价值;
(3)可视化相关结果
2.根据当前数据,选用合适的方法预测各省级行政单位在2021年的数据
3.根据当前数据(不包括预测的2021年的数据),对各省级行政单位在各年的数字经济水平进行评估2肾病综合征影响因素分本设计要求根据所附数据集研究慢性肾病综合征(CKD)的影响特征,并析据此对CKD患者进行识别
1.建立两个CKD识别模型,比如logistic模型和随机森林模型;
2.对模型中的参数进行估计,并对模型精度进行评估(随机森林没有待估计的参数);
3.现有100份体检数据,见附件“体检待识别数据.xlsx”,试应用所建模型对这100份体检数据进行识别,给出识别结果3帕金森病步态分析本设计根据所附数据集研究帕金森患者的步态特征,并据此对帕金森患者进行识别
1.建立两个帕金森病识别模型,比如logistic模型和随机森林模型;
2.对模型中的参数进行估计,并对模型精度进行评估(随机森林没有待估计的参数);
3.现有如下3名受试者的步态数据,见附件“三名受试者步态数据.zip,试应用所建模型对三名受试者进行识别4胆囊术后胆漏病理因素由所附数据集进行胆囊术后胆漏病例分析分析
1.用至少两种相关性描述各变量与胆漏的相关性;
2.建立胆漏识别模型,并对模型进行评估(包括混淆矩阵、ROC曲线,等);
3.根据模型提取各变量的重要性并可视化;
4.提取重要性前10或前多个变量重新建模,并对模型进行评估5小麦种子的识别本设计根据所附数据集研究小麦种子的识别规则,并据此对小麦进行识别
1.对数据先进行描述性统计分析,再进行标准化变换;
2.应用标准化数据建立小麦品种的logistic识别模型及神经网络识别模型;
3.对logistic模型,要求对模型中的参数进行估计,并提取各特征的重要性;
4.对两个模型的精度进行评估,要求输出描述精度的混淆矩阵;
5.现获得一批小麦麦粒在7个特征上的观测值,见数据集中“新样本”表,试识别这批小麦分别来自哪个品种6城市重金属污染问题本设计要求完成以下任务
1.可视化8种主要重金属元素在该城区的空间分布;
2.根据可视化结果分析重金属污染物的传播特征,确定污染的源和汇的位置;
3.应用TOPSIS方法对该城区内不同区域重金属的污染程度进行综合评价;
4.对该城区内不同区域重金属的污染程度进行聚类分析7红葡萄酒的评价本设计要求完成以下任务
1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2.根据附件1中两组评酒员的评价结果对葡萄酒进行质量分级
3.葡萄酒质量等级与酿酒葡萄的理化指标紧密相关,试建立以酿酒葡萄的理化指标为变量、以葡萄酒质量等级为目标的葡萄酒等级识别模型,并对模型进行评估本设计要求完成以下任务8雷达回波的识别
1.对数据集进行描述性统计分析;
2.对数据集进行标准化变化;
3.应用标准化数据建立大气结构的决策树识别模型和支持向量机识别模型;
4.对建立的识别模型进行评估,并以ROC及混淆矩阵来可视化评估结果本设计根据所附数据集研究鲍鱼年龄的预测问题9鲍鱼年龄预测问题
1.按如下步骤对数据进行预处理
(1)对数据先进行描述性统计分析;
(2)对定量变量识别其中的奇异值,并删除所发现的奇异值;
(3)对定量变量进行标准化;
(4)对定性变量进行独热编码完成预处理
2.应用预处理后的数据建立鲍鱼年龄的下述预测模型
(1)线性回归模型
(2)一次有理模型71):叫B3j=0ny=n1+〉[叫dj j=l
(3)logistic模型
3.对上述模型的精度进行评估10乳腺癌致病基因挖掘本设计根据所附数据集挖掘乳腺癌的致病基因
1.给出每个基因分别在Normak DCISIDC三类组织中的表达信息进行探索性分析;
2.自定义可视化方法对NormaL DQS、IDC三类组织中前100个基因进行可视化;3,通过倍数差异法筛选DCIS vs NormaL IDC vsNormaLDCIS vsIDC的差异表达基因;4,通过两样本t检验方法筛选DCIS vsNormal、IDCvsNormal、DCIS vsIDC的差异表达基因;
5.建立基因表达差异模型,筛选乳腺癌差异表达基因11共享单车骑行量预测请根据所给数据完成下述任务
1.建立共享单车骑行量预测模型(非线性回归或随机森林或神经网络,三者之一即可);
2.给出表中影响骑行嚏的11个特征的重要性;
3.将模型训练好后应用于预测“待预测数据”表对应的骑行量;
4.将预测模型封装为一个预测函数,并通过Python实现,供相关企业使用随着科技的发展及对生产生活实践数据的积累,本课程设计课题将保持增量更新
(二)设计步骤第一步精读并深刻理解课题精读设计课题,了解并熟悉问题背景,查找相关文献资料以帮助自己迅速深刻理地解课题中的各个设计任务比如课题6城市重金属污染问题”,该问题是对某城市表层土壤重金属污染情况进行分析,这就要求首先要了解环境污染的相关背景一一污染物的分类、污染程度指标、污染级别分类,等等;这些要通过查询相关文献才能获悉第二步数据建模在了解了课题背景、理解了课题中各个设计任务的基础上,基于所附数据就课题中的各个问题选用恰当的数学方法逐
一、递进地建立数学模型(机器学习模型),一个问题可能会建立多个模型,这些模型互为补充、或相互印证,以更好地解决问题比如课题6城市重金属污染问题”,对于第一问,可以通过地貌叠加污染指数的四维图形来描述重金属污染的空间分布;污染程度则可建立内梅罗指数法模型;对于第二问,可建立多元统计相关性模型或模糊聚类模型分析各种重金属的相关性来探究重金属污染的主要原因;对于第三问,可建立Kriging插值模型来获得污染源的位置第三步模型训练选用恰当的算法,运用Python相关库或模块对模型进行训练比如课题6城市重金属污染问题”,对于第一问,可调用Python插值模块scipy.interpolate及可视化模块matplotlib.pyplot作重金属污染空间分布图,计算污染指数后对污染进行分级,从而获悉污染程度;运用Python统计模块scipy.statsmatlab计算各重金属的相关性,以描述重金属的相伴性;对于第三问,依然调用scipy.interpolate对Kriging插值进行计算,获得污染源位置第四步模型评估模型评估主要针对预测模型对所求模型的参数进行检验,并进行灵敏度分析和可靠性评估对所求模型的解进行检验,并进行灵敏度分析和可靠性评估,并据此对模型进行反复地修正、改进,直到得到问题的满意解为止Python提供了丰富的模型评估模块,各模块又集成了丰富的评估方法
1.回归RMSE(平方根误差)、MAE(平均绝对误差)、MSE(平均平方误差)、Coefficient ofdetermination(决定系数R2)、MAPE(平均绝对百分误差)、MSLE(均方根对数误差),等
2.分类混淆矩阵、精确率、召回率、准确率、F1值、ROC-AUC、PRC、G-MEAN等
3.聚类兰德指数、互信息、轮廓系数等第五步模型应用将评估好的模型应用于实践,主要是预测和决策第六步算法集成将上述数据分析流程整理为一个综合算法,并利用Python来实现,集成为一个Python API第七步撰写设计说明书或设计报告
1.为第六步集成的Python API撰写一份使用说明书,包括API的功能,输入参数、输出参数、应用示例,等等
2.将上述六个步骤的整理为一篇设计报告
3.提交设计说明书或设计报告
四、课程设计的具体要求
1、设计过程以个人为单位,独立自主完成设计任务;
2、设计说明书或设计报告电子版一律按照提供的“设计说明书”或“课程设计报告”模板撰写,并打印纸质版;
3、课程设计严格按照任务书上规定的时间和内容完成
五、课程设计基本目标理解并掌握数据科学和大数据分析技术等课程相关理论与方法,对设计课题所涉及的对象的背景、相关领域知识和材料有较好的了解,能灵活运用本课程理论知识和方法,对数据进行深刻分析、挖掘数据价值,为相关问题提供解决方案,通过本课程设计,达到如下目标
1.掌握运用大数据知识分析和解决生产实际问题的具体方法;
2.培养遇到困难解决困难的坚忍不拔的精神,独立自主地分析问题和解决问题的能力;
3.熟练运用python进行数据建模和数据分析的能力;
4.将数据分析和应用的流程整理为算法并利用Python集成为API的能力;
5.撰写设计说明书或设计报告的能力;
6.为相关实际问题提供解决方案的能力指导教师对本课程设计的内容,要求、方法、步骤有较深入的了解和把握能熟练地指导学生完成设计任务,能熟练地处理课程设计过程所碰到的各种问题要善于激发和培养学生独立思考和分析问题的能力和学生的创新能力,要善于组织和引导学生独立自主进行设计或按团队方式进行协作设计
六、建议参考文献一Python及数据分析相关文献
[1]铜陵学院.大数据分析技术.2023
[2]李子奈、潘文卿.计量经济学[M].北京高等教育出版社,第四版,2015[3|Python实现逻辑回归Logistic Regressionin Python.net/zj360202/article/details/78688070[41周志华.机器学习[M].北京清华大学出版社,2016
[5]邱锡鹏著,神经网络与深度学习,第六章循环神经网络.Github Inc.,2020-06-14-设计课题相关文献
1.我国省域数字经济评估|1]逢健,朱欣民.国外数字经济发展趋势与数字经济国家发展战略科技进步与对策,2013,3085
[2]赵梦,“十四五”时期数字经济赋能高质量发展的创新路径[J].西南金融,排版定稿网络首发时间2023-03-2214:55:
56.
[3]李三希,武均蟠,李嘉琦.数字经济与中国式现代化:时代意义、机遇挑战与路径探索[J].经济评论.202302:3-
14.
2.肾病综合征影响因素分析IU计建军,王长江,查丽,王小琴滁佳稹,陶静.肾病综合征患者他克莫司血药浓度影响因素[J].中国药物应用与监测.2022,1906:371-
375.
[2]杨听彤.肾病综合征患者糖类抗原表达及影响因素分析[D].皖南医学院.
2022.
[3]郭瑞.肾病综合征合并感染的影响因素分析[J].医学理论与实践.2020,3307:1109-
1111.
[4]戴豉君.肾病综合征患者肾功能影响因素分析评价[J].现代医药卫生.2018,3419:
3065.
3067.3,帕金森病步态分析[11秦静,马雪倩,高福杰,季长清,汪祖民.基于步态分析的帕金森病辅助诊断方法综述[几计算机应用.录用定稿网络首发时间:2022-09-2112:34:31
[2]陶文旭,彭紫莹,杨静,蒋剑军,郑志伟.基于随机森林模型的帕金森病步态分析[J].长江信息通信.2022,3509:7-
94.胆囊术后胆漏病理因素分析11]姚德胜.腹腔镜胆囊切除术后胆漏的原因及对策探析川・中国农村卫生.2019,1122:44-
45.
[2]高源,腹腔镜胆囊切除术后胆漏的原因及处理[J].临床医学研究与实践.2017,222:29-
30.5,小麦种子的识别
[1]付雪丽,景琦,陈旭,祁曙明,邱军.我国小麦种子供需现状与产业发展趋势[J].中国种业.202302:20-
23.⑵孙秀枝,张丽,贾代成,孟琳,罗汉民,陈风龙公丕峰小麦种子健康度检测研究及应用[J].种子科技.2022,4023:8/
0.
6.城市重金属污染问题
[1]ANSARI AA,SINGH IB,TOBSCHALL HJ.Importance ofgeomorphology andsedimentation processesfor metaldispersion insedimentsand soilsof theGanga Plain:identification ofgeochemical domains[J].Chemical Geology,2000,162:245-
266.
[2]FORSTNER U,WITTMANN GT W.Metal pollutionin theaquatic environment\M\.Berlin,Heidelberg,New York:Springer,1981:
486.
[3]LI YH.Geochemical cyclesof elementsand humanperturbation\}\.Geochi mCosmochim Acta,1981,45:2073-
2084.
[4]郭大伟等,数学建模[M].合肥安徽教育出版社,
2009.
[5]朱青等,两种模糊数学模型在土壤重金属综合污染评价中的应用与比较[J].环境保护科学,2004,12330:54-
55.
[6]王栋,基于最大焙原理的水环境模糊优化评价模型[J].河海大学学报自然科学版,2002,306:1-
5.
[7]张磊,宋风斌,王晓波,中国城市土壤金属污染研究现状及对策[J].生态环境,2004,213:258-
260.
[8]王从陆,吴超,段瑜,基于主成分综合的矿区农田重金属污染评价[J].中国工程科学,2008,710:181-
182.
[9]王学松,秦勇,利用对数正态分布图解析徐州城市土壤中重金属元素来源和确定地球化学背景值[J].地球化学,2007,136:98-
102.
[10]Siegal FR.Environmental Geochemistyof PotentiallyToxic Metals\M\.Heidelberg:Spring,2002:1-
192.
[11]韩忠庚,长江水质综合评价与预测的数学模型[J],工程数学学报,2005,722:68-
69.
7.红葡萄酒的评价|1]杨洁.基于多元统计分析的赤霞珠红葡萄酒感官特征描述符筛选研究[D].西北农林科技大学.
2021.
[2]缪子阳,李婷玉,祝梦琳.葡萄酒的评价模型[J].科技与创新.201716:22-
24.
[3]翟明始.基于聚类分析法的葡萄酒评价[J].太原师范学院学报自然科学版.2014,1302:35-
40.
[4]王百姓,冯积社.模糊综合评价在干红葡萄酒感官品评中的应用[J].中国食物与营养.2011,1708:33-
37.
8.雷达回波的识别|1]王硕,孙梦轩,杨志晓,王辉,郑戍华,基于涡旋电磁波雷达回波时频图像的动态手势识别[J].火力与指挥控制.2022,4708:109-
115.
[2]冯讯,李灵芝,吴培烽,贾瑞涛.基于雷达回波视频信号的目标智能识别方法研究[J].空军预警学院学报.2021,3501:1-
5.
[3]梁聪.基于雷达回波的目标识别研究[D].华北理工大学,
2021.
9.鲍鱼年龄预测问题|1]王乾琛.基于深度学习的年龄预测[J].物联网技术.2023,1303:92・93+
96.
[2]廖黄炜,马燕,黄慧.基于多特征融合卷积神经网络的年龄预测[J],计算机技术与发展.2022,3210:58-
64.
[3]王晨铭,郭欢.生物学年龄及其影响因素研究进展[J].中国预防医学杂志.2021,2206:465-
470.
[4]王梦杰.基于面部特征的年龄预测方法研究[D].齐鲁工业大学,
2021.
10.乳腺癌致病基因挖掘11]张粉利.基于关联规则挖掘的乳腺癌致病基因筛选[D].西安电子科技大学,
2019.
11.共享单车骑行量预测
[1]张颖.基于骑行特征的地铁辐射区分类及共享单车需求预测研究[D].长安大学,
2022.⑵晏鹏宇,张华,王雪,黎鹏,刘雨轩,杨东.基于天气因素的共享单车骑行量预测[J].电子科技大学学报社科版.2021,2306:1-
9.13]张徐.共享单车需求量预测及调度优化算法的研究与应用[D].江苏大学,
2021.{附}本指导书撰写执笔人******指导书审批人制修订日期2023年3月
(1)掌握在excel中进行数据清洗的基本方法;3
(2)掌握应用Python进行缺失数据填充等基本数据清洗的操作;目的要求
(3)熟练掌握应用pandas实现数据集成4方法原理应用excel和pandas等工具实现数据清洗和集成5主要实验仪器及材料电脑,excel或wps,anaconda pythonspyder6
(1)应用excel实现初步数据清洗
(2)应用python实现缺失项填充、重复项发现及处理、奇异项发现及处掌握要点理.、数据光滑处理等基本数据清洗;
(3)应用pandas实现数据集成7实验内容将全国各省新冠肺炎疫情数据汇集在一张电子表格中,并进行数据清洗8实验类型综合性9实验要求必做1实验名称数据变换■空气质量监测数据分析2学时3
(1)掌握在excel中进行数据清洗的基本方法;3目的要求
(2)掌握应用Pylhon进行缺失数据填充等基本数据清洗的操作;
(3)熟练掌握应用python实现数据变换4方法原理应用excel和python等工具实现数据清洗和数据变换实5主要实验仪器及材料电脑,excel或wps,anaconda pythonspyder验6
(1)应用python实现缺失项填充、重复项发现及处理、奇异项发现及处掌握要点理、数据光滑处理等基本数据清洗;
(2)应用python实现数据变换7实验内容对空气质量监测数据进行预处理,再对预处理后的数据施行数据变换8实验类型综合性9实验要求必做填写说明教学方式包含讲授、练习、演示、讨论、实验、上机操作、小组报告、线上线下混合教学等教学方式应清楚明确,详细描述
1.教师讲授数据预处理的概念及必要性等知识点教学方式
2.围绕“集成”、“清洗”、“变换”等主题,学生自由讨论,相互启发;
3.教师总结并引导学生纠正或坚持自己在上述主题的讨论中所形成的认知(经验或知识);培养学生多途径获取知识的能力教学单元二有监督学习学时21其中实验学时14支撑课程目标
4、5内容思政融入点重点难点主要内容插值与拟合寻找真相、逼近真相插值与拟合的python实现插值与拟合的概念回归分析向平庸回归线性回归分析非线性回归分析(注明重、难点)Logistic回归格物致知Logistic回归的python实现Logistic回归的概念树结构模型决策树生长联想中国家决策树、随机森林lightGBM谱文化支持向量机完美的数学模型支持向量机的python实现支持向量机的数学原理1实验名称插值■水箱水流量问题2学时3
(1)理解插值的含义及基于Python的实现;
(2)掌握应用插值技术进行缺失数据的填充;3目的要求
(3)会应用python计算数值导数4方法原理线性插值、多项式插值、样条插值原理实5主要实验仪器及材料电脑,excel或wps,anaconda pythonspyder验
(1)应用scipy.interpolate模块实现插值;
(2)应用插值进行缺失数据的填充;6掌握要点
(3)会应用numpy.gradient计算数值导数7实验内容水箱水流量问题根据观测数据推断水箱流速8实验类型研究性9实验要求必做1实验名称多兀线性回归分析-产品销量与广告媒体投入之间关系分析2学时3
(1)理解多元线性回归模型的概念,掌握应用Python实现多元线性回归模型的参数估计及模型评估,能应用Python做各种统计检验;3目的要求实验内容
(2)掌握应用Python工具箱stats,scipy,sklearn求解多元线性回归模型的实方法和步骤4方法原理多元线性回归模型验5主要实验仪器及材料电脑,excel或wps,anaconda pythonspyder四
(1)掌握多元线性回归建模步骤6掌握要点
(2)熟练掌握应用python求解多元线性规划模型,并进行各种检验根据产品销量与广告媒体投入的数据,分析产品销量与广告媒体投入7实验内容之间的关系8实验类型综合性9实验要求必做1实验名称树结构模型■信贷影响因素研究2学时5
(1)理解决策树和随机森林模型的概念,掌握应用决策树求解问题的最实优解决方案,掌握应用随机森林挖掘特征的重要性,掌握应用Python实现验3目的要求决策树和随机森林的方法和步骤;五
(2)了解信贷的背景和一些操作方法,做一个讲信用、有信誉的人4方.法原理决策树,随机森林,lightGBM5主要实验仪器及材料电脑,excel或wps,anaconda pythonspyder
(1)应用决策树或随机森林解决信贷人员类别预测问题;6掌握要点
(2)信贷影响因素重要性的评估7实验内容根据信贷记录应用决策树、随机森林或lightGBM预测信贷成员类别8实验类型综合性9实验要求必做1实验名称支持向量机-口罩销量影响因素研究2学时3
(1)熟练掌握应用支持向量机回归器对口罩销量进行预测;3目的要求
(2)了解空气质量的描述方法,做一个环保的人,为国家“绿水青山就是金山银山”的环保战略贡献一份力量实4方法原理支持向量机验5主要实验仪器及材料电脑,excel或wps,anaconda pythonspyder八
(1)了解支持向量机回归模型的建模步骤;6掌握要点
(2)应用支持向量机回归器实现口罩销量的预测7实验内容应用支持向量机预测口罩销量8实验类型研究性9实验要求必做
1.教师讲授插值、logistic回归、决策树、支持向量机等模型的原理、建模方法和步骤
2.围绕拟合、回归分析、随机森林等主题,学生自由讨论,相互启发;
3.学生分组对拟合、回归分析、随机森林等主题查阅资料,引导学生学会通过文献等途径获取知识,培养自教学方式学的能力,形成自己的观点和见解;
4.各组汇报、相互提问、质疑辩驳、自由表达;
5.教师总结并引导学生理解从插值到拟合再到回归分析、从决策树到随机森林的学习扩展途径;培养学生从特殊到一般、从现象到规律的融会贯通的能力教学单元三无监督学习学时12其中实验学时8支撑课程目标
4、5内容思政融入点重点难点主要内容聚类分析物以类聚模糊C均值聚类、kmeans++KNN(注明重、特征降维化繁为简PC A,ICA t-SNE难点)复杂网络分析大海航行靠舵手中心性分析社区检测1实验名称聚类分析■大型百货商场会员画像2学时3
(1)理解聚类分析的概念,掌握应用模糊C均值聚类、k均值聚类、k最实邻近聚类等方法进行聚类分析,掌握应用Python实现上述聚类方法的步骤,实验内容验3目的要求并能熟练地对各聚类方法进行评估;匕
(2)了解大型百货商场的会员管理策略4方法原理模糊c均值聚类,k均值聚类、k最邻近聚类5主要实验仪器及材料电脑,excel或wps,anaconda pythonspyder1应用模糊c均值聚类k均值聚类、k最邻近聚类对大型百货商场会员画像,为大型百货商场会员管理提供建议;6掌握要点2掌握聚类分析评估方法;3了解大型百货商场会员管理策略7实验内容利用会员消费明细对会员进行画像8实验类型综合性9实验要求必做1实验名称特征降维.大学生公益参与情况影响因素分析2学时31理解特征降维的概念,掌握PCA、ICA、t・SNE等特征降维方法;3目的要求2熟练掌握应用python实现特征降维解决高维因果推断问题实4方法原理PCA,ICA,t-SNE验5主要实验仪器及材料电脑,excel或wps,anaconda pythonspyder八1应用PCA、ICA、t-SNE等方法进行特征降维分析;6掌握要点2熟练掌握PC A、ICA、t-SNE的python实现通过调查问卷获得大学生对公益的基本认知及参与情况,调查数据数据预7实验内容处理后有116个维度,对数据进行降维,之后进行影响因素分析8实验类型综合性9实验要求必做1实验名称复杂网络分析-大学生公益参与情况影响因素分析2学时21对大学生公益参与情况影响因素116个进行复杂网络分析;3目的要求2熟练掌握中心性分析及社区检测的python实现4方法原理中心性分析,社区检测实5主要实验仪器及材料电脑,excel或wps,anaconda pythonspyder验1掌握复杂网络分析的方法和原理;九6掌握要点2熟练掌握中心性分析及社区检测的python实现通过调查问卷获得大学生对公益的基本认知及参与情况,调查数据数据预7实验内容处理后有116个维度,对影响因素进行复杂网络分析8实验类型研究性9实验要求必做
1.教师讲授模糊C均值聚类、主成分分析、复杂网络分析等模型的原理、建模方法和步骤
2.围绕kmeans++、ICA等主题,学生自由讨论,相互启发;
3.学生分组对kmeans++、ICA等主题查阅资料,引导学生多角度解决问题,形成自己的观点和见解;教学方式
4.各组汇报、相互提问、质疑辩驳、自由表达;
5.教师总结并引导学生理解多角度多方法解决聚类问题、特征降维问题;培养学生学会深度思考且多方法解决问题的能力教学单元四深度学习学时6其中实验学时4支撑课程目标
4、5内容思政融入点重点难点主要内容应用python第三方库构建神经网络人脑的模拟,勇攀科技高峰神经网络的概念注明重、神经网络模型难点基于PyTorch构建深度学习深度学习我国科学家在相关领域的成就PyTorch操作模型1实验名称深度学习•上证指数预测2学时31了解时间序列的概念,掌握应用基于PyTorch平台的深度学习方3法实现时间序列的预测;目的要求2熟练掌握循环神经网络“LSTM”在时间序列预测中的应用;实3了解金融时间序列的概念验4方法原理长短时记忆网络十5主要实验仪器及材料电脑,excel或wps,anaconda pythonspyder61应用PyTorch搭建LSTM网络;掌握要点2应用“LSTM”对时间序列进行预测7实验内容根据给定的上证指数时间序列,预测今后一段时间内上证指数走势8实验类型研究性实验内容9实验要求必做1实验名称深度学习■图像识别2学时131了解图像识别的概念,掌握基于PyTorch的深度学习实现图像识别的目的要求方法和步骤;实2掌握卷积神经网络在图像识别中的应用4方法原理卷根神经网络验5主要实验仪器及材料电脑,excel或wps,anaconda pythonspyder十6掌握要点1应用PyTorch搭建CNN网络;2应用CNN实现图像识别7实验内容根据给定图像,建立并训练CNN网络,实现未知图像的识别8实验类型验证性9实验要求选做
1.教师讲授经典神经网络■多层感知机的原理、建模方法和步骤
2.围绕LSTM、CNN等主题,学生自由讨论,相互启发;
3.学生分组对LSTM、CNN等主题查阅资料,引导学生攻坚克难,勇攀科技高峰;教学方式
4.各组汇报、相互提问、质疑辩驳、自由表达;
5.教师总结并引导学生理解深度学习的概念及技术实现;培养学生不畏难、勇攻关的科学精神
五、考核方式及成绩评定(填写说明课程考核分考试和考查两种考试课程要明确是开卷考试还是闭卷考试,要明确是采用百分制还是五级制;考查课程请注明考查方式(如论文、大作业等等)建议采用过程性考核方式,明确各考核环节的权重,各考核环节要反映课程目标的达成情况)
(一)成绩评定方法考核环节权重考核要素实验50%根据实验参加次数、实验正确率、实验报告质量评定课堂表现及书面作业20%根据出勤率、课堂表现、课堂小练习、书面作业等情况评定期末考查30%根据试卷答题正确性评定,答题步骤正确性与解题思路正确性酌情给分
(二)课程目标评定权重实验课堂表现及书面作业期末考试(权重合计课程目标课程目标课程目标(权重50%)(权重20%)30%)(权重100%)权重达成度分数分配分数分配分数分配课程目标分数L01Yl=17%2OA120A210A317M1QiL02Y2=
31.5%30B130B235B
331.5M2Q2L03Y3=
31.5%30Cl30C235C
331.5M3Q3L04Y4=20%2OD120D220D320M4Q4合计100%100100100100Q课程目标达成度计算方法
(1)课程目标分数计算Ml=A1*K1+A2*K2+A3*K3=10+4+3=17M2=B1*K1+B2*K2+B3*K3=15+6+
10.5=
31.5M3=C1*K1+C2*K2+C3*K3=15+6+
10.5=
31.5M4=D1*K1+D2*K2+D3*K3=10+4+6=20
(2)课程分目标达成度计算Ql=(K1*该项课程目标考核方式1学生平均分+长2*该项课程目标考核方式2平均分+K3*该项课程目标考核方式3平均分)/MlQ2=(K1*该项课程目标考核方式1学生平均分+长2*该项课程目标考核方式2平均分+K3*该项课程目标考核方式3平均分)/M2Q3=(K1*该项课程目标考核方式1学生平均分+12*该项课程目标考核方式2平均分+K3*该项课程目标考核方式3平均分)/M3Q4=(K1*该项课程目标考核方式1学生平均分+12*该项课程目标考核方式2平均分+K3*该项课程目标考核方式3平均分)/M4
(3)课程目标总达成度(含n个课程目标)Q=Q1*Y1+Q2*Y2+Q3*Y3+Q4*Y44课程目标期望值
0.65三课程目标评价标准
1.实验课程目标评分标准能熟练地使用excel和python完成数据预处理各项任务优90-100L01熟练运用所学数据预处能较好使用excel和python完成数据预处理各项任务良80-89理相关知识对原始数据进行能使用excel和python完成数据预处理各项任务中70-79数据集成、数据清洗、数据变基本能够使用excel和python完成数据预处理各项任务及格60-69换、数据规约等操作不能使用excel和python完成数据预处理各项任务不及格0-59能熟练地使用监督学习方法完成数据预处理、因果推断、趋势预测、分类等数据分析任务,能熟练地对模型精确性进行评估,并能熟练优90-100地对线性回归等回归模型进行参数估计和统计检验能较好使用监督学习方法完成数据预处理、因果推断、趋势预测、分L02熟练运用所学监督学习类等数据分析任务,能较好地对模型精确性进行评估,并能较好地良80-89方法完成数据预处理.、因果对线性回归等回归模型进行参数估计和统计检验推断、趋势预测、分类等数据能使用监督学习方法完成数据预处理、因果推断、趋势预测、分类分析任务,能熟练评估模型的等数据分析任务,能对模型精确性进行评估,并能对线性回归等回中70-79精确性,能对线性问归等回归归模型进行参数估计和统计检验模型进行参数估计和统计检基本能够使用监督学习方法完成数据预处理、因果推断、趋势预测、验分类等数据分析任务,基本能够对模型精确性进行评估,基本能够及格60-69对线性回归等回归模型进行参数估计和统计检验不能使用监督学习方法完成数据预处理、因果推断、趋势预测、分类等数据分析任务,不能对模型精确性进行评估,不能对线性回归不及格0-59等回归模型进行参数估计和统计检验能熟练地使用无监督学习完成聚类分析、特征降维、复杂网络分析等数据分析任务,能熟练评估聚类模型的精确性,能熟练通过可视优90-100化技术观察降维效果L03熟练运用无监督学习完能较好使用无监督学习完成聚类分析、特征降维、复杂网络分析等成聚类分析、特征降维、复杂数据分析任务,能较好地评估聚类模型的精确性,能较好地通过可良80-89网络分析等数据分析任务,能视化技术观察降维效果熟练评估聚类模型的精确性,能使用无监督学习完成聚类分析、特征降维、复杂网络分析等数据能熟练通过可视化技术观察分析任务,能评估聚类模型的精确性,能通过可视化技术观察降维中70-79降维效果效果基本能够使用无监督学习完成聚类分析、特征降维、复杂网络分析等数据分析任务,基本能够评估聚类模型的精确性,基本能够通过及格60-69可视化技术观察降维效果。
个人认证
优秀文档
获得点赞 0