还剩3页未读,继续阅读
文本内容:
第章广电用户收视行为数据查询优化6教案课程名称Hive大数据存储与处理课程类别必修适用专业大数据技术类相关专业总学时64学时其中理论36学时,实验28学时总学分
4.0学分本章学时10学时
一、材料清单1《Hive大数据存储与处理》教材2配套PPT3引导性提问4探究性问题5拓展性问题
二、教学目标与基本要求教学目标L本章先介绍了Hive视图的创建、查看与删除方法,其次介绍了如何配置Fetch抓取、设置map和reduce任务数以及配置并行执行,然后介绍了使用子查询的方法,最后介绍了优化配置GROUP BY语句和LIMIT语句本章通过优化Hive配置与HQL语句,实现广电用户收视行为数据查询优化,帮助读者掌握各种Hive优化方法.基本要求21掌握Hive查询优化的方法2掌握Hive视图的使用方法3了解配置Fetch抓取的方法4掌握Hive设置map和reduce任务数的方法5掌握Hive配置并行执行的方法6掌握子查询的使用方法7掌握GROUP BY语句的优化配置方法8掌握LIMIT语句的优化配置方法
三、问题引导性提问
1.引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的1如何在Hive中创建一个新的视图?2为什么我们需要配置Fetch抓取?它对查询性能有什么影响?3子查询在解决哪些复杂查询场景中特别有效?.探究性问题2探究性问题需要教师深入钻研教材的基础上精心设计,提问的角度或者在引导性提问的基础上,从重点、难点问题切入,进行插入式提问或者是对引导式提问中尚未涉及但在课文中又是重要的问题加以设问1在Hive中使用视图是否会引入性能开销?2LIMIT语句在大数据查询中为何需要特殊优化?3Hive的动态分区功能如何帮助优化大规模数据处理?.拓展性问题3拓展性问题需要教师深刻理解教材的意义,学生的学习动态后,根据学生学习层次,提出切实可行的关乎实际的可操作问题亦可以提供拓展资料供学生研习探讨,完成拓展性问题1除了GROUP BY和LIMIT之外,还有哪些高级SQL操作可以在Hive中进行优化?2Hive是否还有其他优化配置方法?有哪些?
四、主要知识点、重点与难点主要知识点
1.1Hive查询优化的方法2Hive视图的使用方法3配置Fetch抓取的方法4Hive设置map和reduce任务数的方法5Hive配置并行执行的方法6子查询的使用方法7GROUP BY语句的优化配置方法8LIMIT语句的优化配置方法重点
2.1Hive视图的使用方法2子查询的使用方法3GROUP BY语句的优化配置方法4LIMIT语句的优化配置方法难点
3.掌握子查询的使用方法
五、教学过程设计理论教学过程
1.1创建视图2查看与删除视图3配置Fetch抓取4合理设置map和reduce任务数5配置并行执行6使用子查询优化查询语句7优化酉己置GROUP BY语句o8使用GROUP BY代替COUNTDISTINCT去重统计9优化配置LIMIT语句实验教学过程
2.1创建视图2查看与删除视图3使用视图统计不同节目的用户观看人数4配置Fetch抓取5合理设置map和reduce任务数6配置并行执行7优化统计直播频道数8使用子查询优化查询语句9优化配置GROUP BY语句10使用GROUP BY代替COUNTDISTINCT去重统计11优化配置LIMIT语句12使用子查询统计节目类型为直播的频道ToplO
六、教材与参考资料教材
1.何煌,张良均.Hive大数据存储与处理[M].北京人民邮电出版社.
2024.参考资料
2.
[1]张军,张良均.Hadoop大数据开发基础(第2版)(微课版)[M].北京人民邮电出版社.
2021.
[2]王哲,张良均.Hadoop与大数据挖掘(第2版)[M].北京机械工业出版社.
2022.。
个人认证
优秀文档
获得点赞 0