还剩58页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
流行病学数据分析实习专业化培训,掌握流行病学数据分析核心技能从理论到实践,全面提升公共卫生研究能力课程概述课程目标学习内容掌握流行病学数据分析方法统计方法和软件应用实践考核方式案例分析和实践报告流行病学数据分析简介定义重要性应用领域运用统计方法分析人群健康数据揭示疾病分布规律和危险因素疾病监测、健康政策制定数据类型时间序列数据按时间顺序收集的连续观测值定量数据可测量的数值型变量定性数据分类或名义型变量数据收集方法医疗记录从医院系统提取临床数据问卷调查结构化收集人群健康信息实验数据对照试验产生的研究数据数据质量控制数据清理检查并纠正错误录入和格式问题异常值处理识别并处理极端值和离群点缺失值处理评估缺失模式并选择适当填补方法描述性统计
(一)集中趋势测量•平均值•中位数•众数离散趋势测量•方差•标准差•四分位距描述性统计
(二)频数分布变量值出现的次数统计百分比占总体的相对比例比率和比值不同类别间的相对关系图表展示
(一)选择合适图表类型展示不同数据特征图表展示
(二)散点图箱线图热图展示两个连续变量间关系显示数据分布和离群值使用颜色强度表示数据变化概率分布68%15%正态分布二项分布连续型随机变量常见分布成功/失败事件概率17%泊松分布稀有事件发生概率假设检验基础显著性水平接受或拒绝假设的标准原假设与备择假设检验起点无差异vs有差异p值观察到结果的概率测度检验t单样本t检验独立样本t检验配对样本t检验样本均值与已知值比较两独立组均值差异比较同一组前后测量比较方差分析重复测量方差分析多时间点测量比较双因素方差分析两个因素交互作用分析单因素方差分析3三组以上均值比较卡方检验检验类型应用场景关注重点拟合优度检验观察值与理论值比较分布特征独立性检验两分类变量关联性相互独立性同质性检验不同样本分布比较分布一致性相关分析Pearson相关系数Spearman相关偏相关分析系数两连续变量线性关系控制第三变量影响等级变量或非线性关系线性回归
(一)线性回归
(二)变量选择共线性诊断前向、后向、逐步回归法方差膨胀因子评估残差分析模型适合度检验回归Logistic二分类Logistic回归多分类Logistic回归OR值解释预测二元结局事件多类别结局变量优势比反映关联强度疾病发生与否预测疾病分型预测e^β为暴露影响生存分析基础生存函数存活概率随时间变化风险函数单位时间事件发生率生存时间数据特点截尾数据处理方法Kaplan-Meier生存曲线绘制阶梯状展示生存概率变化中位生存时间估计生存率为50%时的时间点组间生存曲线比较Log-rank检验差异显著性比例风险模型Cox模型假设变量筛选结果解释•比例风险•单因素初筛•风险比意义•风险比恒定•多因素分析•可信区间•协变量线性作用•交互作用评估•临床相关性队列研究数据分析相对危险度计算暴露组与非暴露组发病率比值归因危险度计算2可归因于暴露的发病率暴露-反应关系分析剂量反应关系评估病例对照研究数据分析匹配设计分析个体匹配或频数匹配优势比计算病例组与对照组暴露比率比较条件Logistic回归匹配设计多因素分析3横断面研究数据分析患病率计算患病比计算相关因素分析特定时间点疾病存在比例不同人群患病率比较多因素回归模型应用诊断试验评价评价指标计算方法意义敏感性真阳性/真阳性+假检出患者能力阴性特异性真阴性/真阴性+假排除健康者能力阳性预测值阳性/阴性预测值检测结果可靠性多水平模型模型比较和选择似然比检验和AIC随机斜率模型允许变量效应在组间变化随机截距模型基线水平在组间变化主成分分析123原理和应用因子提取结果解释降维并保留最大变异信息特征值和载荷矩阵计算主成分解释原始变量意义因子分析探索性因子分析发现潜在构念结构验证性因子分析检验假设理论模型模型评价拟合指数评估聚类分析K-means聚类层次聚类聚类结果评价划分样本到预设K个类别构建样本间层次关系轮廓系数和类内凝聚度判别分析二次判别分析二次函数适应复杂边界线性判别分析判别函数解释线性函数区分类别变量对分类贡献评估1元分析基础异质性检验固定效应模型I²和Q统计量评估研究间一致假设研究间效应相同性随机效应模型考虑研究间效应变异元分析进阶发表偏倚评估漏斗图和Egger检验敏感性分析评估结果稳健性亚组分析探索异质性来源时间序列分析揭示时间模式并做出准确预测空间分析基础地理信息系统应用空间数据可视化空间自相关Morans I和LISA统计量热点分析疾病聚集区检测网络分析机器学习在流行病学中的应用监督学习疾病风险预测分类深度学习复杂模式识别与预测非监督学习疾病亚型识别数据可视化技巧选择合适的图表类型色彩使用原则信息传达有效性•按数据特征选择•对比度合理•突出关键模式•突出核心信息•避免过多颜色•减少认知负担•考虑受众理解能力•考虑色盲友好•保持简洁明了语言基础R数据结构基本操作函数编写向量、矩阵、数据框数据读取、操作、导出自定义函数创建与应用语言数据处理Rdplyr包使用数据筛选、排序、分组聚合tidyr包使用宽表转长表、缺失值处理数据合并和重塑不同来源数据整合分析语言统计分析
(一)R描述性统计summary和describe函数假设检验t.test和chisq.test函数相关与回归3cor.test和lm函数语言统计分析
(二)R生存分析广义线性模型survival包和survminer包glm函数应用多水平模型lme4包和nlme包语言数据可视化Rggplot2包使用交互式图表制作地图绘制分层构建专业统计图表plotly和shiny应用sf包和tmap包应用软件基础SAS宏编程入门自动化分析流程过程语句使用PROC步骤数据分析数据集创建和管理DATA步骤数据处理统计分析
(一)SAS描述性统计方差分析回归分析PROC MEANS和PROC UNIVARIATEPROC ANOVA和PROC GLMPROC REG和PROC LOGISTIC统计分析
(二)SAS生存分析PROC LIFETEST和PHREGLogistic回归PROC LOGISTIC应用混合线性模型PROC MIXED多水平分析软件操作SPSS数据录入和管理变量定义和数据编辑基本统计分析描述统计和假设检验高级统计模型回归、因子分析和聚类软件使用Stata功能类别命令示例应用场景数据导入和处理数据准备阶段import,reshape,merge统计分析命令模型构建regress,logit,stcox结果输出和图形绘制结果展示和解释graph,tabulate,margins流行病学软件介绍专业软件简化特定流行病学计算和分析大数据分析工具100GB+10XHadoop生态系统Spark分布式存储和计算框架大规模数据内存处理80%分布式计算基础MapReduce编程模型数据安全和隐私保护数据脱敏技术加密存储•个人识别信息去除•端到端加密•K-匿名化方法•密钥管理•差分隐私技术•数据分级保护访问控制策略•最小权限原则•多因素认证•审计跟踪机制伦理考虑知情同意参与者权益保障研究伦理审查伦理委员会审批流程数据使用和共享原则合规与透明性要求结果报告和论文撰写常见问题和注意事项避免常见统计陷阱统计结果呈现表格和图形规范科研论文结构IMRAD格式规范实践案例
(一)传染病暴发调查数据收集标准化问卷设计描述性分析2三间分布特征分析病例定义和筛查确定和疑似病例标准实践案例
(二)慢性病危险因素分析实践案例
(三)临床试验数据分析随机化检验基线特征平衡性评估意向性分析包含所有随机分配对象亚组分析不同人群疗效差异实践案例
(四)流行病学监测数据分析24%35%时间序列分析空间分布分析季节性和长期趋势识别疾病聚集区检测41%预警模型构建阈值设定和信号检测实践案例
(五)系统综述和元分析文献筛选PRISMA流程图记录数据提取结构化表格记录关键信息异质性分析研究间方法学和临床差异评估课程总结知识点回顾技能提升掌握核心统计方法和应用场景软件操作和实际问题解决能力未来展望新兴分析方法和职业发展方向参考资料和推荐阅读教材推荐学术期刊在线资源•现代流行病学方法•中华流行病学杂志•中国疾控中心网站•医学统计学•国际流行病学杂志•WHO统计资源•临床流行病学原理•流行病学年评•开放获取数据库。
个人认证
优秀文档
获得点赞 0