还剩28页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
分子系统树法分子系统树法是现代生物学研究中的重要工具它通过分析生物分子序列来揭示物种间的进化关系本课程将深入探讨这一方法的原理、应用和最新发展研究背景系统发育学起源1达尔文进化论为系统发育学奠定基础分子生物学革命2测序技术的发展推动了分子系统树法的诞生DNA计算生物学兴起3大数据分析和算法优化促进了分子系统树法的快速发展系统发育分析的基本方法形态学方法分子生物学方法基于生物体外部和内部结构利用、或蛋白质DNA RNA特征进行分类序列信息构建进化关系综合分析方法结合形态学和分子生物学数据,提高系统发育推断的准确性分子系统树构建的基本流程序列获取从公共数据库下载或通过实验获得生物分子序列序列比对使用多序列比对算法对序列进行对齐模型选择选择合适的进化模型描述序列变异树构建应用系统发育算法构建进化树树评估使用统计方法评估树的可靠性序列比对全局比对局部比对多序列比对适用于整体相似度高的序列常用算适用于部分区域高度相似的序列常同时比对多条序列常用工具法用算法、Needleman-Wunsch Smith-Waterman CLUSTALW MUSCLE碱基替换模型模型模型JC69K2P最简单的替换模型,假设所考虑转换和颠换的不同概率有替换类型概率相等模型模型HKY85GTR考虑碱基频率和转换颠换比最复杂的模型,允许所有替/率换类型有不同概率最大简约法原理算法选择需要最少进化变化的树常用启发式算法如分支交换法优缺点计算速度快,但可能陷入局部最优解最大似然法选择进化模型1计算似然值2搜索最优树3评估树的可靠性4最大似然法基于概率模型,寻找使观测数据出现概率最大的进化树贝叶斯法设定先验概率1计算后验概率2马尔可夫链蒙特卡洛采样3生成后验概率树4贝叶斯法结合先验信息和观测数据,计算树拓扑结构的后验概率分布距离法计算序列距离构建距离矩阵12使用进化模型估算序列间的遗传距离汇总所有序列对之间的距离应用聚类算法评估树的可靠性34如或邻接法构建树通过自展法等方法评估树的稳定性UPGMA邻接法原理步骤基于最小进化原则,逐步聚类构建系统树初始化星状树
1.寻找最近邻
2.合并节点
3.更新距离矩阵
4.重复直至完成
5.2-4最大进化法初始树构建局部重排通常使用邻接法生成初始树通过移动分支优化树拓扑最小进化评分迭代优化选择具有最小总枝长的树重复局部重排和评分,直至收敛系统发育检验自展法刀切法通过重复抽样评估树的稳定性通过删除部分数据评估树的稳健性似然比检验比较不同拓扑结构的似然值数据质量控制序列质量检查比对质量评估去除低质量序列和污染序列检查并修正多序列比对中的错误异常值检测数据完整性验证识别并处理可能影响分析的确保数据集的代表性和均衡异常序列性基因树与物种树基因树物种树不一致性反映单个基因的进化历史可能受到反映物种的真实进化关系通常需要基因树和物种树可能存在差异,需要基因复制、丢失等影响整合多个基因信息谨慎解释基因水平转移识别异常序列检测与宿主基因组不一致的序列系统发育分析构建基因树,寻找不符合物种进化的分支共线性分析检查基因在不同物种中的排列顺序功能验证实验验证潜在的水平转移基因同源基因的鉴定序列相似性搜索结构域分析使用等工具在数据库识别保守的蛋白质结构域BLAST中寻找相似序列基因组上下文分析系统发育分析考虑基因在基因组中的位置构建基因树,验证进化关系和邻近基因同源基因的分类直系同源基因旁系同源基因源自物种分化的同源基因源自基因复制的同源基因异源同源基因通过水平基因转移获得的同源基因同源群的构建序列收集1从多个物种获取潜在同源序列相似性聚类2使用工具如对序列进行聚类OrthoMCL多序列比对3对聚类结果进行多序列比对系统发育分析4构建基因树,验证同源关系同源基因家族进化分析家族规模变化分析功能分化研究12研究基因家族成员数量的分析家族成员的功能获得历史变化和丢失选择压力分析表达模式比较34检测正选择和负选择作用比较不同成员在不同条件的位点下的表达差异物种关系的推断选择标记基因1构建基因树2整合多基因信息3构建物种树4评估树的可靠性5物种关系推断通常需要整合多个基因的信息,以克服单基因分析的局限性进化速率分析相对速率测试分子钟检验变速分子钟模型比较不同谱系间的进化速率差异检验进化速率是否恒定允许不同谱系有不同进化速率选择压力分析比值法分支位点模型dN/dS比较非同义替换和同义替换检测特定谱系上的选择信号的比率滑动窗口分析群体遗传学方法检测基因内部的选择压力变利用群体数据检测选择作用化物种多样性分析系统发育多样性物种丰富度考虑物种间的进化距离统计特定区域的物种数量功能多样性分析物种的生态功能差异生物地理分析物种分布建模1预测物种潜在分布区域分散共有分析-2研究物种分布格局的历史成因祖先区域重建3推断物种祖先的地理分布生物地理事件定年4估算物种扩散和隔离的时间应用实例人类起源研究1数据来源分析方法主要发现现代人和古人类基因组数据系统发育分析、群体遗传学分析现代人起源于非洲,与其他古人类存在基因交流应用实例病毒进化研究2序列收集收集不同时间和地点的病毒基因组序列系统发育分析构建病毒进化树,追踪传播路径分子钟分析估算病毒的起源时间和进化速率选择压力分析识别病毒基因组中的适应性进化位点应用实例作物驯化研究3基因组比较选择信号检测对比栽培品种和野生近缘种的基因组识别驯化过程中受到选择的基因群体遗传学分析基因功能验证研究作物驯化中的遗传瓶颈效应实验验证关键驯化基因的功能发展趋势大数据整合机器学习应用整合多组学数据进行系统发育分开发新的算法提高分析效率和准析确性云计算平台利用分布式计算处理海量序列数据小结掌握基本原理1熟悉主要方法2了解应用实例3把握发展趋势4分子系统树法是生物学研究的重要工具,掌握其原理和方法对于理解生物进化至关重要。
个人认证
优秀文档
获得点赞 0