还剩5页未读,继续阅读
文本内容:
生物信息学课程习题第一章绪论
一、填空、在年,美国国会批准启动人类基因组计划,拟用—区年时间测定人类全部条染色体上11990共个碱基序列的测定、是遗传信息的携带者2DNA
3、蛋白质三维结构测定主要方法有X射线晶体结构分析和____________________________名维核磁共振波谱分析o、理想的抗生素靶标应为微生物细胞.存活所必须,在病原体中高度保守,4且在人体中不存在或与人类基因有根本差异o、下图例举了一个计算机辅助药物设计的实例,从图中我们得到了配体上基团附近的受5a R体上有谷氨酸和谷氨酸残基,具有酸性性,因此可以将基团设计为遮—性基团,119227R如图中所示的月瓜基基团,使得抑制活性比改造前提高了近倍b5000
二、名词HGP humangenome project,EST expressedsequence tag,SNP singlenucleotide polymorphism,生物信息学Bioinformatics,药物基因组学Pharmacogenomics,intron,“Junk DNA”,比较基因组学,比较基因组学是基于基因组图谱和测序基础上,对已知Comparative Genomics的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科蛋白质组学,分子进化树基因组,evolutionarytree,基因组药物基因组药物是指利用基因序列数据,经生物信息学分析、高通过基Genomic drug因表达、高通量功能筛选和体内外药效研究开发得到的新药候选物.
三、简答、简述生物信息学在药物研究开发领域的应用可体现在哪些方面?1一初始阶段信息收集,初步调研确定合适的药物作用靶可行性分析靶点结构、化合物信息二药物设计三开发阶段,减少药物副作用,避免开发风险、如何利用基因组信息寻找新的药物作用靶标?2基因组比较A同源性搜索B表达差异分析C、如何利用人类基因组信息实现个性化治疗,其基于的原理是什么?
3、试叙述基因芯片用于疾病诊断的原理,并说明其优缺点4优点速度快信息量大,灵敏度高,微型化,操作方法简单,结果易于判读缺点准确度和普及型有待加强、最近甲型流感流行,请设计甲型流感的分子诊断方法,说明其原理5基因诊断A利用抗原-抗体反应B第
二、三章数据库
一、单选题、以下数据库不能用于检索核酸序列的是()1B、蛋白质结构数据常保存为下面哪一种格式为后缀的文件()2A、下列格式属于格式的是()A.PDB B.txt C.Seq D.mdb3FASTA A A.seqlB.seql C.ATGCCATA D.ATGCCATAATGCCATA ATGCCATA
二、填空题、阅读以下数据格式,写出以下标注的含义1是序列名称是序列定义,LOCUS,DEFINITION是数据库编号,是版本号ACCESSION VERSION,SOURCE是来源__________在论文中使用了数据库中的该序列,应标注该序列的编号,应填NCBI NG007114o、阅读以下中结构基序的示例,说明其中各符号含义-连字符用来分离序列基序中2Prosite的每个位点o[]每个方括号中的残基代表序列基序中某一特殊位置-允许出现的残基(}大括号中的符号代表序列基序中特定位置「不允许出现的残基表示二十个氨基酸中的任何一个Xo()代表某特定残基的重复数、下面是中病毒的基因组,请根据以下图n3NCBI SARS说明基因组有个基因,编码个蛋白、检索蛋白质序列可使用哪个数据库,试SARS13144举两例、SWISS-PROTPIRo、检索蛋白质结构常使用数据库5PDB、根据以下检索结果说明该蛋白质结构在数据库中的编号为,其结构测定方法为6PDB lbuyNMR
三、名词一级数据库,二级数据库,格式,结构浏览Genbank,UniGene,PDB,MMDB EMBL,NCBI,o器,数据库,数据库,数据库,Rasmal,swiss-pdbviewer,Swiss-model,Prints PrositeBanklt,Cn3D,PIR数据库,数据库SCOP CATH第四章生物信息检索
一、填空题、请例举两个常用的搜索引擎、百度1googleo、如果要搜索一个词组,如把人类基因组作为一个词组,搜索相关信息,应在搜索引擎的搜2索栏中填入“人类基因组”、写出以下检索时常用的限制字段的含义作者3pubmed[au]o标题、发表日期、土也址、*截字符[ti][dp][affiliation]
二、名词Pubmed,Espacenet,USPTO第五章序列比对
一、选择题
1、进行多序列比对常使用哪种软件(C)A.Dock B.Compute pl/MW C.Clustal D.Rasmol、对于远源蛋白质序列,在进行多序列比对的时候应选用下面哪一种矩阵()2B
二、填空题要搜索一段基因序列的同源基因序列,常使用
1.BLAST o、下图示意的序列比对方法为点阵作图法
2、和在年提出一种比对算法,算法实现主要分三步首先求出一定3Needleman Wunsch1970积分系统下的原始矩阵,其次求出转化矩阵,最后寻找两个序列的最佳比对矩阵,获得最佳比对形式
三、名词序列比对为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规aligment,律排列多重序列比对,局部比对,序列比对的值,Clustal,Blast,gap,E矩阵,取一个蛋白质序列中的氨基酸变异作为演化距离的单位,称为个PAM1%1PAM矩阵同样方式建立了取代矩阵但在评估代换频率时,应用了不同的策略,BLOSUM BLOSUM基本数据来源于数据库,其中包括了局部多重比对(包含较远的相关序列,同在BLOCKS PAM中使用较近的相关序列相反)两条序列的两条序列的相似度百分比identities,动态规划算法()所谓动态规划()dynamic programming algorithm dynamicprogrammingalgorithm,其指导思想就是在多级过程的每一级上列出各种可行的局部解,然后按照某些条件舍弃那些肯定不能得到最优解的局部解它最大的优点在于能够大大减少计算量
四、简答、简述序列比对的用途
1、某实验克隆表达了灰葡萄泡霉菌的还原酶,该菌中这一酶此前未被研究过,现在2HMGCoA拟通过定点突变实验研究该酶的性质和功能,请问该使用哪些生物信息学手段设计合适的突变位点测出该蛋白质的氨基酸序列aB进行同源性搜索(BLAST)找出同源性较高的序列进行比对,确定突变位点C第六章核酸序列分析
一、填空题
1、对于任一DNA序列(或CDNA序歹U),可能存在§种不同的阅读框,其中三个为正向的,个为反向的
3、原核生物启动子有两段保守序列,即区左右的以及区左2TATAAT,-35右的它们为聚合酶结合位点和识别位点TTGACA,RNA
二、名词外显子,内含子,启动子,终止子,起始密码,终止密码,ORF,序歹该序列是在起始密码子之前与核糖体作用的位点,真核生物起始密码上Kozak U,mRNA AUG游的第三个核甘酸常常是喋吟,且多为A(・3A);其次紧跟在AUG后面的核甘酸,常常也是喋吟,但多数情况下是()G+4G密码子使用频度,不同生物对密码子的使用有不同的偏好,在编码区和非编码区,特定氨基酸密码子的出现频率是不同的,因而蛋白质编码区密码存在一定的规则性法则,ORF Finder,GT-AG GeneSplicer,CpG岛,CpG岛(CpG island)是短的、分散的、非甲基化核酸序列,它常出现在持家基因和受调节表达的基因端5序歹REBASE,Alu1J,RepBase,电子克隆,其原理是根据序列间的相互重叠,通过计算机进行拼接和组装,以获得较长的EST或完整的序列这一过程原理上与测序过程中的拼接相同CDNA中度重复序列,中度重复序列拷贝数在十至几百,如人类的序列家族、小鼠中相关Alu Alu序列(称为序列家族)等中度重复序列一般是不编码的序列,通常认为它们在基因调控B1中起重要调节作用,包括开启或关闭基因的活性,促进或终止转录,复制的起始,以及转DNA录物参与的处理等hnRNA高度重复序列拷贝数高达几百至几万,其中一些是基因和某些基因,重复次数达rRNA tRNA数百次;另一些重复次数更高,如果蝇染色体着丝粒附近就存在几种高度重复序列,它们可能与细胞分裂时染色体的运动有关
三、问答、真核生物基因结构与原核生物基因结构相比有哪些异同点1相同点
①都有编码区和非编码区,
②非编码区都有调控遗传信息表达的脱氧核甘酸序列不同点
①编码区是连续的,不存在内含子和外显子
②编码区能编码蛋白质
③结构简单
①编码区是间隔的、不连续的,有内含子和外显子
②只有外显子部分能够编码蛋白质
③结构复杂,存在重复序列、试述基因结构分析的一般步骤2
①、查找重复序列重复序列的存在会给序列分析带来很大的麻烦
②、同源体搜索与作图搜索已知同源体可能是最常用而且被广泛认识的新蛋白质编码基STS因的识别方法
③、基因模式预测如果蛋白数据库中没有发现同源体.就可通过编码统计学原理和潜在的功能基序(剪接信号,启动密码子)来预测基因结构
④、启动子预测发现潜在的转录结合位点和启动子信号可以帮助理解待测序列的功能意义
⑤、转录终止位点预测确定基因模型何时转录终止也是至关重要的,尤其当研究的序列中可能含有多个基因时
⑥、岛分析岛长度一般大于覆盖启动子区域,可帮助确定基因末端位置CpG CpG200bp,55第七章蛋白质序列分析
一、填空题、蛋白质二级结构预测算法可概括为哪三种类别统计/经验第法、物理-化学方法、机1器学习方法
2、蛋白质三级结构预测最常用也是精度最高的方法是」1遮模建________________o、分子力学的方法计算蛋白质三级结构的基本假设是蛋白质天然构象是能量最小的构象
3、蛋白质结构从头预测遇到的两大难题一是分子折叠态与非折叠态之间的能量当值很小,二4是全局优化问题、请例举两个二级结构预测方法方法、神经网络方法5GORo、方法二级结构预测的基本出发点在于对于蛋白质中种不同的氨基酸残在6Chou-Fasman20S不同的二级结构中出现的进行统计分析得出在不同二级结构中出现的倾向性,然后在一定规则的指导下就可以进行预测、蛋白质组学研究常使用二维凝胶电泳技术,该方法首先是一等电聚7焦_______________,然后是SDS PAGE电泳、年通过对各种跨膜蛋白的统计分析发现,带正电荷的氨基酸主要81986Von Heijine分布在紧靠膜内连接跨膜区的环上,这就是所谓的“正电荷局内规则”、根据以下结果,说明我们检索的蛋白质可能的功能注释为蛋白9Blast NPL
4、对蛋白质二级结构预测方法可采用参数评估()其中代表预10Q3Q3=Pa+Pp+Pcoil/T,Pa测螺旋正确的氨基酸残基数、代表预测折叠正确的氨基酸残基数、代表预测无PB8Pcoil规则卷曲正确的氨基酸残基数________________________,T为总氨基酸残基数o
二、选择题
1、对于蛋白质同源结构模建,通常要求待模建序列与模板序列一致性超过(D)、对于搜索不到同源模板的蛋白质,可尝试用以下哪种方法模建结构()法2AA.Threading B.网络服务器法没有办法模建、给定一段核酸序列,可通过什么SWISS-MODEL C.Homology D,3方法查找上面蛋白质编码区()AA.ORF FinderB.CpGPIot C.SWISS-MODEL D.Dock、同源结构预测时搜索到以下可用的模板,应选用哪个模板比较好()4CAA DA、预测蛋白质上的跨膜区,可使用以下哪种软件或方法()5DA.GeneSplicer B.Chou-Fasman、分析蛋白质在细胞中的定位,可使用()6C RepBase
三、名词比较模建()同源模建AA Compldent,Compute pl/Mw,Peptlden,ProtScale,Comparative modeling,(homologousmodeling)也称比较模建(comparativemodeling),同源蛋白质具有相似的结构和功能,所以利用结构已知的同源蛋白质可以建立目标蛋白质的结构模型,然后用理论计算方法进行优化一维.三维剖面法利用每一个残基在蛋白质结构中所处的环境描述蛋白质的折叠类型,根据侧链的埋藏程度、侧链被极性原子或水分子覆盖的分数以及局部二级结构,等将蛋白质Bowie结构环境分成类,然后统计出中氨基酸在种环境中的出现概率,得到一个表示不同182018氨基酸对各种环境偏好程度的评估矩阵,称为记分表对于结构已知的蛋白质每一个3D-1D X,氨基酸残基都可以分配一类环境,从而将结构转换为序列(称环境链)从头预测(3D1D ab)从头预测方法不需要已知结构信息,直接从蛋白质序列预测其空间结构,因initio prediction,而在理论上是一种理想的方法从头预测包括分子力学模拟、二级片段堆积等方法卷曲螺旋(coiled-coils)两个螺旋通过其疏水性界面相互缠绕在一起形成一个十分稳定的结构卷曲螺旋在很多蛋白质中存在,例如转录因子的亮氨酸拉链结构中以及肌球蛋白中折叠识别,InterProScan,PHD,PSIPRED,信号肽,分泌蛋白新生肽端的一段氨基酸残基组成的肽段,决定新生肽链在细胞中的N20~40定位及决定某些氨基酸残基的修饰跨膜区,就是蛋白在细胞膜内的部分正电荷局内规则(填空题里有)
四、问答、实验中从鲨肝文库中获得一段基因序列,简述如何用生物信息学方法分析其功能1DNA、目的蛋白是否和功能已知的序列相似?
1、分析目的蛋白的跨膜区、细胞定位等
2、目的蛋白是否有保守的序列特征?
3、搜索、等数据库4PROSITE BLOCKSPRINTS、结构预测分析
5、综合分析结果
6、蛋白质功能预测并实验证实
7、简述蛋白质结构同源模建的原理和一般过程2原理也就是定义,基本过程
①寻找一个或一组与待测蛋白质同源的由实验测定的蛋白质结构,进行结构叠合;
②建立未知蛋白质与已知结构蛋白质的序列比对;
③找出结构保守性的主链结构片段;
④模建结构变化的区域,一般为连接二级结构片段间的区域;
⑤侧链建模;
⑥利用能量计算的方法进行结构优化一般地,序列一致性越差,建立的模型精度也越差,序列一致性低于的蛋白质难以得到理想的结构模型30%第九章生物信息软件
一、填空题、为使用法克隆某个基因,在设计引物时候除需要设计两段分别与模板互补的片段外,还1PCR需要在这两个片段的端加上限制性酶切位点和保护碱5基O、可使用软件进行引物设计2Primer Premier、设计引物时,除加上酶切位点外,还需要在酶切位点端加上,通常为碱35,基、例举两个常用的蛋白质结构浏览软件、4RasMol Cn3D、蛋白质同源结构模建可以使用在线的免费预测工具5swiss-model
二、选择题、表达载体上常用的酶切位点有、、、,现预克隆的一1pQE30BamHI SaclKpnl SmalPstL Hindlll段基因上有等酶切位点,那么在设计引物时候可以在两段引物上各EcoRL HindllLSack AccKPstl加上哪个酶切位点序列(A)、、、、A.BamHI KpnlB BamHLHindlll CHindllL AcclD HindllLXhol、以下关于力场的说法正确的是()2B力场是一个适用于有机小分子的力场力场是一个适用于蛋白质A.CHARMm B.CHARMm的力场适用于蛋白质分析的力场只有力场以上说法都不正确C.AMBER D.第十章计算机辅助药物设计填空题、虚拟筛选指的是将三维结构数据库中的化合物分子与靶标分子在计1算机上逐一进行对接,然后按照一定的打分规则排序,从中筛选从潜在的药物docking、以下缩写代表什么数据库?剑桥晶体结构数据库美国国家癌症研究所2CSD,NCI、是一个柔性对接程序3FlexX
二、名词解释计算机辅助药物设计,合理药物设计合理药物设计或基rational drugdesign,rational drugdesign于结构的药物设计就是基于对疾病过程的分子病理生理学的理解.,structure-based drugdesign根据靶点的分子结构,并参考效应子的化学结构特征设计出针对该疾病的药物分子,从而引导设计走向合理化由此设计出的药物往往活性强,作用专一,副作用较低,故称为合理药物设计合理药物设计离不开计算机,因此也可称为计算机辅助药物设计直接药物设计方法,间接药物设计方法,虚拟筛选,模板定位法,QSAR,3D-QSAR,原子生长法:根据靶点的性质,如静电、氢键和疏水性等,逐个地增加原子,配成与受点形状和性质互补的分子分子碎片法,活性类似物法法,比较分子场分析active analogueapproach,AAA,Hansch CoMFA,DOCK
三、问答题、简述药物虚拟筛选的原理和过程
1、什么是分子对接,它依据的原理是什么?
2、等提出判断一个基因是否适合作为抗菌靶标,其标准为什么?3Spaltmann、简述如何利用基因组信息寻找新的药物靶点?
4、简述靶标有效性可以采用哪些方法验证?5答、基因组学方法,针对特定基因的“敲除技术或转基因动物模型是最成熟的验:1knockout”证靶标有效性的方法蛋白质组学方法,蛋白质组学很适合用于确定靶标蛋白质在信号传导
2.路径中所起的作用,可以获得信号分子的异构化的重要信息例如糖基化或磷酸化,因此可以了解在疾病过程中靶标蛋白质发生了那些变化、核糖酶方法,核糖酶是具有催化3ribozyme活性的能够与杂交并切断利用长度大概个核甘酸的就能设计用以RNA,mRNA mRNA200RNA清除细胞中特定的核糖酶最简单的核糖酶称为锤头核糖酶>mRNA hammerhead ribozyme4免疫化学方法,直接针对脊椎动物细胞外大分子抗原识别部位的单克隆或多克隆抗体可用以研究相应大分子的功能。
个人认证
优秀文档
获得点赞 0