生物信息学

生物信息学:广义 :应用信息科学的方法和技术,研究生物体系和生物过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也可以说成是生命科学中的信息科学。 狭义:应用信息科学的理论、方法和技术管理、分析和利用生物分子数据。通过收集、组织、管理生物分子数据,使研究人员能够迅速地获得和方便地使用相关信息;通过处理、分析、挖掘生物分子数据,得到深层次的生物学知识,加深对生物世界的认识
生物系统树 把物种按亲缘关系远近用图形表达而成的树状系统
模式生物的基因组结构相对于人类基因组来说,比较简单,在基因组测序时可以为人类基因组计划提供借鉴,更重要的是对这些模式生物体的功能基因的认识可以为认识人类基因组的功能提供更多的帮助。四大“模式生物”:酵母、线虫、果蝇、小鼠
模式生物的特点
1)生理特征能够代表生物界的某一大类;
2)容易获得并易于在实验室内饲养繁殖;
3)容易进行实验操作,特别是遗传学分析.
酵母:真菌界的单细胞真核生物
1)是单细胞生物,可在基本培养基上生长,可通过改变物理或化学环境完全控制其生长
2)在单倍体和二倍体的状态下均可生长,并可在实验条件下控制单倍体和二倍体之间的相互转换,这对其基因功能的研究十分有利
3)有将近31%编码蛋白质的基因或ORF与哺乳动物编码蛋白质的基因有高度的同源性
拟南芥:十字花科草本,生活周期为6周,是理想的模式植物
[斑马鱼]和[非洲爪蟾]
是目前最常用的两种模式低等脊椎动物
斑马鱼特点:1)产卵多,繁殖迅速
2)胚胎通体透明,是进行胚胎发育机理和基因组研究的好材料
非洲爪蟾特点:1)卵母细胞体积大,数量多,易于显微操作,还可制成具有生物活性的无细胞体系,易于生化分析,在卵母细胞减数分裂机理研究中有重要作用
蛋白质的空间结构
一级结构(primary structure)
广西劳动力市场    多肽链中氨基酸数目、种类和线性排列顺序
二级结构(secondary structure)
    氢键形成-螺旋( -helix)
    链间形成-折叠(-sheet)思其始而成其终
三级结构(tertiary structure)
    肽链进一步沿多方向盘绕成紧密的近似球状结构
四级结构(quaternary structure)
  具有特定构象的肽链进一步结合,并在空间相互作用
重要的生物信息学问题
从氨基酸序列预测蛋白质的结构与功能
        蛋白质Fold的分类与预测
        结构域(domain)分析与预测  Motif分析与预测(如信号肽)
二级结构预测  氢键形成-螺旋( -helix)、-折叠(-sheet)
高级的预测
核酸的特殊意义:存储大量被压缩的生物信息
生物信息学的主要研究内容 
生物学数据的收集、存储、管理与提供
基因组序列信息的提取和分析  功能基因组相关信息分析
生物大分子结构模拟和药物设计  生物信息分析的技术与方法研究  应用与发展研究
计算生物学/生物信息学的主要理论方法
  基于数据挖掘(知识发现)的方法  基于模拟分析的方法
1. 核酸和蛋白质序列分析研究  2.  生物分子相互作用的复杂系统模拟
I型内含子的特征
1.边界顺序为5′U……G 3′;
2.具有中部核心结构(Central core structure);
3.内部引导顺序(Internal guide seguence IGS);
4.剪接通过转酯反应(Transesterification).
物理概念图内含子的拼接比较
  从内含子的剪接机制来看,I型内含子、II型内含子和核pre-mRNA剪接的III型内含子是相似的,只有tRNA的IV型内含子剪接机制完全不同。
    I型内含子剪接与核Pre-mRNA剪接体切除内含子的主要区别是,剪接体内含子使用内含子自身的一个核苷酸,而I型内含子的剪接反应使用外源核苷酸,即鸟苷酸或鸟苷,因此在剪接过程中不能形成套索结构。
    III型内含子的剪接体内snRNA的整体形态和II型内含子自我剪接时的形态类似,特别是剪接体的snRNA和II型内含子的催化部位之间的结构和功能十分相似。可以认为,这些snRNA可能来自早期自我剪接系统的II型内含子
  I型内含子与II型内含子都能够完成自我剪接,不像III型内含子那样需要结构复杂的剪接体。正因为如此,I型内含子与II型内含子剪接的效率和调控远远比不上III型内含子。I型内含子的剪接反应使用外源鸟苷酸或鸟苷,II型内含子的转酯反应无需游离鸟苷酸或鸟苷的启动,由内含子内部的腺苷酸引起,也许II型内含子剪接的效率和精确度比I型内含子更好一些。
    核酶的活性部位是暴露在分子表面的一段保守核苷酸区域,无论RNA分子形成的是二级或三级结构,都使得这个区域保持一种特定的分子环境,能使自身RNA分子断裂,或者使另一底物分子的磷酸二酯键断裂,或在切割一个磷酸二酯键的同时,形成另一个新的磷酸二酯键。核酶RNA与底物RNA之间的相互作用依赖于碱基配对,形成一种催化环境。
Nucleotide 数据库分为三个子数据库
EST :表达序列标记数据库
GSS :基因组测序序列数据库
CoreNucleotide :包含所有未被以上两个子数据库收录的核苷酸序列
检索限定词:1、基因名称的检索限定词:[GENE] or [GENE NAME]
2、生物体名称的检索限定词:[ORGN] or [ORGANISM]
3、作者姓名的检索限定词:[AUTH] or [AUTHOR]
点击send选择file,格式为FASTA
PRIMER PREMIER 该软件主要由以下四个主要功能板块组成
GeneTank 序列编辑;Primer 引物设计;Align 序列比较;Enzyme 酶切分析;Motif 基序分析
“Premier”进行自动搜索,“Oligo”进行分析评价
引物设计应注意的要点
1. 引物的长度一般为15-30 bp,常用的是18-27 bp,但不应大于38,因为过长会导致其延伸温度大于74℃,不适于Taq DNA聚合酶进行反应。
石油信息
2. 引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错配。引物3’端出现3个以上的连续碱基,如GGG或CCC,也会使错误引发机率增加。
3. 引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个碱基,因此应当避免在引物的3’端使用碱基A。另外,引物二聚体或发夹结构也可能导致PCR反应失败。5’端序列对PCR影响不太大,因此常用来引进修饰位点或标记物。
4. 引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。
5. 引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。Tm值的计算有多种方法,如按公式Tm=4(G+C)+2(A+T),在Oligo软件中使用的是最邻近法(the nearest neighbor method) 。
6. ΔG值是指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定性。应当选用3’端ΔG值较低(绝对值不超过9),而5’端和中间ΔG值相对较高的引物。引物的3’端的ΔG值过高,容易在错配位点形成双链结构并引发DNA聚合反应。
7. 引物二聚体及发夹结构的能值过高(超过4.5kcal/mol)易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正常进行。
8. 对引物的修饰一般是在5’端增加酶切位点,应根据下一步实验中要插入PCR产物的载体的相应序列而确定
在分子生物学中,DNA或蛋白质的相似性是多方面的,可能是核酸或氨基酸序列的相似,可能是结构的相似,也可能是功能的相似。一个普遍的规律是序列决定结构,结构决定功能
研究序列相似性的另一个目的是:通过序列的相似性,判别序列之间的同源性,推测序列之间的进化关系。序列比较的根本任务是:通过比较生物分子序列,发现它们的相似性,出序列之间共同的区域,同时辨别序列之间的差异。
在生物学种系发生理论中,若两个或多个结构具有相同的祖先,则称它们同源(Homology)。这里相同的祖先既可以指进化论意义上的祖先.同源这一概念需与相似区分开来。
这些相似的结构由不同的渠道演化而来,这种演化过程叫做趋同演化
直向同源(orthologous)序列是来自于不同的种属同源序列,而共生同源(paralogous)序列则是来自于同一种属的序列,它是由进化过程中的序列复制而产生的。
序列比较的基本操作
序列比较的基本操作是比对(align)。两条序列的比对(alignment)是指这两条序列中各个字符的一种一一对应关系,或字符对比排列。
序列的比对是一种关于序列相似性的定性描述,它反映在什么部位两条序列相似,在什么部位两条序列存在差别。
最优比对揭示两条序列的最大相似程度,指出序列之间的根本差异。
序列比较的具体任务和应用
最简单的距离就是海明(Hamming)距离。对于两条长度相等的序列,海明距离等于对应位置字符不同的个数 .
编辑操作
辽宁中医杂志为了解决字符插入和删除问题,引入字符“编辑操作”(Edit Operation)的概念,通过编辑操作将一个序列转化为一个新序列。用一个新的字符“-”代表空位(或空缺,Space),并定义下述字符编辑操作:
      Match(a,a)  — 字符匹配;
      Delete(a,-)  — 从第一条序列删除一个字符,或在第二条序列相应的位置插入空白
字符;
Replace(a,b) — 以第二条序列中的字符b替换第一条序列中的字符a,a¹b;
Insert(-,b)  — 在第一条序列插入空位字符,或删除第二条序列中的对应字符b。
在比较两条序列s和t时,在s中的一个删除操作等价于在t中对应位置上的一个插入操作,反之亦然。需要注意的是,两个空位字符不能匹配,因为这样的操作没有意义。引入上述编辑操作后,重新计算两条序列的距离,就成为编辑距离。
风雨张居正下载

本文发布于:2024-09-21 20:20:56,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/38678.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:序列   生物   结构   分析   字符
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议