生物信息学基本知识


2023年12月21日发(作者:stinky)

1. DNA: 遗传物质(遗传信息的载体) 双螺旋结构,A, C, G, T四种基本字符的复杂文本

2. 基因(Gene):具有遗传效应的DNA分子片段

3. 基因组(Genome):包含细胞或生物体全套的遗传信息的全部遗传物质。人类包括细胞核基因组和线粒体基因组

OR 一个物种中所有基因的整体组成

4. 人类基因组: 3.2×109

bp

的最初目标通过国际合作,用15年时间(1990~2005)至少投入30亿美元,构建详细的人类基因组遗传图和物理图 ,确定人类DNA的全部核苷酸序列,定位约10万基因,并对其它生物进行类似研究。

的终极目标

阐明人类基因组全部DNA序列;

识别基因;

建立储存这些信息的数据库

开发数据分析工具;

研究HGP实施所带来的伦理、法律和社会问题。

7.遗传图谱(genetic map)又称连锁图谱(linkage map),它是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组图。

遗传图谱的建立为基因识别和完成基因定位创造了条件。

8. 遗传连锁图:通过计算连锁的遗传标志之间的重组频率,确定它们的相对距离,一般用厘摩(cM,即每次减数分裂的重组频率为1%)表示。

9. 物理图谱(physical map)是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的DNA分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染体上的相对位置线性而系统地排列出来。

10. 转录图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。

11. 序列图谱:随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。

DNA序列分析技术是一个包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程。通过测序得到基因组的序列图谱

12. 大规模测序基本策略

逐个克隆法:对连续克隆系中排定的BAC克隆逐个进行亚克隆测序并进行组装(公共领域测序计划)

全基因组鸟法:在一定作图信息基础上,绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序,利用超级计算机进行组装(美国Celera公司)

13. 基因识别(gene identification)是HGP的重要内容之一,其目的是识别全部人类的基因。

基因识别包括:

识别基因组编码区

识别基因结构

基因识别目前常采用的有二种方法:

从基因组序列中识别那些转录表达的DNA片段

从cDNA文库中挑取并克隆。

14. 基因组多态性(Polymorphism): 是指在一个生物体中,同时和经常存在两种或多种不连续的变异型或基因型(genotype)或等位基因(allele),亦称遗传多态性(genetic

polymorphism)或基因多态性。

15. 功能基因组学:HGP完成后,我们将进入“后基因组学”(post-genomics)时代, 基因组学研究重心已开始从揭示生命的所有遗传信息转移到在分子整体水平对功能的研究上,即功能基因组学(functional genomics)

功能基因组的任务是

 进行基因组功能注释(Genome annotation)

 认识基因与疾病的关系

 掌握基因的产物及其在生命活动中的作用

16. 生物信息学:组织处理生物数据,并从数据中提取生物学新知识的学问。

(生物学+计算机+信息科学)

17. 生物信息学的基本概念:广义:是指生命科学与数学、计算机学和信息科学等交汇融合所形成的一门交叉科学。

该学科综合运用数学、计算机科学和生物学的各种工具对生物信息进行获取、处理、存储、分类、分析和解释,以期阐明和理解大量数据所包含的生物学意义(掌握复杂生命现象的形成模式与演化规律)

狭义:应用信息技术储存和分析基因组测序所产生的分子序列及其相关数据,也称为分子生物信息学。(molecular bioinformatics), 核心课题是从大量的序列信息中获取基因结构、功能和进化等知识。

18. 数据库(Database): 统一管理的相关数据的集合

数据库管理系统(database management system, DBMS): 对DB进行管理的系统软件,提供DB的建立、查询、更新以及各种数据控制功能

数据库技术:研究数据库的结构、存储、设计、管理和应用的一门软件学科

数据库系统(database system, DBS): 采用数据库技术的计算机系统

数据模型 (data model): 数据库结构和语义的一种抽象。由数据库结构、数据操作系统和完整性约束三部分组成

19. 序列数据库

是生物信息数据库中最基本的数据库,包括核酸序列数据库和蛋白质序列数据库两类。

序列数据库以核苷酸碱基顺序或氨基酸残基顺序为基本内容,其序列数据来自核酸和蛋白质序列测定,并附有注释信息。

注释信息包括两部分,一部分由计算机程序经过序列分析而生成,另一部分则依靠生物学家通过查阅文献资料而获得。

20. GenBank : NIH管理一个遗传序列数据库( genetic sequence database),序列来源公开发表所有DNA序列. 也是国际DNA序列收集中心与 DDBJ、EMBL进行每天的数据交换。

收集全世界已发表的和自行投送的核苷酸序列以及相关文献资料。为大规模的核苷酸序列数据库建立档案,以利长期保存,为国际分子生物学及相关研究提供良好的技术与知识平台

21. 启动子: 真核生物中,启动子是指所有对基因转录起始有重要作用的序列

真核生物的三种RNA聚合酶分别识别不同的启动子序列

22. Kozak序列:该序列是在起始密码子之前与核糖体作用的位点。在高等原核生物中其一致序列为GCCACC(ATG),而在酵母中为AAAAA(ATG)。它们可以用来检测CDS的起始。

23. CpG岛也称HTF岛: 是一些富含GC的小区域。 CpG岛定义为Y值大于0.6并且GC含量大于50%的序列区域。通常CpG岛出现在管家基因或者频繁表达的基因的启动子周围,在这些部位, CpG岛具有抵抗序列甲基化作用。

CpG岛经常出现在脊椎动物基因的5’区域,其中,50%的人类基因的转录起始位点前存

在CpG岛,因此CpG岛是发现基因的重要线索。

24. 同源性检索(homology search): 通过查询DNA或蛋白质数据库来判断所查序列是否与已知序列相同或相似。

如果所查序列是已测序基因的一部分,则就会发现相同的匹配。

同源性检索的目的是判断新序列是否与已知基因在整体上的相似性。

同源性检索主要是用来探寻新发现的基因功能

25. 同源序列: 简单地说,是指从某一共同祖先经趋异进化而形成的不同序列。相似性(similarity)和同源性(homology)是两个完全不同的概念。

26. 相似性(similarity): 是指一种很直接的数量关系,比如部分相同或相似的百分比或其它一些合适的度量。比如说,A序列和B序列的相似性是80%,或者4/5。这是个量化的关系。当然可进行自身局部比较。

相似性是指序列比对过程中用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基顺序所占比例的高低。相似性本身的含义,并不要求与进化起源是否同一,与亲缘关系的远近、甚至于结构与功能有什么联系。

当相似程度高于50%时,比较容易推测检测序列和目标序列可能是同源序列;而当相似性程度低于20%时,就难以确定或者根本无法确定其是否具有同源性。

总之,不能把相似性和同源性混为一谈。所谓“具有50%同源性”,或“这些序列高度同源”等说法,都是不确切的,应该避免使用。

27. 同源性(Homology): 指从一些数据中推断出的两个基因或蛋白质序列具而共同祖先的结论,属于质的判断。就是说A和B的关系上,只有是同源序列,或者非同源序列两种关系。而说A和B的同源性为80%都是不科学的。

而同源又有两种不同的情况即垂直方向的(orthology)与水平方向的(paralogy)。

序列间的相似性越高的话,它们是同源序列的可能性就更高

28. 直系同源的定义是:

(1)在进化上起源于一个始祖基因并垂直传递(vertical descent)的同源基因;

(2)分布于两种或两种以上物种的基因组;

(3)功能高度保守乃至于近乎相同,甚至于其在近缘物种可以相互替换;

(4)结构相似;

(5)组织特异性与亚细胞分布相似

29. 鉴定直系同源的实际操作标准(practical criteria)为:

如基因组Ⅰ中的A基因与基因组Ⅱ中的A‘基因被认为是直系同源,则要求:

(1)A‘的产物比任何在基因组Ⅱ中所发现的其它基因产物都更相似于A产物;

(2)A‘与A的相似程度比在任何一个亲缘关系较远的基因组中的任一基因都要高;

(3)A编码的蛋白与A‘编码的蛋白要从头到尾都能并排比较,即含有相似以至于相同的模序(motif)

30. 旁系同源(paralogy)基因是指同一基因组(或同系物种的基因组)中,由于始祖基因的加倍而横向(horizontal)产生的几个同源基因。

直系与旁系的共性是同源,都源于各自的始祖基因。其区别在于:在进化起源上,直系同源是强调在不同基因组中的垂直传递,旁系同源则是在同一基因组中的横向加倍;在功能上,直系同源要求功能高度相似,而旁系同源在定义上对功能上没有严格要求,可能相似,但也可能并不相似(尽管结构上具一定程度的相似),甚至于没有功能(如基因家族中的假基因)。旁系同源的功能变异可能是横向加倍后的重排变异或进化上获得了另一功能,其功能相似也许只是机械式的相关(mechanistically related),或非直系同源基因取代新产生的非亲缘或远缘蛋白在不同物种具有相似的功能。

31. 序列相似性比较:

就是将待研究序列与DNA或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是出与此序列相似的已知序列是什么。完成这一工作只需要使用两两序列比较算法。常用的程序包有BLAST、FASTA等;

序列同源性分析:

是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其它序列间的同源性大小。这是理论分析方法中最关键的一步。完成这一工作必须使用多序列比较算法。常用的程序包有CLUSTAL等;

32. Blast--“局部相似性基本查询工具”(Basic Local Alignment Search Tool) : 是一个序列相似性搜索的程序包,其中包含了很多个独立的程序,这些程序是根据查询的对象和数据库的不同来定义的。比如说查询的序列为核酸,查询数据库亦为核酸序列数据库,那么就应该选择blastn程序。

33. 序列对位排列(sequence alignment): 通过在序列中插入间隔(gap)的方法使所比较的序列长度达到一致.序列对位排列的目的是寻同源序列.

34. 相似性记分(similar score) 用记分矩阵作为序列相似性测度,比较总记分值,就可以定量评价不同对位排列的效果。

35. 全局排列:对序列全长进行最优化对位

局部排列:指序列间的局部区域达到高度相似

36. Protein-protein BLAST (blastp) :适合具有远源进化关系的匹配序列的检索

PHI- and PSI-BLAST (Patten-hit initiated and 位点特异性BLAST):是敏感性最高的搜索方式,当用蛋白质-蛋白质BLAST检索未见阳性时,可以进一步采用PHI-/PSI-BLAST

Translated query vs. protein database (blastx) : 适合对未知读码框的新测序DNA序列和EST序列分析

Protein query vs. translated database (tblastn) :适合在ESTs,HTG数据库中寻那些尚未标注的编码区

Translated query vs. translated database (tblastx): 同BLASTx一样,适合于对错误率较高的EST序列的分析,同时也是新基因识别的有力工具。

Search for gene expression data (GEO BLAST) :对The Gene Expression Omnibus(GEO)

进行检索。

Align two sequences (bl2seq) :序列的两两比较。

Screen for vector contamination (VecScreen) :用于识别序列中可能来源于载体的片段,以消除公共数据库中载体序列的污染。

Immunoglobin BLAST (IgBlast):免疫球蛋白序列的检索。

SNP BLAST :单核苷酸多肽性序列检索

37. BLASTN:最常用。

MEGABLAST:高度/非常相似,如物种基因组完成或了解序列基本信息

Discontiguous MEGABLAST:搜索相近的序列片段比较短、且相近的序列段不连续的搜索

PSI-BLSAT:位点特异性反复BLSAT,最灵敏的BLAST程序,可到蛋白质的远亲序列。 先用BLAST搜索数据库,将获得的序列通过多序列比对来构建第一个profile。 用profile搜索数据库后再利用搜索的结果重新构建profile,然后用新的profile再次搜索数据库,如此反复直至没有新的结果产生为止。

PHI-BLAST:模式发现迭代BLAST,可指定某蛋白序列片段,以这个片段为重心查询。

38. Uniprot:联合蛋白质数据库. 2002年,在NIH资助下,PIR、EBI和SIB共同创建了联合蛋白质数据库

39. α螺旋: 是蛋白质中最常见最典型含量最丰富的二级结构元件.在α螺旋中,每轮卷曲的螺旋包含3.6氨基酸残基,残基侧链伸向外侧,同一肽链上的每个残基的酰胺氢和位于它后面的第4个残基上的羰基氧彼此之间形成氢键。在水环境中,肽键上的酰胺氢和羰基氧既能形成内部(α-螺旋内)的氢键,也能与水分子形成氢键。不同的氨基酸对α螺旋形成的影响是不同的。

40. β折叠:是通过肽链间或肽段间的氢键维系。可以把它们想象为由折叠的条状纸片侧向并排而成,每条纸片可看成是一条肽链, 称为β折叠股或β股(β-strand),肽主链沿纸条形成锯齿状。需要注意的是在折叠片上的侧链都垂直于折叠片的平面,并交替的从平面上下二侧伸出。

41. 无规则卷曲或称卷曲(coil): 泛指那些不能被归入明确的二级结构如折叠片或螺旋的多肽区段。受侧链相互作用的影响很大,经常构成酶活性部位和其他蛋白质特异的功能部位如许多钙结合蛋白中结合钙离子的EF手结构(E-F hand structure)的中央环

42. 序列模体和结构域

都是通过对相关蛋白质的多序列比对分析而获得的

– 序列模体(Motif),较短的序列模式,

– 结构域(Domains),相对较长的区域,通过序列谱获得的,

– 序列模体的著名的数据库为Prosite数据库。

43. 信号肽:某些肽链的N-末端存在着15~30个氨基酸的一段顺序,其功能与将此蛋白质多肽链输送到细胞的特定部位(细胞器)有关.真核生物信号肽平均长度22.6个aa ,较长或较短的,可能是假阳性。

44. 跨膜蛋白:部分或全部镶嵌在细胞膜中或内外两侧,以非极性氨基酸与脂双分子层的非极性疏水区相互作用而结合在质膜上的蛋白质。

亲水部分暴露在膜的一侧或两侧表面; 疏水区同脂双分子层的疏水尾部相互作用。

跨膜蛋白可再分为单次跨膜、多次跨膜、多亚基跨膜等。

跨膜蛋白一般含25%~50%的α螺旋, 也有β折叠。

45. 计算机辅助药物设计(CADD)是以计算机技术与药物设计相结合的一门实用性的学科;

为改进现有的生物活性物质的结构、设计新的药物分子,提供了理论指导和思路,加速了新药的研制。

46. 分子对接原理: 在配体和受体的相互作用过程中,牵涉到两类相互作用,即非键相互作用和共价相互作用。

共价相互作用牵涉到化学键的断裂和生成,需要用量子化学的方法进行考察。

而大多数药物分子和蛋白在相互作用时,一般只牵涉到非键相互作用,它们主要是分子形状匹配,静电相互作用,疏水相互作用,化学性质匹配和分子去溶剂化因素等。

47. 计算机虚拟筛选技术 (Virtual Screening) :虚拟筛选的核心技术是分子对接,将数据库中的每一个小分子配体放入靶蛋白的活性口袋中,模拟真实的小分子配体和蛋白质的相互作用情形,评价结合结果的好坏。此过程类似于“锁-钥”关系,即如何从成千上万个钥匙中到一把能开锁的钥匙。

48. 虚拟筛选的三大要素:

①靶蛋白 Targets

PDB (Protein Data Bank, /pdb/) containing proteins or enzymes:

 X-ray crystal

 NMR

 High quality homology models

② 小分子 Ligands

ZINC database : 4.6M files provided by vendors

MDL database

③ 对接软件 Software

Autodock : free for academic

FlexX : commercial

49. X-射线衍射法(X-ray crystal): 目前能提供蛋白质三维晶体结构的重要方法,在蛋白质构象测定中,X-射线衍射法能快速、精细、直观地表达出分子内各种基团的相互空间关系;

50. 对接前优化: A.必须将晶体结构中大部分的水分子移除;

B.给蛋白加上氢原子,进行一次能量优化;

C.出蛋白的活性口袋.

51. ZINC数据库,作为对全世界开放的免费数据库,现已有460万个三维结构的小分子,根据Lipinski五原则及其它原则将数据库分成若干类:药物类似物(drug-like), 先导化合物类似物(lead-like), 小分子片段(fragment-like) 等,每个分子有多种分子格式: MOL2,SDF,SMILES等,以供不同的程序应用。另外,ZINC数据库还提供了一百多万个小分子的购买信息。

52. 基于力场的评分函数: 主要是应用Amber力场和CHARMM力场等来模拟系统中原子的相互作用,包括范德华力,静电相互作用和溶剂效应等。

这类评分函数的长处是分子力场曾经被深入研究过,具有雄厚的物理学专业基础;在对接时处理大分子的格点较快;

缺点是仅考虑了部分的相关能,还不能较好地处理:① 溶剂效应; ② 熵改变导致的势能增高; ③ 静电力易被高估; ④ 排序时发生错误。

53. 分子力场: 分子片段力场的函数表达式中包含自变量和力场参数;其中自变量为分子的结构参数,独立参数为键长、键角和二面角;而力场参数一般通过与实验数据和从头算数据进行最小二乘 法拟合来确定。

54. 经验性评分函数: 经验性评分函数有SCORE 、Ludi 、Validate 、ChemScore 和 PLP等;

优 点是取样简单,计算量小,在药物设计中应用较多;

得到的经验公式对不同的体系具有不同的预测能力,故具有一定的偏差。

55. 基于知识的评分函数: 借用了蛋白折叠的思想,对已知的受体-配体复合物主要是X线晶体结构进行原子对距离的统计分析,对接后计算受体-配体之间所有原子间的相互作用自由能,将所有的原子间相互作用自由能进行总和,可获得受体-配体的结合自由能;

基于知识的评分函数有PMF、Bleep、SmoG 和 Drugscore等,它们和基于经验的评分函数一样快速。

基于经验的方法必须依赖于已知的蛋白-配体复合物的亲和力数据;

基于知识的方法不要求蛋白-配体复合物结合亲和力数据,可以自由利用公开的可获得的信息(大约有1000个蛋白-配体复合物),相对于基于经验的方法,具有相对较少的偏差,而且易于推广应用到一个新的系统中。

56. 一致性评分 Consensus Scoring:

A.虚拟筛选没有绝对的标准,每一个特殊的体系评分值都不一样;

B.目前还没有哪一种评分算法对于预测真正的蛋白-配体结合方式是完美的,也就是在计算机上预测的受体-配体结合方式和以实验方式获得的蛋白-配体结合方式之间的相关性不高;

C.利用一致性评分,就是将两个以上独立的评分函数联合使用;

D.需要注意,在每一个特殊的体系中,评分函数的组合都有一定的适用专属性,盲目的组合评分函数并不能提高筛选的精度。

57. 虚拟筛选的本质: 富集 不能一对一的命中

58. 虚拟筛选的策略: 蛋白分子三维结构的虚拟筛选可以有许多合理途径供选择,通常是准备好小分子的三维结构数据库,将数据库中每个小分子对接到靶蛋白,再打分排序,在排序表中选取位于前列的1%~2% 的小分子进行仔细地分析,最终确定选择哪些化合物进行下一步测试。

59. PCR技术又称聚合酶链反应(Polymerase Chain Reaction)技术,是一种在体外扩增核酸的技术。该技术模拟体内天然DNA的复制过程。其基本原理是在模板、引物、4种dNTP和赖热DNA聚合酶存在的条件下,特异扩增位于两段已知序列之间的DNA区段的酶促合成反应。每一循环包括高温变性、低温退火、中温延伸三步反应。

A. 变性:90℃-96℃,双链DNA模板在热作用下, 氢键断裂,形成单链DNA。

B. 退火: 55℃-65℃,系统温度降低,引物与DNA模板结合,形成局部双链。

C. 延伸: 70℃-75℃,在Taq酶(在72℃左右最佳的活性)的作用下,以dNTP为原料,从引物的5′端→3′端延伸,合成与模板互补的DNA链。1min/Kb。

D. 循环:变性-退火-延伸,往复循环,即可使靶细胞序列大大扩增。

E. 产物量: 从理论上讲,每循环一次,就可使产物在前一循环基础上翻1倍,因而使产物呈几何级增加。产物的增加符合下列公式:

Y=X(1+E)n

Y为产物量,X为初始投入系统中的模板考贝数,E为循环中的效率因子,n为循环周期数。经过25~30个循环后,最初的靶序列可被扩增105~109倍。

60. 耐热DNA聚合酶(如Taq DNA Polgmerase) ,该酶在70~75℃时具有最高的酶学活性。由于它的反应温度较高,在较高温度下引物与模板的配对专一性好,从而提高了反应的特异性,这是该酶的最大优点。Taq DNA 聚合酶具有5’→3’聚合酶活性和5’→3’外切酶活性,但缺乏3’ →5’外切酶活性。因此,在PCR反应中如果发生某些单核苷酸的错配,这种酶是没有校正功能的,这是该酶的缺点,Taq酶错配的概率是2.1×10-4左右。

新型高保真Taq DNA Polgmerase可校正错配。

61. 模板: PCR中的模板可以是来源于任何生物(包括动物、植物、细胞及病毒等)的单链DNA及双链DNA。RNA分子亦可作为扩增模板,但在作PCR扩增之前,需要用逆转录酶将RNA逆转录为cDNA 。

PCR对模板纯度要求并不高。大量资料表明,样品中存在一定量的蛋白质或有机物对实验结果影响不大。甚至可以将细胞裂解物直接用于扩增。有DNA部分降解的样品,也有可能作为模板使用,但前提是样品中至少得有一个完整的靶序列分子。

在PCR中,起始模板的用量,理论上讲可以少到仅有一个有效的单一分子。为了获得高质量和高效率扩增,模板用量可为ng或 ug水平。通常用105 个靶序列分子作为模板是比较恰当的。

62. 引物长度以17~28bp为宜。

引物过短会影响到扩增的特异性,过长容易引起引物二聚体或发卡。如果扩增产物≤500bp,引物长度为16~18bp即可。如果扩增4~5kb的大片段,引物最好不要少于24bp。

63. 二聚体分子: 两引物分子之间或引物分子内部有过多的互补碱基,否则就会形成二聚体分子,二聚体分子中的两条链互为模板,互为引物,引起引物扩增,导致模板扩增失败。

另外,还要尽量避免引物分子内部形成二级结构(发卡)。

64. 碱基分布的均衡性: 引物中应避免嘌呤或嘧啶的堆积现象,避免连续出现4个以上的同一碱基。各种碱基最好分布均匀,G+C应为50-60%。

65. 引物的Tm值: 当温度升高到一定值后,双链DNA分子会解链为单链,这种温度称为解链温度。Tm值是指溶液中有半数的DNA分子解链为单链时的温度,推荐55 ℃-65 ℃

计算公式(大于25个碱基时,此公式不适用):Tm=4(G+C)+2(A+T)

两条引物的Tm尽可能相近,最好相差不超过3℃。

66. 退火温度: 高温变性的DNA分子在温度下降过程中,又会再度结合为双链DNA分子,此过程称为退火即复性。

退火温度过低,少数碱基形成的局部双链不易解链, 特异性降低。太高的退火温度使得引物不能复性到模板上,不能有效合成DNA。一般将退火温度设定为Tm值减去5~15℃。在试验之初,人们宁可选用较低的退火温度,首先得到有PCR合成产物之后再逐步提高退火温度,以提高反应的特异性。

67. PCR反应管: 对酶蛋白及核酸的吸附性应尽可能小,且要具有良好的热传导性能,有市售专供PCR反应用的薄壁聚乙烯管能满足上述要求。通常在PCR反应体系的上形成冷凝水。目前有些新型的PCR仪可以不用加矿物油,其机制是设计了一个特殊的可加热的热盖,从而保持了反应室温度的上下均衡而不致有冷凝水形成。

P.S.

1.

Infoinformatics: 生物学信息

EST: express sequence tag(表达序列标签)

STS: sequence-tagged site (路标或序列标签位点)

SNP: single nucleotide polymorphism(单核苷酸多肽性)

Unigen: 单一基因

CDS:编码区序列

ORF: open reading frame(开放读框)/基因中翻译蛋白质的部分

Intron:内含子

Exon:外显子

Bp:base pair(碱基对)

Kb: kilobase(千碱基)

Mb:megabase(兆碱基)

Gb: gigabase(千兆碱基)

2. PCR万金油程序:94℃预变性 5min,(94℃变性45sec,55℃退火 45sec,72℃延伸1min),35个循环,72℃延伸7min。


本文发布于:2024-09-22 08:21:52,感谢您对本站的认可!

本文链接:https://www.17tex.com/fanyi/21566.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:序列   分子   基因   数据库   进行   基因组   蛋白质
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议