蛋白质序列分析

蛋白质序列、性质、功能和结构分析
基于网络的蛋白质序列检索与核酸类似,从NCBI或利用SRS系统从EMBL检索。
1、疏水性分析
ExPASy的ProtScale程序(/cgi-bin/protscale.pl)可用来计算蛋白质的疏水性图谱。输入的数据可为蛋白质序列或SWISS-PROT数据库的序列接受号。也可用BioEdit、DNAMAN等软件进行分析。
2、跨膜区分析
蛋白质跨膜区域分析的网络资源有:
肾挫伤的护理TMPRED:/software/TMPRED_form.html
PHDhtm: bl-heidelberg.de/Services/sander/predictprotein/predictprotein.html
MEMSAT: ftp://ftp.biochem.ucl.ac.uk
3、前导肽和蛋白质定位
一般认为,蛋白质定位的信息存在于该蛋白自身结构中,并且通过与膜上特殊受体的相互作用得以 表达。这就是信号肽假说的基础。这一假说认为,穿膜蛋白质是由mRNA编码的。在起始密码子后,有一段疏水性氨基酸序列的RNA片段,这个氨基酸序列就称 为信号序列(signal sequence)。
蛋白质序列的信号肽分析可联网到genome.cbs.dtu.dk /services/SignalP/或其二版网址genome.cbs.dtu.dk/services/SignalP-2.0/。该 服务器也提供利用e-mail进行批量蛋白质序列信号肽分析的方案(genome.cbs.dtu.dk/services /SignalP/mailserver.html),e-mail地址为signalp@ genome.cbs.dtu.dk。
蛋白质序列中含有的信号肽序列将有助于它们向细胞内特定区域的移动,如前导肽和面向特定细胞 器的靶向肽。在线粒体蛋白质的跨膜运输过程中,通过线粒体膜的蛋白质在转运之前大多数以前体形式存在,它由成熟蛋白质和N端延伸出的一段前导肽或引肽 (leader peptide)共同组成。迄今有40多种线粒体蛋白质前导肽的一级结构被阐明,它们约含有20~80个氨基酸残基,当前体蛋白跨膜时,前导肽被一种或两 种多肽酶所水解转变成成熟
蛋白质,同时失去继续跨膜能力。前导肽一般具有如下性质:①带正电荷的碱性氨基酸(特别是精氨酸)含量较丰富,它们分散于不带电 荷的氨基酸序列中间;②缺失带负电荷的酸性氨基酸;③羟基氨基酸(特别是丝氨酸)含量较高;④有形成两亲(即有亲水又有疏水部分)α-螺旋结构的能力。和 信号肽与跨膜区结构一样,蛋白质的亚细胞定位也和其功能密切相关,蛋白质亚细胞定位分析可通过如下网址进行:predict. sanger.ac.uk/nnpsl/i。
4、卷曲螺旋分析
另外一个能够直接从序列中预测的功能motif是α-螺旋的卷曲螺旋(coiled- coils)排列方式。在这种结构中,两个螺旋通过其疏水性界面相互缠绕在一起形成一个十分稳定的结构。卷曲螺旋在多种蛋白质中存在,如转录因子的亮氨酸 拉链结构及肌球蛋白等。相关生物信息学资源如下:
Coiled-coil: k.ac.uk/depts/biol/units/coils/coilcoil.html
COILS: /software/COILS_form.html
EpitopeInfo: epitope-informatics/Links.htm
5、蛋白质功能预测
蛋白质序列分析的一般流程如下图。
 
图1 蛋白质序列分析的一般流程
    (1)基于序列同源性分析的蛋白质功能预测
    至少80个氨基酸长度范围内具有25%以上的序列一致性才提示可能的显著性意义。未知功能序列对库检索的一般分析策略如下:
电视连续剧红娘子①和运行Blastp程序的服务器(bi.v/blast/)连接;
②将目的序列粘贴到序列输入框中,选择BLOSUM62记分矩阵运行BlastP程序。NCBI的BlastP程序要求输入格式为FASTA格式,其他一些网站则要求纯序列格式;
什么是附着力③如果BlastP检测到了高度同源的序列,将有可能提示目的序列的生物学功能;
④如查BlastP未能获得有意义的结果,试用FASTA(www2.ebi.ac.uk/fasta3/)。虽然FASTA比BlastP慢,但有时可获得有意义的结果;
⑤如果FASTA和BlastP均未能获得有意义的结果,则需采用完全的Smith- Waterman算法对库搜索。例如用EBI的BLITZ程序(www2.ebi.ac.uk/bic_sw/)。此类程序能发现低同源性 (如20%~25%)的蛋白质序列之间的匹配情况,此种情况在近似算法中会被丢掉。
在调整记分矩阵的同时,也可调整数据库。典型情况下使用的是非冗余的蛋白质序列数据库 SWISS-PROT和PDB数据库。如用BlastP程序也可检索OWL综合性蛋白质序列数据库。OWL综合性蛋白质序列数据库网 址:www.biochem.ucl.ac.uk/bsm/dbbrowser/OWL/owl_blast.html。
(2)基于motif、结构位点、结构功能域数据库的蛋白质功能预测
motif数据库PROSITE: /prosite/。在对数据库PROSITE查询时,可
联网到:/tools /scnpsit1.html,将目的序列粘贴到输入框中,点击“search”即可。
数据库PROSITE是由专家根据生物学知识审编的SWISS-PROT蛋白质序列中有生物 学意义的位点(sites)、模式(patterns)和轮廓(profiles)的数据库,包括酶活性位点、辅因子结合位点、二硫键位点等。此库可以帮 助确定新的蛋白质序列是否属已知的家族。其网址为:
微软安全技术中心
/prosite/、/ftp/databases/prosite/。
profile数据库(蛋白质序列结构特征谱数据库)有以下几种:
BLOCKS: www./blocks/; www./blocks_search.html
PFAM: www.sanger.ac.uk/Software/Pfam/
PFAM-A: pfam.wustl.edu
PRINTS: www.bioinf.man.ac.uk/dbbrowser/PRINTS/
PRINTS-S: www.biochem.ucl.ac.uk/bsm/dbbrowser/PRINTS/PRINTS.html
ProDom: ulouse.inra.fr/prodom.html
        ulouse.inra.fr/prodom/prodom.html
        ulouse.inra.fr/prodom/blast_form.html
ProDomCG: ulouse.inra.fr/prodom.html
DOMO: www.infobiogen.fr/services/domo/
BLOCKS+: www./
蛋白质轮廓(profiles)分析:www.isrec.isb-sib.ch/software/PFSCAN_form.html
HITS蛋白质结构域数据库:www.isrec.isb-sib.ch/cgi-bin/hits/hits_index
InterProScan综合分析网站:www.ebi.ac.uk/interpro/scan.html。
蛋白质功能结构域分析的简单模块构架搜索工具(simple modular architecture research tool,SMART):bl-heidelberg.de/
6、蛋白质结构预测
蛋白质结构的四个层次:一级结构为氨基酸排列顺序,二级结构为由氢键维持的α-螺旋和β-片 层,三级结构是完全折叠好的蛋白质空间结构(残基的立体排列模式),四级结构是多个蛋白质亚基组成的蛋白质复合体的结构(即蛋白质之间的交互作用)。对二 级和三级结构进行分析是生物信息学在蛋白质结构分析分面的主要应用。另外,蛋白质的另一结构层次——蛋白质折叠——位于二级和三级结构之间十分重要。“折 叠”指蛋白质二级结构元件“压缩”的方式,不提供loop区域的所有信息和残基的精确坐标。二级结构和三级结构之间的motif、结构域 (domain)、和“折叠”或折叠单元(fold)对于蛋白质结构分类和预测有重要作用。
(1)蛋白质结构资源
a、PDB数据库
蛋白质的基本立体结构数据库PDB(protein data bank),由结构生物信息学研究组织(research collaboration for structural bioinformatics,RCSB,)管理。查看数据库的软件rasmol可从http: //www.umass.edu/microbio/rasmol/下载。
PDBFinder数据库是在PDB、DSSP、HSSP基础上建立的二级库,包含PDB序 列、作者、R因子、分辩率、二级结构等。网址:bl-heidelberg.de/pdbfinder/、 ftp://bl- Heidelberg.de/pdbfinder。
l型匹配b、NRL-3D数据库
/Dan/proteins/nrl3d.html可用于对查询蛋白质序列相似性分析以确定其结构。
c、ISSD数据库
www.protein.bio.msu.su/issd/。
d、HSSP数据库
bl-heidelberg.de/hssp/。
e、蛋白质结构分类数据库(SCOP)
蛋白质结构分类数据库(structural classification of proteins,SCOP)
-lmb.cam.ac.uk/scop/。
f、Dali/FSSP数据库
bl-ebi.ac.uk/dali/。
(2)蛋白质二级结构预测
蛋白质多重序列对齐结果进行蛋白质二级结构预测的PHD程序:
bl-heidelberg.de/predictprotein/predictprotein.html
(3)蛋白质三级结构预测

本文发布于:2024-09-22 09:33:01,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/578355.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

下一篇:发电系统-L2
标签:蛋白质   序列   结构   分析   数据库   功能   预测   信号肽
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议