实验九 蛋白质序列分析

安徽中医学院学报实验九、蛋白质序列分析(3学时)
目的:了解针对于蛋白质序列的分析内容与方法。熟悉蛋白质的网上分析服务器。
内容:预测蛋白质序列的物化特性;预测蛋白酶消化模式;预测跨膜结构以及卷曲螺旋(coiled coil)结构;预测蛋白质的翻译后修饰;发现蛋白质中的功能结构域;蛋白质结构域分析常用网站。
When youre studying a protein, you turn yourself into an investigator.
也就是说,你希望在实验设计之前了解与此有关的任何信息。比如,蛋白质序列的分子量、等电点等基本物化特性,活化的蛋白质会起什么作用?它是否会在翻译后进行修饰?是否是个跨膜蛋白?是否有已知的3D结构?如果它是个酶,那么它的底物是什么?
当然相似性搜索也能够帮助你猜测蛋白质所包含的功能。如果你发现某处的一个蛋白质序列数据库(每个序列都经过了非常详细的研究与注释)中有与你的蛋白质序列非常相似的序列,你就可以说这条记录中的蛋白质特性有极大的可能也会出现在你的序列中。
如果你希望利用计算机做一些生物化学研究,这里有两个非常好的网上站点:
爱真三The ExPASy (Expert Protein Analysis System) server at (you can access to 疏血通 , which is the mirror server of ExPASy in China), with a specific page dedicated to protein analysis methods.
The Swiss EMBnet at .
一、预测蛋白质的主要物化特性。
ProtParam是ExPASy服务器上的一个程序,可方便地评估蛋白质序列中的每一种简单的物化特性。
1、进入ExPASy服务器 ,在主页右侧“Tools and software packages” 栏下有一个Proteomics and sequence analysis tools,其下有多个选项,选定Primary structure analysis 的链接(或直接利用/tools/#primary进入),选择第一项ProtParam。
2、如果你的序列在SWISSPROT(SP)中有记录,就可以使用SP的AC号进行分析,如果你的序列不在SP库中,则在另一窗口中粘贴进裸序列(raw data)进行分析。(我们先使
用其示例蛋白AC号P05130可先从页面上方的快捷检索栏中输入此AC号,在SWISS-PROT/TrEMBL中的查此序列的相关信息。)点击compute parameters。
3、如果你选用的是SP库的AC号进行分析,则会出现一个中间页面,你可以看到在你序列中的一些特性的列表,注意这不是预测结果,只是显示了SP记录中所包含的信息。在此信息的下部有两栏内容需要你输入要分析的片段范围。如果这两栏空着,则ProtParam会给出整条序列的分析结果。点击SUBMIT.
4、结果中包括了分子量、消光系数、半衰期等信息,你可以利用浏览器的File-save as 来保存你的结果。
5、ProtParam的结果说明。
/tools/protpar-ref.html 处的Full text 链接提供的PDF文件对ProtParam进行了详细的解释,你可以从中了解ProtParam是如何计算得到这些参数的。下面是一些你要注意的地方:
分子量。A、程序计算的只将序列中的所有残基的分子子进行相加,结果中并不包含翻译
后的修饰如糖基化和磷酸化的情况。B、结果中不会考虑诸如去除前导肽等复杂的蛋白质成熟机制。C、ProtParam不会知道你的成熟蛋白质是否会形成二聚体、三聚体或多聚体。因此,这类问题会使你的实验结构与预想值相差很远。
消光系数(Extinction coefficient)。可以让你知道在特定的波长下你的蛋白质会吸收多少光强。当你纯化了蛋白质后需要对其进行分光光度计检测时,此估计值就很有用。(注意:ProtParam的预测值只是一种指示。ProtParam predicts the extinction coefficient by summing the contribution of every amino acid as if each was independent. This calculation ignores the fact that the behavior of amino acids can be dramatically altered depending on their immediate surroundings. This isn’t something that can be predicted. If you need the exact coefficient, you must measure it experimentally. On the other hand, for most proteins, the experimental coefficient is rarely very different from the theoretical one.
不稳定性(Instability)。这个值只是对蛋白质稳定性的一个粗略估计。When the index is below 40, the protein is usually stable. Above 40, it may not be stable.
半衰期(Half-life)。粗略的估计你的蛋白质经过多长时间后其存在于细胞内的总量比其最初合成时减少了一半。这一预测针对三种不同的物种。你可以从中外推到相似的物种。(注意:如果你的蛋白质降解属于一个调控过程,则半衰期的预测值没有任何意义。
二、云母片蛋白质的模拟消化
如果你只希望利用蛋白质序列中你感兴趣的那部分进行实验时,可以利用一个蛋白质酶对你的蛋白质进行特异性消化。如果你想做下列实验时,同样需要使用蛋白酶的消化:A、分离你的蛋白质中的结构域;B、通过质谱鉴定可能的翻译后修饰;C、当你表达了一个融合蛋白的时候去除标记蛋白(tag protein);D、确认你克隆的蛋白质对某些内源蛋白酶不敏感。
ExPASy服务器上有一个PeptideCutter工具(在 页面中)可满足此方面的要求。利用上个实验所使用的蛋白质P05130进行模拟蛋白酶切,相关说明及特定的蛋白酶酶切位点都有链接,指导你的使用。
三、蛋白质一级结构分析
一级结构即为蛋白质的氨基酸序列。它不会反应出氨基酸残基间可能的相互作用(这种残基间的相互作用是由二级结构及三级结构预测来完成的)。一级结构的分析是为了发现序列中的一些特定组成片段,而这些片段可能会揭示蛋白质的特性。比如:A、蛋白质中的疏水区域可能是一个跨膜片段,并将蛋白质定位于膜上;B、coiled-coil区域暗示了可能的蛋白质-蛋白质相互作用;C、亲水片段将可能形成蛋白质表面的环状结构。
在此部分实验中所使用的分析方法中很多都依赖于滑动窗口技术。以滑动窗口以基础的预测不会很敏感也不会很精确,但它却很实在。如果你用此种方法发现了一个很强的信号,一般说来它都是一个真正的生物学信号。
1、查跨膜片段
预测你的蛋白质中是否具有跨膜片段会比其它任何的简单预测告诉你的功能信息都要多。如果知道你的蛋白质是一个跨膜蛋白,就不会采用与球蛋白同样的技术对它进行研究;如果你发现跨膜片段存在于蛋白质的N-端,你可以猜测它是个分泌蛋白;如果蛋白中存在多个跨膜结构域,则暗示了它是个通道蛋白。
这里我们给出两个跨膜片段预测工具:ProtScale(on ExPASy server, it is a very simple one, doesn’t predict anything for you; it returns a hydrophobicity profile and lets you do the interpretation.)以及TMHMM(not a part of ExPASy, it is a service offered to the community by the Technical University of Denmark. One of the most complete, tells you about the portions of your protein that are probably inside the cell and those that are probably outside)。
1)运行ProtScale
A、进入ProtScal: .
B、将序列的AC号(P78588)输入小的搜索框。(P78588是SP数据库中的记录,这个蛋白含有7个跨膜片段)
C、在页面下方的Please choose an amino acid scale from the following list的选项中选择 Hphob. / Kyte & Doolittle 。你可以看到页面提供了大量的蛋白质特性供你检测蛋白质使用,而此项是最适合预测跨膜螺旋的蛋白质特性。
国家行政机关公文处理办法
D、在window Size下拉菜单中,选择19(由于跨膜结构的基本长度为21个氨基酸,因此此值比较适合发现跨膜结构域)。
E、点击Submit。与第一项物化特性分析的ProtParam一样,出现了一个中间页面,显示了SP数据库记录中的信息,并可以对要分析的片段的范围进行限定(注意留心此记录中所记载的7个跨膜结构的位置)。随后,可点击Submit执行分析。
F、显示的结果如图,可利用右键图片另存保存你的结果。
  在上图中,记录中记载的跨膜结构域都在图下部用短粗线进行了标记。一般说来,利用Kyte and Doolittle方法的推荐阈值为1.6。从图中我们可以清楚地分辨7个跨膜结构中的5个,第6个我们可以猜想得到,而第7个跨膜结构我们却无法看得出来。这没什么可惊奇的:很多包含7个跨膜结构区域的蛋白质都是很容易发现其中的6个,但第7个非常难以预测。
  你还可以在前一页的Please choose an amino acid scale from the following list中选择利用其他的scale如Eisenberg来确认你的结果是否具有意义。结果与刚才得到的结果有一些不同,但主要的特性则非常相似。
世界影视博览2)运行TMHMM。
TMHMM利用了精密的数据模型(隐马尔可夫模型)来预测跨膜区域。
A、点击www.cbs.dtu.dk/services/TMHMM进入TMHMM。
B、TMHMM只识别FASTA格式的的序列。所以要先拿到P78588的序列,将之粘贴到相应的窗口中。
C、选择Use Old Model选项。(对此蛋白而言,旧版本的工具比新版要更准确一些。这一点可根据不同的蛋白而进行改变),其它选项保持默认值(如Extensive with graphic)。点击Submit。
D、在结果中以图形的方式显示了跨膜结构。你可以将它保存下来。
ProtScale与TMHMM的两个主要不同点:A)TMHMM返回了一个精确的预测结果;B)TMHMM预测了哪个片段在细胞内而哪个片段在细胞外。

本文发布于:2024-09-21 04:26:32,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/321284.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:蛋白质   序列   预测   进行   分析   结果   跨膜   特性
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议