蛋白质序列分析和结构预测 生物信息学

蛋白质序列分析和结构预测
实验目的】
1、掌握蛋白质序列检索的操作方法;
2、熟悉蛋白质基本性质分析;
3、熟悉基于序列同源性分析的蛋白质功能预测,了解基于motif 结构位点、结构功能域数据库的蛋白质功能预测;
4、了解蛋白质结构预测。
【实验内容】
1、使用Entrez信息查询系统检索人瘦素 (leptin)蛋白质序列;
2、使用EXPASY中有关工具对上述蛋白质序列进行分子质量、氨基酸组成等基本性质分析;
3、对瘦素蛋白质序列进行基于NCBI/Blast软件的蛋白质同源性分析;
4、对瘦素蛋白质序列进行motif结构分析、翻译后修饰等的预测
【实验方法】
1、 瘦素蛋白质序列的检索:
1)调用Internet浏览器并在其地址栏输入Entrez网址bi.v/Entrez
2)选择protein
3)在输入栏输入homo sapiens leptin
4)点击search后显示序列接受号及序列名称;
5)点击序列接受号后显示序列详细信息;
6)将序列转为FASTA格式保存;
2、进入EXPASY网站使用有关软件进行蛋白质序列分析和结构预测。
aaaaaaaaaaaaaaaaaa1)选择Protparam程序对蛋白质序列进行分子质量、氨基酸组成和等电点等基本性质分析;
  2)蛋白质的同源性搜索分析,NCBIBLAST
  3)在Pattern and profile searches中选择interPro Scan 进行结构域或motif搜索以及有关结构域的结构分析
  4)在post-translational modification prediction 选择signalP对蛋白质序列进行信号肽预测分析
【作业】
提交使用上述软件对瘦素蛋白质序列进行基本性质分析、同源性分析、motif结构分析以及信号肽折叠位点预测的结果
附:
【实验方法】
1、瘦素蛋白质序列的检索:
1)调用Internet浏览器并在其地址栏输入Entrez网址(bi.v/Entrez)
2)选择protein
3)在输入栏输入homo sapiens leptin
4)点击go后显示序列接受号及序列名称;
5)点击序列接受号后显示序列详细信息;
6)将序列转为FASTA格式保存;
2、进入EXPASY网站  pasy.ch/tools/  使用有关软件进行蛋白质序列分析和结构预测。
1)使用DNA—Protein中的translate将已知的leptinmRNA序列翻译为蛋白质序列
2)选择Protparam程序对蛋白质序列进行分子质量、氨基酸组成和等电点等基本性质分析:
3)蛋白质的同源性搜索分析
    1)在EXPASY下使用BlastP对选择蛋白质序列进行同源性搜索
    2)在EXPASY下使用BlastX程序选择mRNA序列进行翻译后在蛋白质数据库进行同源性搜索
4)在Pattern and profile searches中选择interPro Scan进行结构域或motif搜索以及有关结构域的结构分析
  5)在post-translational modification prediction 选择signalP对蛋白质序列进行信号肽预测分析
>gi|46854679|gb|AAH69452.1| Leptin [Homo sapiens]
MHWGTLCGFLWLWPYLFYVQAVPIQKVQDDTKTLIKTIVTRINDISHTQSVSSKQKVTGLDFIPGLHPIL
TLSKMDQTLAVYQQILTSMPSRNVIQISNDLENLRDLLHVLAFSKSCHLPWASGLETLDSLGGVLEASGY
STEVVALSRLQGSLQDMLWQLDLSPGC
>gi|4557715|ref|NP_000221.1| leptin precursor [Homo sapiens]
MHWGTLCGFLWLWPYLFYVQAVPIQKVQDDTKTLIKTIVTRINDISHTQSVSSKQKVTGLDFIPGLHPIL
TLSKMDQTLAVYQQILTSMPSRNVIQISNDLENLRDLLHVLAFSKSCHLPWASGLETLDSLGGVLEASGY
STEVVALSRLQGSLQDMLWQLDLSPGC
>gi|169790920|ref|NM_000230.2| Homo sapiens leptin (LEP), mRNA
GTAGGAATCGCAGCGCCAGCGGTTGCAAGGCCCAAGAAGCCCATCCTGGGAAGGAAAATGCATTGGGGAA
CCCTGTGCGGATTCTTGTGGCTTTGGCCCTATCTTTTCTATGTCCAAGCTGTGCCCATCCAAAAAGTCCA
AGATGACACCAAAACCCTCATCAAGACAATTGTCACCAGGATCAATGACATTTCACACACGCAGTCAGTC
TCCTCCAAACAGAAAGTCACCGGTTTGGACTTCATTCCTGGGCTCCACCCCATCCTGACCTTATCCAAGA
TGGACCAGACACTGGCAGTCTACCAACAGATCCTCACCAGTATGCCTTCCAGAAACGTGATCCAAATATC
CAACGACCTGGAGAACCTCCGGGATCTTCTTCACGTGCTGGCCTTCTCTAAGAGCTGCCACTTGCCCTGG
GCCAGTGGCCTGGAGACCTTGGACAGCCTGGGGGGTGTCCTGGAAGCTTCAGGCTACTCCACAGAGGTGG
TGGCCCTGAGCAGGCTGCAGGGGTCTCTGCAGGACATGCTGTGGCAGCTGGACCTCAGCCCTGGGTGCTG
AGGCCTTGAAGGTCACTCTTCCTGCAAGGACTACGTTAAGGGAAGGAACTCTGGCTTCCAGGTATCTCCA
GGATTGAAGAGCATTGCATGGACACCCCTTATCCAGGACTCTGTCAATTTCCCTGACTCCTCTAAGCCAC
TCTTCCAAAGGCATAAGACCCTAAGCCTCCTTTTGCTTGAAACCAAAGATATATACACAGGATCCTATTC
TCACCAGGAAGGGGGTCCACCCAGCAAAGAGTGGGCTGCATCTGGGATTCCCACCAAGGTCTTCAGCCAT
CAACAAGAGTTGTCTTGTCCCCTCTTGACCCATCTCCCCCTCACTGAATGCCTCAATGTGACCAGGGGTG
ATTTCAGAGAGGGCAGAGGGGTAGGCAGAGCCTTTGGATGACCAGAACAAGGTTCCCTCTGAGAATTCCA
AGGAGTTCCATGAAGACCACATCCACACACGCAGGAACTCCCAGCAACACAAGCTGGAAGCACATGTTTA
TTTATTCTGCATTTTATTCTGGATGGATTTGAAGCAAAGCACCAGCTTCTCCAGGCTCTTTGGGGTCAGC
CAGGGCCAGGGGTCTCCCTGGAGTGCAGTTTCCAATCCCATAGATGGGTCTGGCTGAGCTGAACCCATTT
TGAGTGACTCGAGGGTTGGGTTCATCTGAGCAAGAGCTGGCAAAGGTGGCTCTCCAGTTAGTTCTCTCGT
AACTGGTTTCATTTCTACTGTGACTGATGTTACATCACAGTGTTTGCAATGGTGTTGCCCTGAGTGGATC
TCCAAGGACCAGGTTATTTTAAAAAGATTTGTTTTGTCAAGTGTCATATGTAGGTGTCTGCACCCAGGGG
TGGGGAATGTTTGGGCAGAAGGGAGAAGGATCTAGAATGTGTTTTCTGAATAACATTTGTGTGGTGGGTT
CTTTGGAAGGAGTGAGATCATTTTCTTATCTTCTGCAATTGCTTAGGATGTTTTTCATGAAAATAGCTCT
TTCAGGGGGGTTGTGAGGCCTGGCCAGGCACCCCCTGGAGAGAAGTTTCTGGCCCTGGCTGACCCCAAAG
AGCCTGGAGAAGCTGATGCTTTGCTTCAAATCCATCCAGAATAAAACGCAAAGGGCTGAAAGCCATTTGT
TGGGGCAGTGGTAAGCTCTGGCTTTCTCCGACTGCTAGGGAGTGGTCTTTCCTATCATGGAGTGACGGTC
CCACACTGGTGACTGCGATCTTCAGAGCAGGGGTCCTTGGTGTGACCCTCTGAATGGTCCAGGGTTGATC
ACACTCTGGGTTTATTACATGGCAGTGTTCCTATTTGGGGCTTGCATGCCAAATTGTAGTTCTTGTCTGA
TTGGCTCACCCAAGCAAGGCCAAAATTACCAAAAATCTTGGGGGGTTTTTACTCCAGTGGTGAAGAAAAC
TCCTTTAGCAGGTGGTCCTGAGACCTGACAAGCACTGCTAGGCGAGTGCCAGGACTCCCCAGGCCAGGCC
ACCAGGATGGCCCTTCCCACTGGAGGTCACATTCAGGAAGATGAAAGAGGAGGTTTGGGGTCTGCCACCA
TCCTGCTGCTGTGTTTTTGCTATCACACAGTGGGTGGTGGATCTGTCCAAGGAAACTTGAATCAAAGCAG
TTAACTTTAAGACTGAGCACCTGCTTCATGCTCAGCCCTGACTGGTGCTATAGGCTGGAGAAGCTCACCC
AATAAACATTAAGATTGAGGCCTGCCCTCAGGGATCTTGCATTCCCAGTGGTCAAACCGCACTCACCCAT
GTGCCAAGGTGGGGTATTTACCACAGCAGCTGAACAGCCAAATGCATGGTGCAGTTGACAGCAGGTGGGA

本文发布于:2024-09-21 16:28:13,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/361167.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:序列   蛋白质   分析   进行   实验   预测   结构
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议