1、掌握蛋白质序列检索的操作方法;
2、熟悉蛋白质基本性质分析;
3、熟悉基于序列同源性分析的蛋白质功能预测,了解基于motif、 结构位点、结构功能域数据库的蛋白质功能预测;
4、了解蛋白质结构预测。
【实验内容】
1、使用Entrez信息查询系统检索人瘦素 (leptin)蛋白质序列;
2、使用EXPASY中有关工具对上述蛋白质序列进行分子质量、氨基酸组成等基本性质分析; 3、对瘦素蛋白质序列进行基于NCBI/Blast软件的蛋白质同源性分析;
4、对瘦素蛋白质序列进行motif结构分析、翻译后修饰等的预测
【实验方法】
1、 瘦素蛋白质序列的检索:
(1)调用Internet浏览器并在其地址栏输入Entrez网址bi.v/Entrez
(2)选择protein;
(3)在输入栏输入homo sapiens leptin;
(4)点击search后显示序列接受号及序列名称;
(5)点击序列接受号后显示序列详细信息;
(6)将序列转为FASTA格式保存;
2、进入EXPASY网站使用有关软件进行蛋白质序列分析和结构预测。
(aaaaaaaaaaaaaaaaaa1)选择Protparam程序对蛋白质序列进行分子质量、氨基酸组成和等电点等基本性质分析;
(2)蛋白质的同源性搜索分析,NCBI的BLAST;
(3)在Pattern and profile searches中选择interPro Scan 进行结构域或motif搜索以及有关结构域的结构分析
(4)在post-translational modification prediction 选择signalP对蛋白质序列进行信号肽预测分析
【作业】
提交使用上述软件对瘦素蛋白质序列进行基本性质分析、同源性分析、motif结构分析以及信号肽折叠位点预测的结果
附:
【实验方法】
1、瘦素蛋白质序列的检索:
(1)调用Internet浏览器并在其地址栏输入Entrez网址(bi.v/Entrez);
(2)选择protein;
(3)在输入栏输入homo sapiens leptin;
(4)点击go后显示序列接受号及序列名称;
(5)点击序列接受号后显示序列详细信息;
(6)将序列转为FASTA格式保存;
2、进入EXPASY网站 pasy.ch/tools/ 使用有关软件进行蛋白质序列分析和结构预测。
(1)使用DNA—Protein中的translate将已知的leptin的mRNA序列翻译为蛋白质序列
(2)选择Protparam程序对蛋白质序列进行分子质量、氨基酸组成和等电点等基本性质分析:
(3)蛋白质的同源性搜索分析
1)在EXPASY下使用BlastP对选择蛋白质序列进行同源性搜索
2)在EXPASY下使用BlastX程序选择mRNA序列进行翻译后在蛋白质数据库进行同源性搜索
(4)在Pattern and profile searches中选择interPro Scan进行结构域或motif搜索以及有关结构域的结构分析
(5)在post-translational modification prediction 选择signalP对蛋白质序列进行信号肽预测分析
>gi|46854679|gb|AAH69452.1| Leptin [Homo sapiens]
MHWGTLCGFLWLWPYLFYVQAVPIQKVQDDTKTLIKTIVTRINDISHTQSVSSKQKVTGLDFIPGLHPIL
TLSKMDQTLAVYQQILTSMPSRNVIQISNDLENLRDLLHVLAFSKSCHLPWASGLETLDSLGGVLEASGY
STEVVALSRLQGSLQDMLWQLDLSPGC
>gi|4557715|ref|NP_000221.1| leptin precursor [Homo sapiens]
MHWGTLCGFLWLWPYLFYVQAVPIQKVQDDTKTLIKTIVTRINDISHTQSVSSKQKVTGLDFIPGLHPIL
TLSKMDQTLAVYQQILTSMPSRNVIQISNDLENLRDLLHVLAFSKSCHLPWASGLETLDSLGGVLEASGY
STEVVALSRLQGSLQDMLWQLDLSPGC
>gi|169790920|ref|NM_000230.2| Homo sapiens leptin (LEP), mRNA
GTAGGAATCGCAGCGCCAGCGGTTGCAAGGCCCAAGAAGCCCATCCTGGGAAGGAAAATGCATTGGGGAA
CCCTGTGCGGATTCTTGTGGCTTTGGCCCTATCTTTTCTATGTCCAAGCTGTGCCCATCCAAAAAGTCCA
AGATGACACCAAAACCCTCATCAAGACAATTGTCACCAGGATCAATGACATTTCACACACGCAGTCAGTC
TCCTCCAAACAGAAAGTCACCGGTTTGGACTTCATTCCTGGGCTCCACCCCATCCTGACCTTATCCAAGA
TGGACCAGACACTGGCAGTCTACCAACAGATCCTCACCAGTATGCCTTCCAGAAACGTGATCCAAATATC
CAACGACCTGGAGAACCTCCGGGATCTTCTTCACGTGCTGGCCTTCTCTAAGAGCTGCCACTTGCCCTGG
GCCAGTGGCCTGGAGACCTTGGACAGCCTGGGGGGTGTCCTGGAAGCTTCAGGCTACTCCACAGAGGTGG
TGGCCCTGAGCAGGCTGCAGGGGTCTCTGCAGGACATGCTGTGGCAGCTGGACCTCAGCCCTGGGTGCTG
AGGCCTTGAAGGTCACTCTTCCTGCAAGGACTACGTTAAGGGAAGGAACTCTGGCTTCCAGGTATCTCCA
GGATTGAAGAGCATTGCATGGACACCCCTTATCCAGGACTCTGTCAATTTCCCTGACTCCTCTAAGCCAC
TCTTCCAAAGGCATAAGACCCTAAGCCTCCTTTTGCTTGAAACCAAAGATATATACACAGGATCCTATTC
TCACCAGGAAGGGGGTCCACCCAGCAAAGAGTGGGCTGCATCTGGGATTCCCACCAAGGTCTTCAGCCAT
CAACAAGAGTTGTCTTGTCCCCTCTTGACCCATCTCCCCCTCACTGAATGCCTCAATGTGACCAGGGGTG
ATTTCAGAGAGGGCAGAGGGGTAGGCAGAGCCTTTGGATGACCAGAACAAGGTTCCCTCTGAGAATTCCA
AGGAGTTCCATGAAGACCACATCCACACACGCAGGAACTCCCAGCAACACAAGCTGGAAGCACATGTTTA
TTTATTCTGCATTTTATTCTGGATGGATTTGAAGCAAAGCACCAGCTTCTCCAGGCTCTTTGGGGTCAGC
CAGGGCCAGGGGTCTCCCTGGAGTGCAGTTTCCAATCCCATAGATGGGTCTGGCTGAGCTGAACCCATTT
TGAGTGACTCGAGGGTTGGGTTCATCTGAGCAAGAGCTGGCAAAGGTGGCTCTCCAGTTAGTTCTCTCGT
AACTGGTTTCATTTCTACTGTGACTGATGTTACATCACAGTGTTTGCAATGGTGTTGCCCTGAGTGGATC
TCCAAGGACCAGGTTATTTTAAAAAGATTTGTTTTGTCAAGTGTCATATGTAGGTGTCTGCACCCAGGGG
TGGGGAATGTTTGGGCAGAAGGGAGAAGGATCTAGAATGTGTTTTCTGAATAACATTTGTGTGGTGGGTT
CTTTGGAAGGAGTGAGATCATTTTCTTATCTTCTGCAATTGCTTAGGATGTTTTTCATGAAAATAGCTCT
TTCAGGGGGGTTGTGAGGCCTGGCCAGGCACCCCCTGGAGAGAAGTTTCTGGCCCTGGCTGACCCCAAAG
AGCCTGGAGAAGCTGATGCTTTGCTTCAAATCCATCCAGAATAAAACGCAAAGGGCTGAAAGCCATTTGT
TGGGGCAGTGGTAAGCTCTGGCTTTCTCCGACTGCTAGGGAGTGGTCTTTCCTATCATGGAGTGACGGTC
CCACACTGGTGACTGCGATCTTCAGAGCAGGGGTCCTTGGTGTGACCCTCTGAATGGTCCAGGGTTGATC
ACACTCTGGGTTTATTACATGGCAGTGTTCCTATTTGGGGCTTGCATGCCAAATTGTAGTTCTTGTCTGA
TTGGCTCACCCAAGCAAGGCCAAAATTACCAAAAATCTTGGGGGGTTTTTACTCCAGTGGTGAAGAAAAC
TCCTTTAGCAGGTGGTCCTGAGACCTGACAAGCACTGCTAGGCGAGTGCCAGGACTCCCCAGGCCAGGCC
ACCAGGATGGCCCTTCCCACTGGAGGTCACATTCAGGAAGATGAAAGAGGAGGTTTGGGGTCTGCCACCA
TCCTGCTGCTGTGTTTTTGCTATCACACAGTGGGTGGTGGATCTGTCCAAGGAAACTTGAATCAAAGCAG
TTAACTTTAAGACTGAGCACCTGCTTCATGCTCAGCCCTGACTGGTGCTATAGGCTGGAGAAGCTCACCC
AATAAACATTAAGATTGAGGCCTGCCCTCAGGGATCTTGCATTCCCAGTGGTCAAACCGCACTCACCCAT
GTGCCAAGGTGGGGTATTTACCACAGCAGCTGAACAGCCAAATGCATGGTGCAGTTGACAGCAGGTGGGA