专利名称:超长基因序列的相似性快速比对方法及系统专利类型:发明专利 发明人:刘卫国,秦梓恒,殷泽坤,徐晓明,刘美洋
申请号:CN202010218462.6
申请日:20200325
公开号:CN111445952A
公开日:
20200724
专利内容由知识产权出版社提供
摘要:本公开公开了超长基因序列的相似性快速比对方法及系统,获取超长参考基因序列;对超长参考基因序列构建增强型系数后缀数组ESSA;获取超长待查询基因序列;对超长待查询基因序列构建增强型系数后缀数组ESSA;将超长参考基因序列的增强型系数后缀数组ESSA,与超长待查询基因序列的增强型系数后缀数组ESSA进行匹配,匹配出重叠部分MEM;对二者的重叠部分MEM进行去冗余处理,得到最大唯一匹配部分MUM;对超长参考基因序列的MUM和超长待查询基因序列的最大唯一匹配部分MUM进行相似度计算,将相似度大于设定阈值的超长参考基因序列对应的基因类型作为超长待查询基因序列对应的基因类型。
申请人:山东大学
地址:250101 山东省济南市高新区舜华路中段
国籍:CN
代理机构:济南圣达知识产权代理有限公司
代理人:黄海丽