发明人:C·W·拉曼纳,M·H·甘地,J·E·布鲁尔申请号:CN201110372972.X
申请日:20111109
公开号:CN102541995A
公开日:
20120704
专利内容由知识产权出版社提供
摘要:在此所述的实施例旨在对索引矩阵中的散列值的序列进行索引和查询。计算机系统访问文档以从该文档中提取文本部分。计算机系统将散列算法应用于所提取的文本。提取的文本的散列值形成散列值的代表序列。计算机系统还将散列值的序列的每个散列值插入到索引矩阵中,该索引矩阵被配置为存储多个不同的散列值序列计算机系统还查询索引矩阵以基于选中的散列值序列中有多少散列值与所述存储的散列值序列的散列值相重叠来确定所述多个散列值序列与选中的散列值序列有多相似。 申请人:微软公司
地址:美国华盛顿州
国籍:US
代理机构:上海专利商标事务所有限公司
代理人:顾嘉运