搜索引擎的定义与分类

搜索引擎的定义与分类
搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。
叶村叠罗汉搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。比如百度就是一款比较流行的搜索引擎。
2-溴芴搜索引擎作用:
(1)爬虫:从互联网爬取原始网页数据,存储于文档知识库服务器。
rbw(2)文档知识库服务器:存储原始网页数据,通常是分布式Key-Value数据库,能根据URL/UID快速获取网页内容。  矿石品位
(3)索引:读取原始网页数据,解析网页,抽取有用字段,生成索引数据。索引数据的生成方式通常是增量的,分块/分片的,并会进行索引合并、优化和删除。生成的索引数据通常包括:字典数据、倒排表、正排表、文档属性等。生成的索引存储于索引服务器。
盈余管理
泰州市大浦中心小学(4)索引服务器:存储索引数据,主要是倒排表,通常是分块、分片存储,并支持增量更新和删除。数据内容量非常大时,还根据类别、主题、时间、网页质量划分数据分区和分布,更好地服务在线查询。 
(5)检索:读取倒排表索引,响应前端查询请求,返回相关文档列表数据。

本文发布于:2024-09-23 09:34:14,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/479694.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   搜索引擎   网页
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议