SEM的分类及原理

SEM的分类及原理
搜索引擎包含的范围很广。通过互联网检索获得网站网页资料,并且能够建立数据库的系统,都可以把它叫做搜索引擎。按照工作原理的不同,搜索引擎可分为两个基本类别:全文搜索引擎(Full Text Search Engine)和分类目录(Directory)
  1.全文搜索引擎
  全文搜索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查,并将查的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。
  搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(不同的搜索网站间隔的时间也不同),搜索引擎的自动程序会在司礼监web上进行检索收集网页、图片、视频等内容,并建立索引数据库,如google搜索引擎通过自动程序塑化“机器人进行检索,而百度的自动检索程序名为蜘蛛也具备同样的功能。另一种是主动提交网站搜索,即网站所有者向搜索
引擎提交网址,搜索引擎会在一定时间内,向你的网站派出蜘蛛程序,扫描你的网站并将有关信息存入数据库,以备用户查询。
  当用户输入关键词查信息时,搜索引擎会在数据库中进行搜寻,根据网页中关键词的匹配程度,出现的位置或频次,链接质量等列出各网页的相关度并进行排名,顺序的将这些网页链接返回给用户。
  2.科学幻想之父目录索引
  目录索引,指按照所划分好的目录,将网站分门别类地进行存放在,以方便用户的查。因此,用户在检索信息时既可选择关键词搜索,也可按分类目录逐层查。
  目录索引与全文搜索引擎相比,有许多不同之处。
  首先,全文搜索引擎利用自动程序检索,而目录索引则以手工操作为主自动检索为辅。目录索引网站在用户提交网址后,由工作人员根据公司自定的评判标准对用户网站进行评价定级,用以决定是否接纳该网站。
  其次,全文搜索引擎收录网站时,主要依据的是相关的法律法规和政策,只要网站本身没有违反有关规则,一般都可以成功登录;而目录索引对网站的要求较高,还应该符合目录索引的行业类别要求。此外,全文搜索引擎不用考虑网站的分类问题,而目录索引时则有必要将网站放在一个最合适的目录之下,一般该目录是按照行业或产品的类型进行划分。
  最后,全文搜索引擎中数据库的所有信息都是定期从用户网站中自动收集的,所以对于网站所有者来说,拥有更多的自主权风钻工;视觉点胶系统目录索引一般要求申请者手工填写网站信息,限制条件也较多,如果提交的网站目录和网站信息不合适,工作人员可以随时对其进行调整。
  目前,全文搜索引擎与目录索引开始逐渐相互融合渗透。全文搜索引擎现在也提供目录搜索,为网站用户提供多种选择,并以此增加引擎网站的收益。而一些目录索引则通过与知名的全文搜索引擎如百度、红兵打针Google等合作扩大搜索范围。

本文发布于:2024-09-23 13:25:34,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/479789.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

上一篇:solr query语法
下一篇:lucene query语法
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议