全文检索概念和应用场景

全⽂检索概念和应⽤场景
⼀、什么是全⽂检索
1、数据的分类
1)结构化数据
codcr
格式固定、长度固定、数据类型固定。
例如数据库中的数据
2)⾮结构化数据
word⽂档、pdf⽂档、邮件、html、txt
格式不固定、长度不固定、数据类型不固定。
2、数据的查询
1)结构化数据的查询
SQL语句,查询结构化数据的⽅法。简单、速度快。呼和浩特教育公共服务平台
2)⾮结构化数据的查询
从⽂本⽂件中出包含spring单词的⽂件。
1、⽬测
2、使⽤程序吧⽂档读取到内存中,然后匹配字符串。顺序扫描。
3、把⾮结构化数据变成结构化数据
先跟根据空格进⾏字符串拆分,得到⼀个单词列表,基于单词列表创建⼀个索引。然后查询索引,根据单词和⽂档的对应关系到⽂档列表。这个过程叫做全⽂检索。
索引:⼀个为了提⾼查询速度,创建某种数据结构的集合。
3、全⽂检索
先创建索引然后查询索引的过程叫做全⽂检索。
偏二甲肼索引⼀次创建可以多次使⽤。表现为每次查询速度很快。
⼆、全⽂检索的应⽤场景
1、搜索引擎
百度、360搜索、⾕歌、搜狗
2、站内搜索
论坛搜索、微博、⽂章搜索调度指挥
振镜
3、电商搜索
帝京景物略淘宝搜索、京东搜索
4、只要是有搜索的地⽅就可以使⽤全⽂检索技术。

本文发布于:2024-09-20 20:35:02,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/479734.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   搜索   查询   结构化
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议