全⽂检索概念和应⽤场景
⼀、什么是全⽂检索
codcr
格式固定、长度固定、数据类型固定。
例如数据库中的数据
2)⾮结构化数据
word⽂档、pdf⽂档、邮件、html、txt
格式不固定、长度不固定、数据类型不固定。
1)结构化数据的查询
SQL语句,查询结构化数据的⽅法。简单、速度快。呼和浩特教育公共服务平台
2)⾮结构化数据的查询
从⽂本⽂件中出包含spring单词的⽂件。
1、⽬测
2、使⽤程序吧⽂档读取到内存中,然后匹配字符串。顺序扫描。
3、把⾮结构化数据变成结构化数据
先跟根据空格进⾏字符串拆分,得到⼀个单词列表,基于单词列表创建⼀个索引。然后查询索引,根据单词和⽂档的对应关系到⽂档列表。这个过程叫做全⽂检索。
索引:⼀个为了提⾼查询速度,创建某种数据结构的集合。
3、全⽂检索
先创建索引然后查询索引的过程叫做全⽂检索。
偏二甲肼索引⼀次创建可以多次使⽤。表现为每次查询速度很快。
⼆、全⽂检索的应⽤场景
百度、360搜索、⾕歌、搜狗
2、站内搜索
论坛搜索、微博、⽂章搜索调度指挥
振镜
3、电商搜索
帝京景物略淘宝搜索、京东搜索
4、只要是有搜索的地⽅就可以使⽤全⽂检索技术。