博客
关于我
Nearth---全文检索技术(luncen)/002(全文检索的概念)
阅读量:185 次
发布时间:2019-02-28

本文共 396 字,大约阅读时间需要 1 分钟。

什么是全文检索?

数据的分类:

1,结构化数据

格式固定,长度固定,数据类型固定

eg:数据库中的数据

2,非结构化数据

word文档,pdf文档,邮件,html,txt

格式不固定,长度不固定,数据类型不固定。

数据的查询:

1,结构化数据的查询

SQL语句,查询结构化数据的方法。简单,速度快。

2,非结构化数据的查询

从文本文件中找出包含spring单词的文件

a,自测

b,使用程序把文档读取到内存中,然后匹配字符串,顺序扫描。

c,把非结构化数据转化为结构化文档

---先根据空格进行字符串的拆分,得到一个单词列表,基于单词列表创建一个索引。

然后查询索引,根据单词和文档的对应关系找到文档列表,这个过程叫全文检索。

--索引:一个为了提高查询速度,创建某种数据结构的集合。

3,全文检索:

先创建索引,然后查询索引的过程叫做全文检索。

索引一次创建多次使用,表现为每次查询速度快。

转载地址:http://qrmn.baihongyu.com/

你可能感兴趣的文章
Mysql8.0注意url变更写法
查看>>
Mysql8.0的特性
查看>>
MySQL8修改密码报错ERROR 1819 (HY000): Your password does not satisfy the current policy requirements
查看>>
MySQL8修改密码的方法
查看>>
Mysql8在Centos上安装后忘记root密码如何重新设置
查看>>
Mysql8在Windows上离线安装时忘记root密码
查看>>
MySQL8找不到my.ini配置文件以及报sql_mode=only_full_group_by解决方案
查看>>
mysql8的安装与卸载
查看>>
MySQL8,体验不一样的安装方式!
查看>>
MySQL: Host '127.0.0.1' is not allowed to connect to this MySQL server
查看>>
Mysql: 对换(替换)两条记录的同一个字段值
查看>>
mysql:Can‘t connect to local MySQL server through socket ‘/var/run/mysqld/mysqld.sock‘解决方法
查看>>
MYSQL:基础——3N范式的表结构设计
查看>>
MYSQL:基础——触发器
查看>>
Mysql:连接报错“closing inbound before receiving peer‘s close_notify”
查看>>
mysqlbinlog报错unknown variable ‘default-character-set=utf8mb4‘
查看>>
mysqldump 参数--lock-tables浅析
查看>>
mysqldump 导出中文乱码
查看>>
mysqldump 导出数据库中每张表的前n条
查看>>
mysqldump: Got error: 1044: Access denied for user ‘xx’@’xx’ to database ‘xx’ when using LOCK TABLES
查看>>