博客
关于我
Nearth---全文检索技术(luncen)/002(全文检索的概念)
阅读量:185 次
发布时间:2019-02-28

本文共 396 字,大约阅读时间需要 1 分钟。

什么是全文检索?

数据的分类:

1,结构化数据

格式固定,长度固定,数据类型固定

eg:数据库中的数据

2,非结构化数据

word文档,pdf文档,邮件,html,txt

格式不固定,长度不固定,数据类型不固定。

数据的查询:

1,结构化数据的查询

SQL语句,查询结构化数据的方法。简单,速度快。

2,非结构化数据的查询

从文本文件中找出包含spring单词的文件

a,自测

b,使用程序把文档读取到内存中,然后匹配字符串,顺序扫描。

c,把非结构化数据转化为结构化文档

---先根据空格进行字符串的拆分,得到一个单词列表,基于单词列表创建一个索引。

然后查询索引,根据单词和文档的对应关系找到文档列表,这个过程叫全文检索。

--索引:一个为了提高查询速度,创建某种数据结构的集合。

3,全文检索:

先创建索引,然后查询索引的过程叫做全文检索。

索引一次创建多次使用,表现为每次查询速度快。

转载地址:http://qrmn.baihongyu.com/

你可能感兴趣的文章
Nginx实现反向代理负载均衡
查看>>
nginx实现负载均衡
查看>>
nginx开机启动脚本
查看>>
nginx异常:the “ssl“ parameter requires ngx_http_ssl_module in /usr/local/nginx/conf
查看>>
nginx总结及使用Docker创建nginx教程
查看>>
nginx报错:the “ssl“ parameter requires ngx_http_ssl_module in /usr/local/nginx/conf/nginx.conf:128
查看>>
nginx报错:the “ssl“ parameter requires ngx_http_ssl_module in usrlocalnginxconfnginx.conf128
查看>>
nginx日志分割并定期删除
查看>>
Nginx日志分析系统---ElasticStack(ELK)工作笔记001
查看>>
Nginx映射本地json文件,配置解决浏览器跨域问题,提供前端get请求模拟数据
查看>>
nginx最最最详细教程来了
查看>>
Nginx服务器---正向代理
查看>>
Nginx服务器上安装SSL证书
查看>>
Nginx服务器的安装
查看>>
Nginx模块 ngx_http_limit_conn_module 限制连接数
查看>>
nginx添加模块与https支持
查看>>
Nginx用户认证
查看>>
Nginx的location匹配规则的关键问题详解
查看>>
Nginx的Rewrite正则表达式,匹配非某单词
查看>>
Nginx的使用总结(一)
查看>>