从Lucene到Elasticsearch 全文检索实战pdf

图书网 2021年1月23日20:23:291 1.8K

从Lucene到Elasticsearch 全文检索实战 作者:姚攀

从Lucene到Elasticsearch 全文检索实战 出版社:清华大学出版社

从Lucene到Elasticsearch 全文检索实战 内容简介

《从Lucene到Elasticsearch:全文检索实战》循序渐进介绍了信息检索、布尔检索、向量空间模型、tf-idf、BM25排序算法、Lucene架构、Lucene创建索引、Lucene查询、Lucene项目实战、Elasticsearch安装与配置、Elasticsearch插件安装、REST API数据操作、映射与模板、索引别名、Elasticsearch基本和高级搜索、Elasticsearch同步数据库、Elasticsearch集群管理、项目实战等内容。

阅读《从Lucene到Elasticsearch:全文检索实战》,读者能够掌握信息检索的核心概念,应用Lucene库处理全文检索业务,掌握Elasticsearch分布式搜索引擎的使用方法与技巧。

《从Lucene到Elasticsearch:全文检索实战》基于Lucene 6.0和Elasticsearch 5.4.0进行讲解,技术先进,示例丰富

适合想学习信息检索技术的初学者和相关专业的大学生、研究生学习,也很适合大数据及云计算平台构建人员以及有一定基础的IT开发人员使用。

从Lucene到Elasticsearch 全文检索实战 目录

第1章 信息检索模型

1.1 信息检索概述

1.1.1 信息过载

1.1.2 信息检索定义

1.1.3 信息检索常用术语

1.1.4 信息检索系统

1.2 分词算法

1.2.1 分词算法概述

1.2.2 词典匹配分词法

1.2.3 语义理解分词法

1.2.4 词频统计分词法

1.3 倒排索引

1.4 布尔检索模型

1.5 tf-idf权重计算

1.6 向量空间模型

1.7 概率检索模型

1.7.1 贝叶斯决策理论

1.7.2 二值独立模型

1.7.3 Okapi BM25模型

1.7.4 BM25F模型

1.8 本章小结

第2章 Lucene开发入门

2.1 Lucene概述

2.1.1 Lucene简介

2.1.2 Lucene特点

2.1.3 Lucene架构

2.2 Lucene开发准备

2.2.1 下载Lucene文件库

2.2.2 工程中引入Lucene

2.2.3 下载Luke

2.2.4 下载IK分词工具

2.2.5 工程搭建

2.3 Lucene分词详解

2.3.1 Lucene分词系统

2.3.2 分词器测试

2.3.3 IK分词器配置

2.3.4 中文分词器对比

2.3.5 扩展停用词词典

2.3.6 扩展自定义词典

2.4 Lucene索引详解

2.4.1 Lucene字段类型

2.4.2 索引文档示例

2.4.3 Luke中查看索引

2.4.4 索引的删除

2.4.5 索引的更新

2.5 Lucene查询详解

2.5.1 搜索入门

2.5.2 多域搜索(MultiFieldQueryParser)

2.5.3 词项搜索(TermQuery)

2.5.4 布尔搜索(BooleanQuery)

2.5.5 范围搜索(RangeQuery)

2.5.6 前缀搜索(PrefixQuery)

2.5.7 多关键字搜索(PhraseQuery)

2.5.8 模糊搜索(FuzzyQuery)

2.5.9 通配符搜索(WildcardQuery)

2.6 Lucene查询高亮

2.7 Lucene新闻高频词提取

2.7.1 问题提出

2.7.2 需求分析

2.7.3 编程实现

2.8 本章小结

第3章 Lucene文件检索项目实战

3.1 需求分析

3.2 架构设计

3.3 文本内容抽取

3.3.1 Tika简介

3.3.2 Tika下载

3.3.3 搭建工程

3.3.4 内容抽取

3.3.5 自动解析

3.4 工程搭建

3.5 索引文档

3.6 查询界面

3.7 文件检索

3.8 结果展示

3.9 本章小结

第4章 从Lucene到Elasticsearch

4.1 Elasticsearch概述

4.1.1 诞生过程

4.1.2 流行度分析

4.1.3 架构解读

4.1.4 优点

4.1.5 应用场景

4.1.6 核心概念

4.1.7 对比RDMS

4.1.8 文档结构

4.2 安装Elasticsearch

4.2.1 安装Java

4.2.2 下载Elasticsearch

4.2.3 启动Elasticsearch

4.2.4 后台运行Elasticsearch

4.2.5 关闭Elasticsearch

4.2.6 基本配置

4.3 中文分词器配置

4.3.1 IK分词器安装

4.3.2 扩展本地词库

4.3.3 配置远程词库

4.4 Head插件使用指南

4.4.1 Head插件的安装

4.4.2 Head插件的使用

4.5 REST命令

4.5.1 CURL工具

4.5.2 Kibana Dev Tools

4.6 本章小结

第5章 Elasticsearch集群入门

5.1 索引管理

5.1.1 新建索引

5.1.2 更新副本

5.1.3 读写权限

5.1.4 查看索引

5.1.5 删除索引

5.1.6 索引的打开与关闭

5.1.7 复制索引

5.1.8 收缩索引

5.1.9 索引别名

5.2 文档管理

5.2.1 新建文档

5.2.2 获取文档

5.2.3 更新文档

5.2.4 查询更新

5.2.5 删除文档

5.2.6 查询删除

5.2.7 批量操作

5.2.8 版本控制

5.2.9 路由机制

5.3 映射详解

5.3.1 映射分类

5.3.2 动态映射

5.3.3 日期检测

5.3.4 静态映射

5.3.5 字段类型

5.3.6 元字段

5.3.7 映射参数

5.3.8 映射模板

5.4 本章小结

第6章 Elasticsearch搜索详解

6.1 搜索机制

6.2 全文查询

6.2.1 match query

6.2.2 match_phrase query

6.2.3 match_phrase_prefix query

6.2.4 multi_match query

6.2.5 common_terms query

6.2.6 query_string query

6.2.7 simple_query_string

6.3 词项查询

6.3.1 term query

6.3.2 terms query

6.3.3 range query

6.3.4 exists query

6.3.5 prefix query

6.3.6 wildcard query

6.3.7 regexp query

6.3.8 fuzzy query

6.3.9 type query

6.3.10 ids query

6.4 复合查询

6.4.1 constant_score query

6.4.2 bool query

6.4.3 dis_max query

6.4.4 function_score query

6.4.5 boosting query

6.4.6 indices query

6.5 嵌套查询

6.5.1 nested query

6.5.2 has_child query

6.5.3 has_parent query

6.6 位置查询

6.6.1 geo_distance query

6.6.2 geo_bounding_box query

6.6.3 geo_polygon query

6.6.4 geo_shape query

6.7 特殊查询

6.7.1 more_like_this query

6.7.2 script query

6.7.3 percolate query

6.8 搜索高亮

6.8.1 自定义高亮片段

6.8.2 多字段高亮

6.8.3 高亮性能分析

6.9 搜索排序

6.9.1 默认排序

6.9.2 多字段排序

6.9.3 分片影响评分

6.10 本章小结

第7章 聚合分析

7.1 指标聚合

7.1.1 Max Aggregation

7.1.2 Min Aggregation

7.1.3 Avg Aggregation

7.1.4 Sum Aggregation

7.1.5 Cardinality Aggregation

7.1.6 Stats Aggregation

7.1.7 Extended Stats Aggregation

7.1.8 Percentiles Aggregation

7.1.9 Value Count Aggregation

7.2 桶聚合

7.2.1 Terms Aggregation

7.2.2 Filter Aggregation

7.2.3 Filters Aggregation

7.2.4 Range Aggregation

7.2.5 Date Range Aggregation

7.2.6 Date Histogram Aggregation

7.2.7 Missing Aggregation

7.2.8 Children Aggregation

7.2.9 Geo Distance Aggregation

7.2.10 IP Range Aggregation

7.3 本章小结

第8章 Elasticsearch Java API

8.1 Java API简介

8.2 Maven依赖

8.3 依赖冲突

8.4 连接到集群

8.4.1 传输机连接

8.4.2 节点连接

8.4.3 代码实现

8.5 索引管理

8.6 文档管理

8.6.1 新建文档

8.6.2 获取文档

8.6.3 删除文档

8.6.4 更新文档

8.6.5 查询删除

8.6.6 批量获取

8.6.7 批量操作

8.7 搜索详解

8.7.1 全文查询

8.7.2 词项查询

8.7.3 复合查询

8.7.4 嵌套查询

8.7.5 位置查询

8.7.6 特殊查询

8.8 聚合分析

8.8.1 指标聚合

8.8.2 桶聚合

8.9 集群管理

8.10 本章小结

第9章 集群管理

9.1 集群规划

9.2 索引规划

9.3 分布式集群

9.4 Cat API

9.4.1 cat aliases

9.4.2 cat allocation

9.4.3 cat count

9.4.4 cat fielddata

9.4.5 cat health

9.4.6 cat indices

9.4.7 cat master

9.4.8 cat nodeattrs

9.4.9 cat nodes

9.4.10 cat pending tasks

9.4.11 cat plugins

9.4.12 cat recovery

9.4.13 cat repositories

9.4.14 cat thread pool

9.4.15 cat shards

9.4.16 cat segments

9.4.17 cat templates

9.5 Cluster API

9.5.1 Cluster Health

9.5.2 Cluster State

9.5.3 Cluster Stats

9.5.4 Pending Cluster Tasks

9.5.5 Cluster Reroute

9.5.6 Cluster Update Settings

9.5.7 Nodes Stats

9.5.8 Nodes Info

9.5.9 Task Management API

9.5.10 Cluster Allocation Explain API

9.6 监控插件

9.7 本章小结

第10章 新闻搜索项目实战

10.1 需求分析

10.2 数据准备

10.3 数据导入

10.4 查询界面

10.5 搜索新闻

10.6 结果展示

10.7 本章小结

第11章 Elasticsearch For Hadoop

11.1 Hadoop基础

11.1.1 SSH配置

11.1.2 Hadoop下载

11.1.3 Hadoop单机模式

11.1.4 Hadoop伪分布式模式

11.1.5 HDFS常用操作

11.2 ES-Hadoop安装

11.2.1 压缩包下载

11.2.2 Maven依赖

11.3 从HDFS到Elasticsearch

11.3.1 测试数据

11.3.2 编写程序

11.3.3 代码分析

11.4 从Elasticsearch到HDFS

11.4.1 读取索引到HDFS

11.4.2 查询Elasticsearch写入HDFS

11.5 本章小结

参考文献

图书网:从Lucene到Elasticsearch 全文检索实战pdf

继续阅读

→→→→→→→→→→→→→→→→→→→→查找获取

证券/股票

破解牛股密码pdf

破解牛股密码 作者:任平安 破解牛股密码 出版社:清华大学出版社 破解牛股密码 内容简介 本书通过对市场中个股的描述,总结出牛股上涨的内在因素和外在图形特征,通过对牛股内外在特征的详细讲解,帮助投资者...
程序设计

C++捷径教程 第3版pdf

C++捷径教程 第3版 作者:(美) Herbert Schildt C++捷径教程 第3版 出版社:清华大学出版社 C++捷径教程 第3版 内容简介 本书是程序设计大师Herbert Schildt...
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

评论:1   其中:访客  1   博主  0
    • fan2k
      fan2k 2

      正在学习全文搜索相关内容,希望这本书能有所帮助。