图书介绍

Solr 实战PDF|Epub|txt|kindle电子书版本网盘下载

Solr 实战
  • (美)崔·格兰杰(Trey Grainger),提摩斯·波特(Timothy Potter)著;范炜译 著
  • 出版社: 北京:电子工业出版社
  • ISBN:9787121311659
  • 出版时间:2017
  • 标注页数:598页
  • 文件大小:105MB
  • 文件页数:628页
  • 主题词:搜索引擎-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

Solr 实战PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1部分 初识Solr1

1 Solr入门2

1.1 为什么需要搜索引擎3

1.1.1 管理以文本为中心的数据3

1.1.2 常见的搜索引擎用例6

1.2 Solr是什么8

1.2.1 信息检索引擎9

1.2.2 灵活的模式管理11

1.2.3 Java Web应用12

1.2.4 一台服务器上的多个索引13

1.2.5 可扩展性(插件)13

1.2.6 可伸缩性14

1.2.7 容错性15

1.3 选择Solr的理由15

1.3.1 面向软件架构师的Solr15

1.3.2 面向系统管理员的Solr16

1.3.3 面向CEO的Solr17

1.4 功能概述17

1.4.1 用户体验功能17

1.4.2 数据建模功能19

1.4.3 Solr4的新功能20

1.5 本章小结22

2 Solr上手23

2.1 开始上手24

2.1.1 Solr的安装24

2.1.2 启动Solr的示例服务器25

2.1.3 了解Solr主目录29

2.1.4 对示例文档进行索引30

2.2 一切都关乎搜索31

2.2.1 Solr查询表单详解31

2.2.2 Solr的搜索返回机制34

2.2.3 排名检索36

2.2.4 分页和排序36

2.2.5 扩展的搜索功能38

2.3 Solr管理控制台一览40

2.4 根据需求改造搜索示例服务器42

2.5 本章小结43

3 Solr基础理论45

3.1 搜索、匹配与找寻内容46

3.1.1 何为文档46

3.1.2 基本搜索问题47

3.1.3 倒排索引50

3.1.4 词项、短语与布尔逻辑51

3.1.5 找到文档集53

3.1.6 短语查询与术语位置55

3.1.7 模糊匹配57

3.1.8 快速小结61

3.2 相关度61

3.2.1 默认相似度62

3.2.2 词项频次63

3.2.3 反向文档频次64

3.2.4 词项权重65

3.2.5 规范化因子66

3.3 查准率与查全率67

3.3.1 查准率67

3.3.2 查全率68

3.3.3 达到平衡69

3.4 搜索的规模化70

3.4.1 非规范化文档70

3.4.2 分布式搜索72

3.4.3 集群vs.服务器73

3.4.4 Solr的局限74

3.5 本章小结75

4 配置Solr77

4.1 solrconfig.xml文件概览80

4.1.1 常见的XML数据结构和数据类型元素82

4.1.2 配置文件更新的应用82

4.1.3 Solr的其他配置83

4.2 查询请求处理85

4.2.1 请求处理简介86

4.2.2 搜索处理器88

4.2.3 Solritas的browse请求处理器示例90

4.2.4 利用搜索组件扩展查询处理94

4.3 管理搜索器98

4.3.1 新建搜索器99

4.3.2 新搜索器预热100

4.4 缓存管理103

4.4.1 缓存原理103

4.4.2 过滤器缓存105

4.4.3 查询结果缓存108

4.4.4 文档缓存110

4.4.5 字段值缓存110

4.5 其他配置选项110

4.6 本章小结111

5 创建索引112

5.1 微博搜索应用示例113

5.1.1 面向搜索的内容表示113

5.1.2 Solr索引构建概览115

5.2 设计自己的schema117

5.2.1 文档粒度117

5.2.3 索引字段119

5.2.4 存储字段119

5.2.5 schema.xml概览120

5.3 在schema.xml中定义字段121

5.3.1 必备字段属性122

5.3.2 多值字段123

5.3.3 动态字段124

5.3.4 复制字段127

5.3.5 唯一键字段129

5.4 结构化非文本字段类型129

5.4.1 字符串字段130

5.4.2 日期字段131

5.4.3 数值字段133

5.4.4 高级字段类型属性134

5.5 发送文档到Solr进行索引137

5.5.1 使用XML或JSON进行文档索引137

5.5.2 使用SolrJ客户端库添加文档索引140

5.5.3 向Solr导入文档的其他工具142

5.6 更新处理器143

5.6.1 将文档提交到索引145

5.6.2 事务日志146

5.6.3 原子更新148

5.7 索引管理151

5.7.1 索引存储151

5.7.2 索引片段合并154

5.8 本章小结156

6 文本分析157

6.1 微博文本分析158

6.2 基础文本分析161

6.2.1 分析器163

6.2.2 分词器163

6.2.3 分词过滤器164

6.2.4 StandardTokenizer164

6.2.5 使用StopFilterFactory移除停用词165

6.2.6 使用LowerCaseFilterFactory对词项进行小写转换166

6.2.7 通过Solr分析表单进行文本分析测试167

6.3 为微博文本自定义一个字段类型169

6.3.1 使用PatternReplaceCharFilterFactory折叠重复的字母172

6.3.2 保留主题标签、提及符号和连字符词项173

6.3.3 使用ASCIIFoldingFilterFactory移除变音符号177

6.3.4 使用KStemFilterFactory提取词干177

6.3.5 在查询阶段使用SynonymFilterFactory加入同义词178

6.3.6 把过滤器组合在一起179

6.4 高级文本分析182

6.4.1 高级字段属性182

6.4.2 各语种文本分析183

6.4.3 使用Solr插件扩展文本分析185

6.5 本章小结188

第2部分 Solr的核心功能191

7 执行查询和处理搜索结果192

7.1 Solr请求详解193

7.1.1 请求处理器193

7.1.2 搜索组件197

7.1.3 查询解析器200

7.2 查询解析器的使用201

7.2.1 指定查询解析器201

7.2.2 局部参数201

7.3 查询和过滤器204

7.3.1 fq和q参数204

7.3.2 处理代价过高的过滤器207

7.4 默认查询分析器(Lucene查询解析器)209

7.4.1 Lucene查询解析器语法209

7.5 处理用户查询(eDisMax查询解析器)215

7.5.1 eDisMax查询解析器概述216

7.5.2 eDisMax查询参数216

7.5.3 搜索多个字段216

7.5.4 查询与短语的权重调整217

7.5.5 字段别名219

7.5.6 可访问字段221

7.5.7 最小匹配221

7.5.8 eDisMax的优缺点223

7.6 其他有用的查询解析器225

7.6.1 字段查询解析器225

7.6.2 词项查询解析器和原始查询解析器225

7.6.3 函数查询解析器和函数区间查询解析器226

7.6.4 嵌套查询和嵌套查询解析器226

7.6.5 调整权重查询解析器227

7.6.6 前缀查询解析器228

7.6.7 空间查询解析器228

7.6.8 连接查询解析器228

7.6.9 分支查询解析器229

7.6.10 外围查询解析器229

7.6.11 最大得分查询解析器230

7.6.12 折叠查询解析器230

7.7 返回搜索结果231

7.7.1 选择响应格式231

7.7.2 选择返回字段233

7.7.3 搜索结果分页235

7.8 搜索结果排序237

7.8.1 按字段排序238

7.8.2 按函数排序239

7.8.3 模糊排序239

7.9 调试查询结果240

7.9.1 返回调试信息240

7.10 本章小结241

8 分面搜索242

8.1 搜索结果概览243

8.2 建立测试数据246

8.3 字段分面250

8.4 查询分面255

8.5 区间分面257

8.6 基于分面值的过滤260

8.6.1 在分面上使用过滤器260

8.6.2 基于分面值的安全过滤方法264

8.7 多选分面、键与标记266

8.7.1 键266

8.7.2 标记、排除和多选分面268

8.8 超越分面基础271

8.9 本章小结271

9 搜索结果高亮272

9.1 高亮简介273

9.2 高亮工作原理274

9.2.1 为UFO目击数据创建新的Solr内核275

9.2.2 索引构建前预处理UFO目击数据集275

9.2.3 探索UFO目击数据集278

9.2.4 开箱即用的高亮278

9.2.5 高亮具体细节281

9.2.6 改善高亮显示结果287

9.3 使用FastVectorHighlighter组件提升性能292

9.4 PostingsHighlighter组件293

9.5 本章小结296

10 查询建议297

10.1 拼写检查298

10.1.1 索引维基百科的文章298

10.1.2 拼写检查举例300

10.1.3 拼写检查搜索组件303

10.2 自动建议查询词309

10.2.1 自动建议请求处理器309

10.2.2 自动建议搜索组件311

10.3 文档字段值建议312

10.3.1 使用n-grams生成建议312

10.3.2 n-gram-driven请求处理器314

10.4 基于用户活动提供查询建议315

10.5 本章小结320

11 结果分组/字段折叠321

11.1 结果分组vs.字段折叠322

11.2 忽略重复文档322

11.3 搜索结果中每组返回多个文档330

11.4 按照函数和查询对结果分组334

11.4.1 按照函数进行分组334

11.4.2 按照查询进行分组336

11.5 对分组结果进行分页和排序337

11.6 分组陷阱340

11.6.1 根据结果分组进行分面操作340

11.6.2 分布式结果分组342

11.6.3 返回扁平化列表343

11.6.4 按多值和分词字段进行分组343

11.6.5 分组性能344

11.7 使用折叠查询解析器进行高效的字段折叠344

11.8 本章小结346

12 搭建Solr生产环境347

12.1 编写一份Solr的分发版347

12.2 部署Solr348

12.2.1 编译自定义的Solr分发版348

12.2.2 在应用程序中内嵌Solr349

12.3 硬件和服务器配置350

12.3.1 内存和固态硬盘350

12.3.2 JVM设置351

12.3.3 索引切换352

12.3.4 实用Solr系统配置技巧355

12.4 数据获取策略357

12.5 分片和复制361

12.5.1 分片策略361

12.5.2 复制策略364

12.6 Solr内核管理368

12.7 管理服务器集群374

12.7.1 负载均衡器和Solr健康检查374

12.7.2 通用配置vs.自定义配置375

12.8 Solr的查询与交互378

12.8.1 REST API378

12.8.2 可用的Solr客户端库378

12.8.3 使用SolrJ379

12.9 监控Solr的性能383

12.9.1 Solr的插件/统计页383

12.9.2 Solr缓存性能387

12.9.3 从请求处理器和MBeans获取统计信息388

12.9.4 外部监控选项389

12.9.5 Solr日志390

12.9.6 加载测试390

12.10 不同Solr版本之间的升级391

12.11 本章小结392

第3部分 Solr进阶393

13 SolrCloud394

13.1 SolrCloud上手395

13.1.1 在云模式下启动Solr395

13.1.2 SolrCloud架构的驱动因素400

13.2 核心概念405

13.2.1 集合vs.内核405

13.2.2 ZooKeeper406

13.2.3 确定分片和副本的数量410

13.2.4 集群状态管理411

13.2.5 确定分片代表412

13.2.6 SolrCloud的重要配置413

13.3 分布式索引416

13.3.1 将文档分配给分片417

13.3.2 添加文档418

13.3.3 近实时搜索421

13.3.4 节点恢复过程422

13.4 分布式搜索423

13.4.1 多阶段查询流程423

13.4.2 分布式搜索的局限性425

13.5 集合API425

13.5.1 创建集合426

13.5.2 集合别名429

13.6 基本系统管理任务431

13.6.1 配置更新432

13.6.2 滚动重启432

13.6.3 重启故障节点433

13.6.4 节点X处于活跃状态吗433

13.6.5 新增副本434

13.6.6 异地备份434

13.7 高级主题435

13.7.1 自定义散列435

13.7.2 分片分割436

13.8 本章小结438

14 多语种搜索439

14.1 为什么语种分析很重要440

14.2 词干提取vs.词形还原441

14.3 词干提取实战442

14.4 处理边界情况447

14.4.1 KeywordMarkerFilterFactory448

14.4.2 StemmerOverrideFilterFactory448

14.5 Solr支持的语种库449

14.5.1 特定语种的分析器449

14.5.2 基于词典的词干提取(Hunspell)452

14.6 在多语种中搜索内容453

14.6.1 每种语言一个独立字段453

14.6.2 每个语种构建单独的索引459

14.6.3 支持多语种的单个字段462

14.6.4 创建一个字段类型来处理支持多语种的单个字段463

14.7 语种识别475

14.7.1 语种识别更新处理器475

14.7.2 在一个字段中动态分配语种检测分析器482

14.8 本章小结488

15 复杂查询操作489

15.1 函数查询490

15.1.1 函数语法490

15.1.2 函数的搜索492

15.1.3 以字段形式返回函数494

15.1.4 函数排序495

15.1.5 Solr的可用函数集496

15.1.6 自定义函数502

15.2 地理空间搜索507

15.2.1 搜索附近的一个点507

15.2.2 高级地理空间搜索513

15.3 分面透视523

15.4 引用外部数据526

15.5 跨文档和跨索引的连接528

15.6 使用Solr做大数据分析531

15.7 本章小结532

16 精通相关度533

16.1 相关度调整的影响534

16.2 相关度计算的调试535

16.3 提升相关度541

16.3.1 字段提升541

16.3.2 词项提升543

16.3.3 负载提升544

16.3.4 函数提升545

16.3.5 词项邻近度提升547

16.3.6 提升重要文档的相关度549

16.4 可插拔的相似度的类实现552

16.5 个性化搜索与推荐553

16.5.1 搜索vs.推荐554

16.5.2 基于属性的匹配554

16.5.3 分层匹配556

16.5.4 更多类似结果558

16.5.5 基于概念的匹配563

16.5.6 地理位置的匹配568

16.5.7 协同过滤569

16.5.8 混合方式573

16.6 塑造个性化搜索体验574

16.7 开展相关度实验574

16.8 本章小结577

附录A 与Solr代码库打交道578

附录B 语种字段类型配置587

附录C 有用的数据导入配置593

热门推荐