solr搜索引擎特性

damoqingquan 2008-12-14
英语原文(官方)翻译

Solr 简介

Solr 是一个带有web界面的企业级搜索服务器。它通过http协议将xml格式的文件进行索引,通过http协议进行查询,返回结果为xml格式。

* 先进的全文搜索能力

* 优化的web流量

* 基于开放接口(xml&http)的标准

* 集成的HTML管理界面

* 可扩展性-与其它Solr 服务器的高效结合

* 通过xml配置实现的灵活性和适应性

* 可扩展的插件体系结构

Solr使用Lucene查询库并对其进行了扩展

* 带有动态Field(Dynamic  Field)和唯一键(Unique Key)的实数据模式

* 对lucene查询语言的强大扩展

* 支持动态层面浏览和过滤

* 高级可配置的文本分析

* 高度可配置和用户可扩展的缓存(Caching)

* 性能优化

* 通过xml的外部配置

* 管理界面

* 日志功能

* 快速增加的更新和快照功能

细节特征

Schema(模式) ,在Solr里面的一个xml文件

* 定义可用的field类型和document中可以使用的field

* 驱动更加智能处理过程

* Lucene分析器的说明

* 动态Field(Dynamic Fields)使得field的增加更快速

* CopyField 功能对某单个的field进行多种方式的索引或者将多种field结合到某个field(目的是加快搜索的速度)

* 模糊类型(Explicit types)省略了对field类型的猜测

* 基于文件的停用词,同义词,保护词外部配置

查询(Query)

* 带有返回格式可配置(XML/XSLT, JSON, Python, Ruby)的HTTP接口

* 高亮文本片段显示

* 基于field值和明晰查询的层面搜索(Faceted Searching)

* 添加到查询语言中的排序说明

* 函数查询—通过filed的数值和顺序值的函数影响得分

* 性能优化

* 前缀查询,得分范围查询

Core

* 可插入的查询处理器(query handlers)和可扩展的xml数据格式

* 基于单键值field(unique key field)的强制的document唯一性

* 批量更新和删除

* 用户可配置的索引改变触发命令

* 搜索并发控制

* 正确的数值类型处理,以支持排序和范围查询

* 对没有用于排序的 field的document的正确处理

* 查询结果的动态分组

缓存(Caching)

* 可配置的查询结果、过滤器、Document缓存实例

* 可添加的缓存实现

* 后台缓存“预热”

当一个新的查询器打开,可配置的查询就开始运行,以避免首次查询返回结果较慢,“预热”期间,当前查询继续进行

* 后台自动“预热”

当前的搜索器的缓存中包含经常访问的元素,当新的搜索器建立时自动将其加入,以提高缓存的命中率

* 快速/小型过滤器的实现

* 使用自动“预热”的用户级缓存

复制(Replication)

* 对通过同步传输改变的索引的高效异步处理

* “前拉策略”使得搜索器的添加更加容易

* 可配置的分布间隔获得了缓存使用和时效性之间的平衡

管理界面(Admin Interface)

* 全面的缓存使用,查询,更新统计

* 文本分析调试器,展示文本在分析器中每个阶段的结果

* Web查询接口/调试输出

1. 查询输出的分析细节

2. Lucene 计算文档评分细节

3. 显示查询范围外的文档评分,以调试为什么给定的文档没有获得较高的评分
Global site tag (gtag.js) - Google Analytics