[solr ] 请教大家一个solr高亮查询的问题

lybilq19 2015-12-23
我用solr进行关键字高亮查询,但是查询出来的高亮范围不知什么原因变大了。
例如:查询关键字为【电信】,highlighting结果有的是正常,有的却是不对的。
5": {
      "content": [
        "1、新疆<em>电信</em>承诺自2009年9月1日起向宽带用户提供宽带家庭影院pc版

8": {
      "content": [
        ",实时了解监控场所的现场情况。  9) 可通过传感器进行远程监测及控制、报警。同时可以自动将远端监控点的现场状况以图像及<em>电信为用户提供强有力...</em>

请教是这么原因。
schema.xml里该字段定义设置multiValued为false,采用ansj中文分词。
冰糖葫芦 2016-03-13
一般这种高亮不正确是由于分词引起的,由于token在分词的时候回指定对应word的startOffset和endOffset,但是有些token分词不完全可能会出现这种情况,一般的解决办法为完善词库(http://www.shuidixy.com,这里的搜索是我们用solr实现的,一直在不断优化中,欢迎交流)
Global site tag (gtag.js) - Google Analytics