[solr ] 请教大家一个solr高亮查询的问题
lybilq19
2015-12-23
我用solr进行关键字高亮查询,但是查询出来的高亮范围不知什么原因变大了。
例如:查询关键字为【电信】,highlighting结果有的是正常,有的却是不对的。 5": { "content": [ "1、新疆<em>电信</em>承诺自2009年9月1日起向宽带用户提供宽带家庭影院pc版 8": { "content": [ ",实时了解监控场所的现场情况。 9) 可通过传感器进行远程监测及控制、报警。同时可以自动将远端监控点的现场状况以图像及<em>电信为用户提供强有力...</em> 请教是这么原因。 schema.xml里该字段定义设置multiValued为false,采用ansj中文分词。 |
|
冰糖葫芦
2016-03-13
一般这种高亮不正确是由于分词引起的,由于token在分词的时候回指定对应word的startOffset和endOffset,但是有些token分词不完全可能会出现这种情况,一般的解决办法为完善词库(http://www.shuidixy.com,这里的搜索是我们用solr实现的,一直在不断优化中,欢迎交流)
|