[solr ] 如何使用solr解决 红楼梦中林黛玉出现的次数

suxiaodongmu 2015-01-08
场景:
每一篇文章作为一条索引记录,整本书就按章节存入solr的索引中,
现在需要统计出 “林黛玉”在整本书中的记录数,

我所知道的face只能统计出“林黛玉”在多少篇章节中出现过,并不能统计出每个章节中出现的“林黛玉”之和

不知道哪位大神知道如何解决这样的问题,不尽感激
chenchuan 2015-01-13
TermVector应该是解决你这个问题的东西,但是好像solr没有提供这个相关接口
suxiaodongmu 2015-01-13
chenchuan 写道
TermVector应该是解决你这个问题的东西,但是好像solr没有提供这个相关接口


我也认为如此,因为solr打分就跟一个词在一篇文章中出现的次数有关,即词频,所以应该是有统计出现的次数的,翻遍了文档也没有找到相关信息
chenkan2000 2015-01-20
"林黛玉"在索引中可能被分成"林","黛玉","林黛玉"等多个词,也可能不分词了。但考虑一下如何统计"中华人民共和国"在文章中出现的次数。写接口的人考虑到了普遍情况。我也为这个问题而困惑。

Global site tag (gtag.js) - Google Analytics