[solr ] 请教solr同义词的使用

281601139 2009-05-13
solr怎么建同义词,为什么我在synonyms.txt里面建立一些同义词,有的要等好久才能生效,而且中文还不能用。有谁来帮忙解决一下,给一些学习资料也成啊
roki 2009-05-13
我记得solr没有内建对同义词的支持,要自己写分词过滤器吧

可以看看我的新书

《搜索引擎零距离—基于Ruby+Java搜索引擎原理与实现》
http://www.huachu.com.cn/itbook/itbookinfo.asp?lbbh=10105450

里面有讲到Solr的,分析的算是有点深度
281601139 2009-05-13
roki 写道
我记得solr没有内建对同义词的支持,要自己写分词过滤器吧

可以看看我的新书

《搜索引擎零距离—基于Ruby+Java搜索引擎原理与实现》
http://www.huachu.com.cn/itbook/itbookinfo.asp?lbbh=10105450

里面有讲到Solr的,分析的算是有点深度



===============================================================
有没有网上的资料呢
281601139 2009-05-14
281601139 写道
solr怎么建同义词,为什么我在synonyms.txt里面建立一些同义词,有的要等好久才能生效,而且中文还不能用。有谁来帮忙解决一下,给一些学习资料也成啊

solr内部是支持同义词的,我现在就是对英文可以建同义词,对中文却不行。而且,建立英文同义词的时候要经过一段时间才能生效
281601139 2009-05-14
问题已经解决
xfish6016 2009-05-14
怎么解决的?
281601139 2009-05-15
xfish6016 写道
怎么解决的?

使用SOLR加入中文同义词需要把synonyms.txt的默认编码改成与自己系统使用的编码一致。
比如说:你整个系统的编码都是用UTF-8,那么你就要把synonyms.txt这个文件的编码格式转换成UTF-8。原因是,对某个词进行同义的时候找到的词是乱码,而乱码在对于的索引中是没有存在的。这也就导致了中文不可以使用的原因。

总结:SOLR中文分词无法使用,核心问题是-没有统一编码,导致乱码问题。
dandongsoft 2016-02-29
solr 同义词配置,中文不好用啊 啊 啊啊 啊 啊啊 啊啊 啊啊 啊啊啊 啊啊 啊
Global site tag (gtag.js) - Google Analytics