...的意愿来切分应该是要怎么做? 文档里看到有个自定义词库的设置,然后根据文档使用了下,发现没达到效果。比如说,我想搜索拥有"味道恶心"这个词的文章,(我的文档库里面是有相关文章的了)搜索的时候出现了大多都是...
谢谢 hightman 的回答. 不过我确定我市完全按照你说的做的 php.ini 是这样的配置 [scws] extension=scws.so scws.default.charset=utf8 scws.default.fpath=/usr/local/scws/etc 而php 是这样 //分词 $so = scws_new(); $so->set_charset('utf8'); // 这里没有...
...词吗?还是别的办法~ [/quote] 当时给他建议后添加了自定义词汇,药到病除。。。 [/quote] 谢谢管理员,俺想问下,如果在dict_user.txt里加了词汇,是不是要把索引全部重新建立一遍? 如果这个自定义分词是需要不定期的更...
如果只要文章中有Linux出现就算是Linux相关文章的话,其实是不需要分词了,直接用全文搜索Linux就好了。 只是SCWS目前看前来它的自定义词典不支持超过3个字,如果可以的话,可以通过自定义“Linux优化”来指定分词
...提供scws的api接口,实现短语分词功能 2.是否可以对scws自定义中文词典,方便扩展 [/quote] 目前没有直接支持自定义词典,而是直接读取 dict.utf8.xdb 你自己改词也必须转换成这个词典文件才能用。 词典转换关于SCWS的网站上有。
感谢hightman的认真对待. 我也按照你说的.打印了 add_dict 的返回数值..发现.就算在异常的情况下. 加载字典的返回值是 true的.但 get_result() 却返回 false; 是否会关 nginx 或 php-fpm 有关呢 ?? 我环境 是 centos5 nginx php-fpm 的[/code] ...
...到相当的说明,希望你有时间能帮我解答一下。 现在自定义分词,是不是只能在索引的时候进行,我的项目中需要对内容进行自动分词,用于生成文章的tag,我自己给定了一个用户自定义词库,在$tokenizer->getTops()时,不能...
...在一个英文句子里提取其中词频比较高的名词。想到用自定义词典,自己整理英文词。但是发现一个问题。。比如hip pop这样也是一个名词,那现在自定义词典里肯定不能有空格的啊。老大能不能把这个也解决一下,这样的话,...