搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

51.请问scws分词如何实现优先级

发布时间：2010-12-30 04:12 t By huanghai

请问scws分词如何实现优先级？我想一些特有的词汇优先排列在前面，应该怎么实现啊？

52.日志的处理是用什么分词的？

发布时间：2012-04-12 15:04 t By 290977824@qq.com

日志可以提供搜索提示、相关搜索等功能，我想问一下日志的分词系统是什么？是否可以修改？

53.RE: xunsearch是否支持一元分词

发布时间：2011-12-08 11:12 t By hightman

如果你了解scws就会知道它其实对散字也是自动二元处理。你所谓的一元是一个字一个词？你也可以拓展 XSTokenizer 自己实现分词

54.fedroa 上编译安装 scws 之后出现分词不准确

更新时间：2010-11-30 00:11 t By smartly

不能正确分词，测试代码在 Windows php5 下运行正常纠结问题所在原话：“喜讯：谷歌中国宣布将关闭两大服务终止与天涯合作” 分词结果：“谷歌中宣布关闭两” Windows 下分词就是正确的分词结果：“喜讯谷歌中国宣布 ...

55.RE: 我想使用系统自动的分词功能，可是只看到有接口

发布时间：2011-11-24 23:11 t By hightman

不是很明白，你说的自动分词？？是什么意思你在配置文件中不要指定 tokenizer 选项就会自动使用 SCWS 分词了。

56.RE: 建议用户能设置数字不分词

更新时间：2013-06-18 14:06 t By hightman

这是分词的策略问题，这种情况可以自定义分词器来补充。。。将你的词复制到 [url]http://www.xunsearch.com/scws/demo/v4.php[/url] 进行实测，分割结果为： E14188m E14188 14188 14188m 那么搜索以上4个词都是可以搜索到的，至于你从中提取 e...

57.RE: 日志的处理是用什么分词的？

发布时间：2012-04-18 11:04 t By hightman

内置默认的scws分词，不可更改

58.RE: Windows下分词错误

发布时间：2011-12-16 16:12 t By abckk

比如“北京er朝阳” 能分出北京和朝阳变成”北京erty朝阳“，中间有2个以上的半角字符就不行了，只能分出北京，分词终止。这个是什么原因用的是php_scws.dll vc9

59.分词的关键词选择

发布时间：2008-08-02 15:08 t By 小苦工

很感谢，大致看了版主发布的scws的文件包，很规范，接口和扩展都做的很少，不过就是注释少了点，对我等菜鸟，看的不是很明白！:D 想请问版主一个问题，分词分出来后，怎么选择一个句子的关键词是哪些！

60.RE: 塔里木河的分词问题

发布时间：2013-06-09 13:06 t By hightman

因为“塔里木河”已经是个完整的词了，再细切也是“塔里+木河”。实在有必要可以自定义分词器或想办法将你要的词加入到索引中。

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索