搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

1.强烈建议支持词库里的词可以是纯英文单词

更新时间：2011-04-24 01:04 t By lauxinz

建议支持词库里的词可以是纯英文单词，虽然在分词时英文单词可以自动识别切分开，但在关键词提取和非法词过滤时却无法提取出或过滤掉纯英文单词。比如：我要从一些商品名中提取一些品牌：adidas nike。。。对商品名分词...

2.关于scws和词库的一些建议

更新时间：2011-04-23 21:04 t By lauxinz

建议支持词库里的词可以是纯英文单词，虽然在分词时英文单词可以自动识别切分开，但在关键词提取和非法词过滤时却无法提取出或过滤掉纯英文单词。比如：我要从一些商品名中提取一些品牌：adidas nike。。。对商品名分词...

3.英文单次能不能做到词典里删除

发布时间：2011-03-18 17:03 t By caoagui

一段文字里有些英文单词，但是不想进行分词和统计加入到词典里，用！，但是没有用咋办？

4.RE: SCWS不支持英文和中英文混合分词吗？

发布时间：2010-08-27 10:08 t By hightman

除中文外其余的只按标点符号或空格切分，无缝连在一起的单词字母是不支持的。

5.RE: 英文模糊搜索问题

发布时间：2013-07-31 14:07 t By hightman

模糊搜索和空格不冲突吧。你单词内模糊就行了，比如按３个字母为单位建立？

6.RE: 英文单次能不能做到词典里删除

发布时间：2011-04-23 02:04 t By 粟术英

[quote='caoagui' pid='4121' dateline='1300441376'] 一段文字里有些英文单词，但是不想进行分词和统计加入到词典里，用！，但是没有用咋办？ [/quote] 这个可以在get_tops的时候设定可选择去掉英文属性分词如下：$tops = $pscws->get...

7.RE: 这个不支持英文词典和中英文混合词典啊

发布时间：2011-12-30 14:12 t By conglei1981

...uote='hightman' pid='7573' dateline='1325211638'] 不知你在说什么。英文不需要词典啊！！ [/quote] 我知道英文不需要词典关键就是这个不需要词典他的英文分词就没办法控制了，比如我要做计算机专业的分词，其中很多就需要用到一...

8.RE: 英文模糊搜索问题

发布时间：2013-07-31 15:07 t By homingway

...常感谢！我刚试了下，针对我的需求来说，对于人物英文名以3个字母为单位建立索引的确可以达到很好的效果，中文名以一个汉字为单位。最后贴出我的代码给有需要的人： [php] class XSTokenizerUnary implements XSTokenizer { p...

9.RE: 分享一个dict_user.txt

发布时间：2012-02-22 11:02 t By hightman

感谢分享，不过英文单词不需要词库啊。

10.分享一个dict_user.txt

发布时间：2012-02-21 16:02 t By Dull

全部是英文单词数据来源： twitter tumblr amazon alibaba flickr 等的标签原来多是词组形式改成了scws的单字形式没有附加任何属性也就是说全部使用默认属性参考 http://www.xunsearch.com/doc/php/guide/index.dict

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索