搜索

大约有 60 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1937秒)

31.RE: 如何去除无用的词?

发布时间:2013-04-28 14:04 t By hightman

这个就不是分词干的活呀,分词负责把词分了。 你可以自己根据词性去掉一些辅助类的词

32.RE: 如何去除无用的词?

发布时间:2013-04-28 14:04 t By hightman

这个就不是分词干的活呀,分词负责把词分了。 你可以自己根据词性去掉一些辅助类的词

33.RE: 自定义词库如何使用?

发布时间:2013-05-13 15:05 t By hightman

这个是内置的一个复合分词功能。你要关闭这个功能可以在搜索时: $xs->search->setScwsMulti(0);

34.RE: 如何优化xunsearch

发布时间:2013-07-29 12:07 t By gilroy

研究了一下源代码,最终功夫不负有心人,成功的避过了中英文混合,使用字典中的词语分词,我用的是 在调整每次读取数据的大小和缓冲区大小时有不同的情况

35.RE: 请问如何只返回名词?

发布时间:2013-09-10 15:09 t By hightman

分词问题请到scws版问,自己根据词性过滤吧。

36.自定义词库如何使用?

发布时间:2013-05-12 11:05 t By hq22

网页设计 分词后变成 网页设计 网页 设计 我想把网页设计就分为网页设计一个词,不需要搜索出含有网页跟设计的内容。 我在dict_user.txt加入 网页设计 这个词,好像并没有效果,还是搜索出来含有网页跟设计的文档。

37.咨询SCWS准确率是如何计算出来的

发布时间:2013-10-08 17:10 t By tiankong

我想咨询一个问题。SCWS官网简介上指出,SCWS中文分词系统(Simple Chinese Word Segmentation)经小范围测试准确率在 90% ~ 95% 之间。 上面的准确率是如何计算出来的呢?或者有其他类似的标准测试工具吗?谢谢!

38.请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)

发布时间:2012-02-23 17:02 t By Milton.Lai

Hi Hightman, 您好! 非常感谢您做的scws分词和xunsearch系统, 最近我们在做网站的搜寻服务, 考察了coreseek, sphinx-for-chinese 和 xunsearch 这三个系统, 觉得还是 xunsearch 比较适合, 因为词典制作和查询的方式都较另外二者灵活. 在今天做...

39.RE: 请问如何搜索字段值在一个长列表中的记录?

发布时间:2013-05-15 15:05 t By alicar

cate:1,3,5 cate分词用逗号判断split(,)

40.RE: 遇到一个分词错误的问题

发布时间:2014-02-10 18:02 t By robinjia

那要如何解决这个问题呢?有没有更好的办法?

  • 时间不限
  • 按相关性排序