搜索

大约有 230 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0058秒)

151.RE: 词典格式疑问?

发布时间:2012-02-22 19:02 t By vanni

为什么不能定义超过3个中文的词呀。(定义词典使用的是UTF8格式) 比如我定义 “相宜本草” ,但是没有用!

152.RE: 这个不支持英文词典和中英文混合词典啊

发布时间:2012-02-22 19:02 t By vanni

如果只要文章中有Linux出现就算是Linux相关文章的话,其实是不需要分词了,直接用全文搜索Linux就好了。 只是SCWS目前看前来它的定义词典不支持超过3个字,如果可以的话,可以通过定义“Linux优化”来指定分词

153.搜索分词只希望第一层怎么办?

发布时间:2014-05-11 00:05 t By dashzhao

因为我的项目是电商网站,所以我定义了一个词库,把我己的品牌、商品类目名字给加进去了。 我希望是这样的搜索结果,比如搜索“迪卡侬蓝色货品”: 现在是这样的: [code]Xapian::Query(((迪卡侬:(pos=1) SYNONYM (迪卡:(po...

154.RE: scws 词库与dict_user.txt文件有什么关系?

发布时间:2012-04-18 11:04 t By 290977824@qq.com

问题是系统在使用定义词库的时候,添加的词能不能算是基词?是否使用同义词的时候可以进行关联? 就目前的情况是添加了定义词之后,如果这个词不算是基词,关联的同义词就无效、、、、

155.英文数字组合字符串分词问题,已结贴。

更新时间:2014-05-14 10:05 t By hpxl

....php[/url] 得到的结果为“华硕/主板/H/61/-/PLUS”。尝试过定义词库,$prefix/data/项目名称/dict_user.txt 加入H61,但是不起作用,中文词汇是可以的。如果想分词结果中有H61,是不是只能定义分词了?像这种商品的型号中很多类似...

156.RE: [HELP]xunsearch安装好了,搜索没有结果集。。。

发布时间:2011-10-27 16:10 t By hightman

...提供scws的api接口,实现短语分词功能 2.是否可以对scws定义中文词典,方便扩展 [/quote] 目前没有直接支持定义词典,而是直接读取 dict.utf8.xdb 你己改词也必须转换成这个词典文件才能用。 词典转换关于SCWS的网站上有。

157.scws_has_word没有得到部分指定词库中的词

更新时间:2011-12-06 16:12 t By michaele

我有一定义词库,用来文本中的非法词。譬如“美女” ,用scws_get_tops分出来的词中有这个词,但是scws_has_word却判断为不包含这个词。 但是大部分定义词库中的词还是能用scws_has_word判断出来,而有些却有不可以,尤其是两...

158.配置文件的困惑

发布时间:2012-03-16 17:03 t By 张十三

...大的 scws 分词,适合绝大多数字符串字段。也可以指定定义分词器,格式为 name 或 name(arg) 两种形式,其中 name 是分词器名称,arg 则是传递给分词器构造函数的参数。定义分词器需要在 lib/ 目录下编写名为 XSTokenizerName 的分...

159.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压不死锁)

发布时间:2013-03-26 16:03 t By vus520

...到相当的说明,希望你有时间能帮我解答一下。 现在定义分词,是不是只能在索引的时候进行,我的项目中需要对内容进行动分词,用于生成文章的tag,我己给定了一个用户定义词库,在$tokenizer->getTops()时,不能...

160.RE: 如何修正分词错误

发布时间:2012-02-22 19:02 t By vanni

定义一个定义词典,包括下面内容: 了 100 100 e 现在 100 100 时间 100 100

  • 时间不限
  • 按相关性排序