搜索

大约有 70 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1951秒)

21.RE: 分词初试,结果不对

发布时间:2010-09-17 16:09 t By xiaowang19

事实上,我UTF-8的一直不成功,GBK的就会出现那样奇怪的问题 今天我又再试了一下(GBK版本的),在Windows下,在文件保存的时候,选择编码“ANSI”,这样就不会出现那样奇怪的问题了

22.编写第一个配置文件

...为了按版块检索,我们必须对它进行索引,而它也不需要分词,所以分词器用内置的 `full`。 - `tid` 内容也是数字的主题ID,我们暂不考虑按主题搜索,所以不需要索引,也没有排序等要求,所以 只要当作普通字段存储下来即可...

23.RE: 我想使用系统自动的分词功能,可是只看到有接口

发布时间:2011-11-24 23:11 t By hightman

不是很明白,你说的自动分词??是什么意思 你在配置文件中不要指定 tokenizer 选项就会自动使用 SCWS 分词了。

24.想手动指定一些不进行分词的词语

发布时间:2013-07-23 16:07 t By seagg

一个不懂分词的小白~ 想问下 我用迅搜 如何设定一些词 使得这些词不被scws进行分词 比如 “米兔车贴” 这个词, 被分词成 “米兔车 贴” 我该如何操作,才能使得这个词不被分开 我看到有用户自定义词典 dict_user.txt 我在...

25.手工添加SCWS的分词应该如何做?

发布时间:2009-02-22 16:02 t By joyanhui

比如比如我希望用SCWS能搜索 一个关键词的信息,但是现在虽然内容里面有很多这包含这个词语的信息了, 但是搜索的时候却搜索不到. 应该如何处理呢? 如果是修改rules.ini文件的话,难道是加到[special]这个位置吗???

26.RE: 分词初试,结果不对

更新时间:2010-09-16 17:09 t By xiaowang19

...et_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb'); 再次运行,分词正确了[hr] 不过,又出现了奇怪的问题,我在原来的测试文本后面随便加了两个字母,分词又不对了。我继续增加字母,有时候对,有时候不对。(GBK版本)

27.RE: scws 词库与dict_user.txt文件有什么关系?

发布时间:2012-04-19 11:04 t By hightman

不明白你说的。同义词是基于分词后的结果制作的。 如果你的索引先前制作,后面再添加自定义词,那么当然无效了。你要重建索引

28.第四版遇到()和中英文混合分词的问题。

发布时间:2008-01-03 11:01 t By kts2tt

富贵鸟(Y1W) 类似这样的名称分词的结果 却是 富贵 鸟(Y1W) 最关键的 Y1W 没有被分出来。 而且 六灯夜视D502 这样的名称 也只能分出 中文, 英文和数字没有被分出来,是为什么?请教高手。 我用的是SCWS 扩展 PHP 5.2.x 版二...

29.RE: 我想使用系统自动的分词功能,可是只看到有接口

发布时间:2011-11-25 09:11 t By limingyao

...ghtman' pid='251' dateline='1322149925'] 不是很明白,你说的自动分词??是什么意思 你在配置文件中不要指定 tokenizer 选项就会自动使用 SCWS 分词了。 [/quote] 嗯,可能描述不清。 我就是想有一段文字,然后根据这段文字分词,...

30.如何设置“自定义词典”的路径?

更新时间:2010-10-28 14:10 t By johnbaby

...ite【子目录】 |---include【子目录】 |---使用分词功能的页面.php【php代码调用正确:"../etc/自定义词典.txt"】 |---etc【子目录】 |---自定义词典.txt |---admin【子目录】 |---include【子目录】 ...

  • 时间不限
  • 按相关性排序