搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0069秒)

121.我对切词尝试做了下功能修改

更新时间:2013-12-27 20:12 t By linqingtao

... 1)、中英文混合的 英文超过2个字就会被切割,不管词典里面有没有这个数据,比如词典里面有 “ABC支持开源" , 对“ABC支持开源" 切词的结果是“ABC" "支持“ ”开源“, 而不能切成“ABC支持开源" 2)、长的句子切词后返...

122.RE: 最短分词不起作用

发布时间:2014-02-28 13:02 t By robinjia

因为没有人明白你说的意思。你说用官方的词典,可以分出“内衣”和保暖内衣“,这点我就非常不解了,按照我的理解,依照scws的分词策略,要么就分成”保暖+内衣“,要么就是”保暖内衣“,怎么会有”内衣“和”保暖内...

123.在 Xunsearch 使用 SCWS

...] 完成,主要目的是用于类似黑词判断。 您可以自制一个词典,并将黑词统一设置为一个独特的属性,比如 "@", 那么就可以用该功能判断一段文本是否包含黑词。 ~~~ [php] $text = '...'; if ($tokenizer->hasWord($text, '@')) { // 包含词性...

124.最新的主要变动

...性更好功能更强 - 修改 XSTokenizerScws 以支持项目级自定义词典的 - 自定义分词器的字段也能参与权重计算了,在 ini 指定 `non_bool = yes` 版本 1.4.5 (2013-3-25) ---------------------- - 再次订正改进内存 BUG,使之极其稳定 - 升级整合最新的 ...

125.RE: 1.1.2的 自定义字典无法使用

更新时间:2010-05-23 22:05 t By 逆雪寒

... set_dict 和 set_rule 系统会自动试调用 ini 中指定路径下的词典和规则文件 $so->add_dict(ini_get("scws.default.fpath") . '/dict.utf8.xdb'); $so->add_dict("/usr/myapp/dict_extra.txt",SCWS_XDICT_TXT); $so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); // $so...

126.有没有添加单个或多个词的函数?

更新时间:2010-07-28 18:07 t By backluck

...词是放在数据库里面(为了方便增删改),如果每次加载词典都要把禁止词写到临时文件,然后添加,觉得有点过于麻烦。是否可以提供添加单个或多个词的函数?

127.想手动指定一些不进行分词的词语

发布时间:2013-07-23 16:07 t By seagg

...操作,才能使得这个词不被分开 我看到有用户自定义词典 dict_user.txt 我在里面写了: 米兔车贴 1.0 1.0 ! 但还是被分了 还看到一个stopwords.txt的文件,但将米兔车贴放到里面了也还是会被分 。。。

128.RE: [2011] SCWS-1.1.8 发布,提供VC9的php_scws.dll、支持自定义词库

更新时间:2011-09-01 11:09 t By wodeln

...ld\dede\getwen.php on line 5 不加呢,又会分词不成功,貌似是词典的问题,能不能告诉我哪里做错了呢? 忘记说了,我用的编码都是utf8 还有就是如果我用 $so->set_dict('C:/Program Files/scws/etc/dict.xdb'); $so->set_rule('C:/Program Files/scws/etc/rul...

129.RE: 有没有添加单个或多个词的函数?

发布时间:2010-08-02 11:08 t By backluck

...词是放在数据库里面(为了方便增删改),如果每次加载词典都要把禁止词写到临时文件,然后添加,觉得有点过于麻烦。是否可以提供添加单个或多个词的函数? [/quote] 现在没有这个需求了,因为我的非法词库里面有英文...

130.【已解决】【感谢hightman帅哥的耐心解答,我是个人站长,要是我做起来了一定赞助您撒,

更新时间:2010-07-15 01:07 t By sulwan

...凯歌 但是实际没有效果啊, 代码可以直接查看,限制词典位置在: http://sjz.haojishu.com/tools/dict_extra.txt 见鬼啊!

  • 时间不限
  • 按相关性排序