...致用不到分词,只是靠在一起时需要消岐才用得到。你自定义词典用不了要查查是什么别的原因。 通常问题: 1.词典写的字符集不对,比如把GBK当UTF-8了 2.词典更新后的修改时间由于某些原因比/tmp目录下生成的临时xdb还要旧,...
楼主,为什么不能发新帖了啊。我用1.18 php_scws.dll(2) 对应的php版本为 5.2.3 完全按照文档目录 php_scws.dll/Win32 安装说明 这个上面做的。而且安装完扩展之后echo phpinfo();也看到了 scws服务已经有了。 在运行时加了 scws.default.charset...
customDict 属性 public string getCustomDict()public void setCustomDict(string $content) 获取自定义词典内容
你可以正常分词试试,然后打印一下词的 attr 属性到底是不是* 号 我估计是不是你自定义词典先于默认词典加载,导致attr属性被覆盖了?
...进优化代码兼容性 - 增加用户案例文档:USERCASE - 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSS...
...19383230'] 什么方式运行的? 是不是词典的原因啊,用了自定义吗 [/quote] linux Centos5。scws.1.1.8版的。 还没用上自定义的词库。 第一次基本大于0.1秒以上。就很短的几个词也是这么慢。 提交同样的词后面几次就很快了。 一有...
...才行。 -- [color]新功能用法示例[/color] (php为例) -- 1. 自定义词库,含新增核心库不存在的词汇及删除核心库存在词汇的功能 1) 创建相应字符集的词库文件 dict_extra.txt 2) TF/IDF 参考值查询,为方便大家我作了一个工具自...
...现在新版 1.3.1 提供了 scws 接口,只要把这些黑词加到自定义词典,并取一个独特的词性,那么就可以用 XSTokenizerScws::hasWord() 的功能来判断是否包含黑词?
...才行。 -- [color]新功能用法示例[/color] (php为例) -- 1. 自定义词库,含新增核心库不存在的词汇及删除核心库存在词汇的功能 1) 创建相应字符集的词库文件 dict_extra.txt 2) TF/IDF 参考值查询,为方便大家我作了一个工具自...