你可以正常分词试试,然后打印一下词的 attr 属性到底是不是* 号 我估计是不是你自定义词典先于默认词典加载,导致attr属性被覆盖了?
一对 夫妻 一次性 交 了 一 百元 买 了 一次性 杯子 50 打 上面这句成功使用默认字典 下面自定义字典出错。 系统:apache php5 [b]Warning[/b]: scws_set_dict() [[color=#0000ff]function.scws-set-dict[/color]]: Failed to load the dict file in [b]D:\AppServ\www\...
我有一自定义词库,用来文本中的非法词。譬如“美女” ,用scws_get_tops分出来的词中有这个词,但是scws_has_word却判断为不包含这个词。 但是大部分自定义词库中的词还是能用scws_has_word判断出来,而有些却有不可以,尤其是两...
/usr/local/php/bin/php /usr/local/xunsearch/sdk/php/util/Indexer.php --rebuild --source=mysql://root:123456@127.0.0.1/test --sql="select * from pw_record" --project=record 以上是默认mysql 端口号为3306 导入命令 但是, 现在我的mysql 端口号是6630 在--source=mysql://roo...
感谢 七夜 兄的测试和指出,现在已经作了修正。原因是对输入的编码做了二次校正。 改法参见 GIT 仓库,因为输入的数据已经统一转成 UTF-8 了,所以搜索服务端应统一使用 UTF-8 即可。 [url]https://github.com/hightman/xunsearch/commit...
-d为指定索引库 使用1.0.0自带sdk发现,如下情况 指定-d 索引库后,无法查询,直接报错 条件是,并没有使用默认索引库db,即data/项目/下面没有默认的db索引库 即指定了-d 索引库,也会去查找默认索引库db,并且返回结束...
...lp ~~~ 主要参数和选项 ------------- 要使用本工具,必须先指定的项目名称或配置文件,它将根据该项目的情况生成代码,主要选项如下: * _-p|--project _ 指定项目名称或配置文件路径,参数名可以省略不写, 如果仅指定项目...
...参数和选项 ------------- 和索引工具类似,使用前必须先指定的项目名称或配置文件,所有的操作都将是作用于该项目, 主要选项如下: * _-p|--project _ 指定项目名称或配置文件路径,参数名可以省略不写, 如果仅指定项目...
...~~ 主要参数和选项 ------------- 要使用索引工具,必须先指定的项目名称或配置文件,所有的操作都将是作用于该项目,主要选项如下: * _-p|--project _ 指定项目名称或配置文件路径,参数名可以省略不写, 如果仅指定项目...
...~~ 主要参数和选项 ------------- 要使用日志工具,必须先指定的项目名称或配置文件,所有的操作都将是作用于该项目,主要选项如下: * _-p|--project _ 指定项目名称或配置文件路径,参数名可以省略不写, 如果仅指定项...