词典没配好吧 有没有在 ini_get('scws.default.fpath') 下面放置词典和规则集文件呢?
...会加载默认词库了。这并不算BUG吧。 这是给懒人设定的规则,当你试图设置词典时那就完全交给你决定,而不是系统强制无论如何都先加载默认词典。
...么就不行呢。[hr] 经过测试,还发现。 不加载任何字典和规则。 数字是照样能给分词出来的。。似乎默认就把一窜数字就是一个词 这样来分[hr] 那如果是这样就麻烦了。。怎么能解决 中文+数字 结合的词呢?
...以直接查看、 可以直接修改。但其中还是有一些约定的规则和限制,为了更方便用户,我们打算提供 这样的工具辅助用户创建、修改配置文件。 INI 在线编辑工具 (WEB 版) ----------------------- 为方便新手初次接触 `xunsearch` 时的...
[quote='hightman' pid='6577' dateline='1309234009'] 文本词典格式,文档多处有提到吧 每行记录包含以下字段 \t\t\t 工具 用法可以 ./gen-scws-dict -h 查看 [/quote] -h 看过.. 不太明白命令规则..
... 1.词性参与权重计算导致的问题挺多,这点是不是考虑规则权重调整一下? 2.可能是考虑性能问题,采取的局部寻优的办法也导致了一些问题,是不是考虑全局寻优,或者长一些范围内寻优?
...体进行计算权重,看哪个情况最优。 此外还有根据rules规则匹配。 简单举个例子: “开放下载” 1. 开/放下/载 2. 开放/下载 根据词典中的tdf进行一个运算得出概率而采取最高的那种
[specials] 里面配置吗 我加了P++ 可以 搞成“65Mn”就不行 还是要单独设置个规则吗? 谢谢 hightman 同学
哦,那没有这样的功能,也提取不出这样的规则。建议在自己提取返回词时作判断和过滤吧。