pscws4和scws大致相同的算法,只是后来pscws4没有再进一步更新了。 粗分毕竟只是粗分,要想正式用只用其中一种肯定是不够的。 scws 里面先按逐字把所有可能的词都列出来,建成一个2维表,然后把有岐义的部分拧出来,以其...
PHP的扩展部分有DLL,C库部分因为我也不熟WIN平台,但有提供源码,如果你会弄就帮弄一下我可以在发布包中一并提供。 像你这样的情况因为“沈阳若”被识别为姓名了,这是一种比较难以决断的岐议,要说分成“小”“沈阳若...
你要用自定义词库 编写一个 dict_extra.txt 里面写上每个词,一个一行 然后调用 add_dict 加入词典
现在网页上下载的已经全部统一为GBK编码了,目前测试在MACOS下面不会乱码了。看抓图
Indexer.php 你可以在 sql 语句中指定 offset 和 limit --sql="select * from cdb_posts limit 999999999999 offset 5000000" 类似这样,OFFSET 不能单用必须配合 limit
这是由于 `` 反引号在 shell 中是特殊处理的,代表在命令执行,所以当 PHP 执行时已经被替换为命令结果了。 已在新代码的帮助说明中增加了标注,特别感谢楼主的提示。
to hightman: 在xdict.h文件中,有这么一行注释,能否说明一下: /* return pointer to static data, DO NOT use two or more times in one line, Non-ThreadSafe */ word_t xdict_query(xdict_t xd, const char *key, int len); xdict_query() 不是线程安全的? 看代码xdict_...
1.2.0 起提供了 php 5.3/5.4 的 non-thread-safe 的DLL了
多谢报告,刚刚测试了一下,我的测试 结果不是完全和你相同。 1. 如果 db 不存在而只存在 db2,指定 -d db2 会报错(这是BUG) 2. 如果 db ,db2 都存在,我指定 -d db2 则只会显示 db2 的结果 ,并不是如您所说的 db+db2 -d db,d...