...具本身解决的办法 ------------------------------------ 我自己尝试调tf-idf都失败了,感觉这些词是被特殊处理的,没有按tf-idf来算? 因为量词太多,不可能一个个从词典用!删去……
为确保服务器性能,采用空闲时写入。但不至于1-2小时,是不是有其它情况。可以尝试: util/Indexer.php --flush
这些 PHP 工具在发布时都有测试通过,但PHP版本众多,加上各自配置又不一样,所以难免还有问题。目前 PHP 的工具部分照顾不过来,请尝试自行修正一下。 计划在下一版本中直接在 gen-scws-dict 中提供C版的工具,不要再通过PHP了
extension_dir最好以/结尾! 你可以尝试运行 php.exe 如果加载不了应该会有提示~
这是PHP的safe mode 导致的,自己配置好就行了。 命令行测试时乱码大概是编码不对,你可以尝试在命令后加上 -cgbk
因为我们平时开发环境都没有windows,所以没能去尝试编译。。。所以WIN32支持计划可能会比较远了
...Name 太长 而我的搜索语句是六个”self 字段索引“ 当我尝试只搜索4个“self 字段索引”的时候就不会报错,是不是讯搜本身对”self 字段索引“做了限制 只允许至多4个?util/Quest.php 这种方式六个字段索引式的搜索也是too long 而...
...转换。 此外你的乱码是不是因为你的终端是 GBK 的?请尝试用 util/Quest.php 进行测试吧 util/Quest.php -p entry 小雪 如果乱码就加上 -c gbk 试试