[quote='hightman' pid='4060' dateline='1296558618'] 少量加几个不需要优化。。。。甚至加千把个万把个也可以不优化呵。 可以等待到比较稳定时再集中优化一次。 [/quote] 好的谢谢!
如果我每次都只叠加一点点词语 估计就5-6个是否每次叠加完成都要执行 $xdb->Optimize();函数? 因为执行这个$xdb->Optimize();要等很久... 能不能周期性的优化? 就是新加的差不多数量了比如100个了就手动执行一次$xdb->Optimize();? ...
这个如何使用的说... 能否写一个简单的添加文本文件输出db文件和设置字符集utf8的例子... 多谢...
[quote='NCT' pid='4108' dateline='1299895804'] 咋木人回复啊? [/quote] 嘛~这个就不用这么复杂你完全可以导出TXT修改在创建合适的数据库 查查资料 你可以解决的
[quote='zfzeng' pid='4086' dateline='1299162416'] 下下来只有100多k,解压也是空的,麻烦看下啦 [/quote] 重新下载 我这里没问题的说~
我电脑APACHE+PHP 4GB内存 E6300处理器 PHP简易中文分词(SCWS) 第4版(GBK) 在我电脑上用你默认的分词内容"陈凯歌并不是..." 第一次0.8xxxs 第二次0.098711013793945 而你们演示的就快多了 0.0039410591125488 为什么差距这么大?
[quote='hightman' pid='6577' dateline='1309234009'] 文本词典格式,文档多处有提到吧 每行记录包含以下字段 \t\t\t 工具 用法可以 ./gen-scws-dict -h 查看 [/quote] -h 看过.. 不太明白命令规则..
Notice: Undefined index: part in \Putdata.php on line 140 Notice: Undefined index: tf in Putdata.php on line 141 Notice: Undefined index: idf in Putdata.php on line 141 Notice: Undefined index: attr in Putdata.php on line 141 140:if ($v['part']) $flag |= 0x02; 141:$data = pack('ffCa3'...
...索底部大量的运算,对CPU的要求也必不可少。但在 CACHE HIT之后前2者的压力就小了。 XS是多进程+多线程混合的,每个进程下面有一个线程池,每一个搜索请求实际上对应的是一个线程,多进程只是为了平横请求。
[quote='hightman' pid='4112' dateline='1300085069'] 是PSCWS本身慢,要用DLL的才快一些 [/quote] dll也想用不过种种原因的约束所以只能用PSCWS的版本 话说...用官方的xdb比自己创建的xdb快许多...官方那个xdb速度虽然足以...不过没有许多词语.....