...差距有多大?xdb格式没有装入内存,只是在分词过程中去词典文件中查找,每一次分词都要read一次磁盘。xdb全部装入内存采用xtree结构存储,28万词典会占用多大的内存?
...注意此 dll 文件仅是分词引擎,并不包括分词规则文件和词典,请从已发布的 scws-pre 版本中提取词典和 rule 文件。
... 扩展文件很小,调用php函数时候必须使用set_dict才能加载词典 但是有的服务器编译后感觉字典也被编译进去了这是怎么回事,即使不需要set_dict也可以分词 另外这种情况下,set_dict感觉和add_dict一样,我的词典和编译进去的那...
我郁闷了。自己定义的词语调用到了,规则调用到了,词典还是没调用到! 我的词典路径肯定没错!! 但是还是调用不到啊!![hr] 现在是这样的情况,在本地,我测试了一下,程序没半点问题,能正常分词 我用FTP传到服务...
...页显示编码也是用的gbk。 然后我用记事本打开XDB 格式的词典文件dict.xdb,效果如下: XDB"/B ? ?? 悯H@ % G ! ? ! p # Z # ! ? # ? ) ? ! ? ! ! ? % ? ! ? ! ;* # P- # -0 ! ? % ? # ? # 5= # A ! 鰾 ! tG ! bJ ' ㎜ ! 頝 # 稱 ! zT !...
词典没配好吧 有没有在 ini_get('scws.default.fpath') 下面放置词典和规则集文件呢?
\n 才是换行。 \r 是回车。 解析词典是按换行标记来的。
[quote='etbobhwang' pid='3283' dateline='1248344366'] PHP Fatal error: Allowed memory size of 536870912 bytes exhausted (tried to allocate 1046898225 bytes) in /var/www/html/search/dict/xdb.class.php on line 638 我也碰到同樣的問題,換一台主機依舊有問題 謝謝 ,問題是 638 ...
...这些我也都照做了。 建立一个本地目录放规则集文件和词典文件,建议使用:C:/program files/scws/etc 从 scws 主页上下载词典文件,解压后将 *.xdb 放到上述目录中 词典系列:http://www.ftphp.com/scws/down/scws-dict-chs-gbk.tar.bz2 ...
这个工具是基于作者的工作的一点点扩展,我不是本项目的开发人员,仅仅是因为需要使用这个功能在我的网站上而基于hightman提供的代码的修改,现在返回给项目,希望更多的人能有用。 原因:我希望给网站提供分词功能,...