[quote='hightman' pid='3711' dateline='1284628104'] pscws2,3和scws-的词典不是共用的~~23用里面自带的那个旧词典才行。 [/quote] 我用的就是pscws23-20081221.tar.bz2这个包里边的字典。我单独写一个事例没的乱码,但加入ecshop了就有乱码了。
[quote='hightman' pid='3291' dateline='1248583748'] [quote='etbobhwang' pid='3283' dateline='1248344366'] PHP Fatal error: Allowed memory size of 536870912 bytes exhausted (tried to allocate 1046898225 bytes) in /var/www/html/search/dict/xdb.class.php on line 638 我也碰到同樣的問題,換...
我的词典里有 内衣、保暖内衣这两个词,我对语句“我的保暖内衣”进行分词的时候,只能分出来最长的“保暖内衣”,确没有分出来“内衣”,不知道问题在哪里? 另外一个奇怪的问题,我用官方的词典,里面也有这两...
...因为你用错误词了,48.php 是针对UTF-8的,而你调用了gbk的词典,把你的词典语句改为 dict.utf8.xdb 即可 3. dict_extra.txt 也必须是UTF-8编码 4. 删除词条,因为陈凯歌其实可能是因为人名关系导致切成词,可能会不受词典影响 5. 如果...
... 斯 蒂 芬 [b]罗铭 罗 铭 罗[/b] 大大 大 大 罗 我的自定义词典为: 铭罗 1 0 n 罗铭 1 0 n 我的原意是想分出我的词典中所有的单词:“罗铭” “铭罗”,但加入到自定义词典后,却完全没有了“铭罗”这个词。 问题2...
...拆分 “2013春夏汽车新款” 中“2013春夏”怎么弄呢? 词典中我添加了“2013”、“春夏”、“2013春夏”,就是拆分不出“2013春夏”。求教啊!!! 另外官方自带的词典的四个字词语可以完整的分词,但我扩充字典后,就无...
...拆分 “2013春夏汽车新款” 中“2013春夏”怎么弄呢? 词典中我添加了“2013”、“春夏”、“2013春夏”,就是拆分不出“2013春夏”。求教啊!!! 另外官方自带的词典的四个字词语可以完整的分词,但我扩充字典后,就无...
...pian的queryparser中了,我想直接加入新的 scws_add_dict 把我的词典搞进来就行,不过没看到文档有描述词典格式的
你可以正常分词试试,然后打印一下词的 attr 属性到底是不是* 号 我估计是不是你自定义词典先于默认词典加载,导致attr属性被覆盖了?
...。它为中文而编写,支持 gbk 和 utf-8 字符集,适当的修改词典后也可以支持非中文的多字节语言切词(如日文、韩文等)。除分词外,还提供一个简单的关键词汇统计功能,它内置了一个简单的算法来排序。本扩展内部直接绑绑...