正确写法,官方多写了一个T吧,那个代码反正我试验是错误的! [php] $cws->add_dict(ini_get("scws.default.fpath").'/dict.xdb'); $cws->add_dict("./dict_extra.txt", SCWS_XDICT_TXT); [/php] 在说说词分词测试: 我的网址:http://sjz.haojishu.com/tools/222.php...
...基础技术,中国的信息化建设要达到国际水平,分词技术一定不可以少的,一定要有很多的具有奉献精神的有志之士共同努力,hightman就是我学习的榜样:)
这是正常情况,分词的机制决定的。通常讲,搜索单字是不有意义的,一定有这个需求的话需要自己修改分词引擎让它支持拆为单字。 具体看 XSTokenizerScws 这节,可以自行扩展然后通过 setMulti 方法索引单字
系统装了ZendOptimizer,再装apc有冲突,爆502错误,上网查询后是说ZendOptimizer和apc不兼容,一定要装apc吗,能否用ZendOptimizer代替,从系统配置上说用哪个好。
多谢汇报,根据词典机械分词存在一定的误分率。 因为该词典从互联网信息为主要语料进行取值,故可能存在一些错误,只要将词典中的 年高 词频调低即可。 若不方便改词典可以加一个文本词典,并将 年高 词频减低。
有时间在这篇文章中的一些引人注目的点,但我不知道如果我看到他们中间的心。可能有一定的正确性,但我会采取保留意见,直到我把它看得更远。好文章,感谢和我们想额外!添加到Feedburner的作为正确
既然有php扩展,为什么不推出一个php+mysql版本的,把词库放在mysql中,这样可以更方便我们对词库的扩展和管理,更加降低入门门槛,对scws的发展也会有一定的帮助。
...用层做了缓冲1024字节,每次超过1024字节时候才发送,有一定改善效果。但是在xs.php中的search则是每次读取一个字段,从而引发每秒钟数万次读取网络数据的io操作
配置文件作了修改后,测试代码不一定重新生成,但索引必须重建。 从你发的命令看,本身没有任何问题,你说的能成功,第一个不行是什么意思?最好能搭配发出你的INI配置和数据库内的实际内容。
....wang AT gmail.com 希望您能给我帮助,谢谢了。 P.S. 做事有一定的目的性,学习这个,一是个人爱好,二是我把它做成毕业设计题目。希望您能帮助我学懂这个。Thanks