...典有问题,重新下载解压就好了,谢谢管理员 另外这个分词效率和效果都不错,我会向别人推荐的~ [quote='hightman' pid='5070' dateline='1383632500'] 全是 /un 应该是词典不工作。这个词库应该是不依赖机器字节序的啊 TXT没有提供下...
我在自己的网站上使用scws做分词,当文章中有类似PC-BSD之类有连字符的英文词时,都分成类“PC - BSD”,但这是个软件名,本不应分开,英文中加-号的一般都视为一个词,按理说不应分开的,有什么方法解决吗?
...你这段字是用空格或逗号分隔,那么你可以用 split 这个分词器啊。 搜索的时候搜索任何一个分割后的TAG都可以搜索到。 [/quote] 呵呵,管理员没听明白楼主的意思,他希望xunsearch能提供分词接口,给其他程序使用。 我们经...
...。 如,一篇文章标题为:我是中国人,假设该文章id为1 分词后,有'中国',‘中国人’,如果每个分词有唯一的id对应,假设‘中国’=》1,'中国人'=》2 那么保存关联就成了 1(文章id)=》1(词组id) 1(文章id)=》2(词组id) ...
想在搜索的时候,关键词按照自己的意愿来切分应该是要怎么做? 文档里看到有个自定义词库的设置,然后根据文档使用了下,发现没达到效果。比如说,我想搜索拥有"味道恶心"这个词的文章,(我的文档库里面是有相关文章的...
...库,(测试用的,只放2个词在词库), 然后对这句话进行分词“我爱喝南瓜汤,番茄汤”进行分词, 希望得到结果 我爱喝(未被分词) 南瓜汤(分词OK) , 番茄汤(分词OK) 可是结果什么都没显示。 $so->set_dict("d:\test.x...
...项目。。 -________- 。。 最近有个PHP项目需要用到中文分词。。辗转很久来到了这里。。 在本机安装也很顺利,。 不过。。编码用的UTF8 按照文档里面的demo也自己做个小东西。。试试。。。 然后。。 $words = scws_get_words($...
...情况,在本地,我测试了一下,程序没半点问题,能正常分词 我用FTP传到服务器上,却不行了 说明一下:所有文件编码都GBK,但是传到FTP上,用浏览器打开,却成了UTF-8的编码了,显示出乱码了! 不管怎么去设置,每次打开...
用了网上的演示,这个分词系统挺好用的.但是本人是PHP新手,使用win7平台,hightman大侠提供的好像是一个中文分词引擎,不知道怎么直接在我的php空间上激活。请问我自己要怎么实现演示页面的显示效果呢?