...用txt文本,参数使用SCWS_XDICT_XDB,也不会有问题。 图片在附件中! [hr] 因为我这边是将scws的源码直接加入到我的C++工程代码中的,所以可以直接看到递归堆栈溢出的地方。在这边给开发者看看这个是不是BUG。
使用了自定义字典。完全忽略自带的字典。 然后我在字典里面 分词 : 北海365 365 就这两个词。 然后我 搜的时候 是 : 北海365 这时候返回的分词 却只有: 365 “北海”不见了 如果我启动系统自带词典 那么“...
...到,只是希望排序靠后)。 demo中的案例使用没有问题,在实际开发中,发现没有起作用,估计是配置差别导致。经过反复对比,确定和字段的分词策略设置有关。 起初对于分类id这个字段,我认为设置成type=numeric index=full就行...
把 libscws/xdict.h 另存为 ansi 就可以了,我打包的是 utf-8 ,真是诡异。scws.c 就没事
...站原有的词库太大,而我做的东西只希望分出我想要词,在我定义范围外的就不分, 我定义了个词库,可是一用这个词库,就分不出来,数字和英文除外。 比如我定义“南瓜汤”,“番茄汤”作为一个词库,(测试用的,只放2...
...枪王”.....。但是系统分成了”枪“、”王之王“,显然在查询的时候用户很有可能只是输入”枪王“作为关键字。而我自己的系统是不查询单字的。在自定义字典中又不知如何操作。毕竟感觉三个字的词在自定义字典中起了作...
我现在总结一下我目前还存在的问题 首先,步骤我都是按官方的说明来做的,然后下载官方我的演示程序(源代码另存为)。 UTF-8版本的一直不成功,分词结果就如我最开始的截图; GBK版本的在保存文件的时候选择文件编码为...
我按这个页面http://www.ftphp.com/scws/docs.php上写的方式安装,但是我不知道scsw.so安装完后位置在哪,所以extension = scws.so这行不懂的怎么写,对linux不太熟,公司的linux好像是rhes4的吧[hr] make install有提示,知道了
...熟WIN平台,但有提供源码,如果你会弄就帮弄一下我可以在发布包中一并提供。 像你这样的情况因为“沈阳若”被识别为姓名了,这是一种比较难以决断的岐议,要说分成“小”“沈阳若”在美国语法上其实也是通顺的。 我...
最近在搞分词相关的毕业设计 是C++开发的 想用大神的SCWS 把LIBSCWS编译成DLL来供我自己的程序调用 但是在WINDOWS下编译老是过不了 给的VC++6的项目也编译不成功,希望大神能指教下怎么在windows下编译