scws.h也有问题 struct scws_topword { char *word; float weight; short times; char attr[3];//原来是2 scws_top_t next; }; 应该跟以下结构一致。 struct scws_result { int off; float idf; unsigned char len; char attr[3]; scws_res_t ne...
我看了一下,有点晕乎乎,不知道哪个是最新的 我想要一个php下的简单分词的实现, 词库用mysql效率高还是cdb高?
关于has_word, 不是很明白你的意思, has_word 用于检测当前文本中是否包含这些属性的词。 scws_get_words 是按词性返回分词结果,标点的词应该默认应该是 un 或 # 之类可以自行排除。
...ension 联合在一起作为路径,你说该怎么设? 此外 $so = scws_new 怎么可以再用 scws_set_dict 呢?应该用 $so->set_dict(), 类运用和函数运用不要混合着乱用!!多看帮助说明上的例子,不懂不要改先就照抄。
原先有计划要移到google code上,可是发现 scws 这名字被人给注册了。。。:(
请问scws分词如何分出“四个字的词”呢? 目前只要超过三个就被拆分成两个,比如我要拆分 “2013春夏汽车新款” 中“2013春夏”怎么弄呢? 词典中我添加了“2013”、“春夏”、“2013春夏”,就是拆分不出“2013春夏”。求...
请问scws分词如何分出“四个字的词”呢? 目前只要超过三个就被拆分成两个,比如我要拆分 “2013春夏汽车新款” 中“2013春夏”怎么弄呢? 词典中我添加了“2013”、“春夏”、“2013春夏”,就是拆分不出“2013春夏”。求...