[quote='hightman' pid='4418' dateline='1375253668'] 模糊搜索和空格不冲突吧。你单词内模糊就行了,比如按3个字母为单位建立? [/quote] 非常感谢! 我刚试了下,针对我的需求来说,对于人物英文名以3个字母为单位建立索引的确可...
...要是自己知道的也太少了。但是最终都解决了。主要还是hightman的大力帮忙啊。再次感谢了。 tags提取页面 [url]http://www.adminlink.net.cn/detail_187327.html[/url] 搜索tags就看到了。 有很多这样的详情页都用到了scws来提取tags. 提取到了tags...
[quote='hightman' pid='8850' dateline='1416191543'] --clean 不要和 --source=csv 同时使用啊 --source 仅在导入数据时采用。 [/quote] 謝謝了,問題一下子就解決了! 还有一个问题想要请教哥们: 现在需要对一批中文的文本文件建立...
[quote='askie' pid='246' dateline='1321857874'] getCorrectedQuery() getHotQuery() getRelatedQuery() 这三个均无法获取到结果,返回的均是array() 请问hotquery按照type=total是不是只要搜索1次就会有结果?还是这个统计结果是有阀值的,例如搜索50次才会...
看了提示是卡在 check library,也有可能是 m4 之类的不兼容,汗。。。手上没有BSD8.1还测不了,autoconf系统的工具兼容性很讨厌。
1. 多一个T是哪儿,我没看明白。 2. 你的错误是因为你用错误词了,48.php 是针对UTF-8的,而你调用了gbk的词典,把你的词典语句改为 dict.utf8.xdb 即可 3. dict_extra.txt 也必须是UTF-8编码 4. 删除词条,因为陈凯歌其实可能是因为人...
[quote='hightman' pid='17' dateline='1316280485'] ob_flush(): failed to flush buffer. No buffer to flush.(8) 多谢汇报,这是因为在UTF-8状态不会启用ob_Start做转码,下一版修正。 [/quote] 呃 b2的这个位置 我使用gbk编码连接centos的后解决了输入问题...
试试在 phpext 目录的 configure 运行前 export CFLAGS="-O2 -DZTS=1"
[quote='hightman' pid='562' dateline='1330199583'] 不会的啊,默认就是-M3呀 [/quote] 如何设置成其他的值呀 最近的一个项目需要全部的单字 在项目的ini里,tokenizer = default 如果是3的话 不知到如何改成11 是否是使用xlen(1) 来设置?这个xl...
HI,hightman $cws = new PSCWS4('utf8'); $cws->set_dict('etc/dict.utf8.xdb'); $cws->set_rule('etc/rules.utf8.ini'); $ret = array(); $ret = $cws->get_tops(10,'r,v,p'); echo "No.\tWord\t\t\tAttr\tTimes\tRank\n------------------------------------------------------\n"; $i = 1; foreach ($ret as $...