确认问题是出在包含xs.php那段代码里。 使用自动生成的搜索骨架代码,访问search.php出现页面载入出错 。连接被重置 载入页面时到服务器的连接被重置。 // 加载 XS 入口文件 require_once '/home/who/xunsearch/sdk/php/lib/XS.php'; 这段包...
...tman.cn/demo/scws/v48.cht.php[/url] [README 文件说明节选] SCWS 是 Simple Chinese Words Segmentation 的缩写(简易中文分词系统)。 它是一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的 切分成词,因为词是汉语的基...
想请教下,假如我开启复合分词,在返回的分词结果里怎么区分哪些是复合分词的结果,哪些是平常的结果? 比如我对“中国人”分词,返回中国+人+中国人,怎么单独提取复合词 中国+人呢?
[quote='hightman' pid='5178' dateline='1385104298'] 是什么类型都 无所谓,每个字段都是一个值或一组值啊 [/quote] 额。。。。。。。。 一组值的话怎么搜索? 又是怎么组织的
[quote='hightman' pid='3722' dateline='1284865451'] 你说的是哪个包解开是空的啊,是软件包还是词典,谢谢 [/quote] 刚才又下载试了下,1.1.3的软件包没问题了,但是utf8的字典包还是有问题,下下来只有100多k,网站上标明有3M多的
subject 是 FULL 的?FULL的话视为布尔字段了所以不会记录到日志中。 我建议你另外开辟一个字段,内容可以和该字段一样,但索引方式不一样来处理。有所冗余,但也是目前最简便的办法吧
目前我的%wa特别高 机器是做的RAID10 按理说已经和SSD差不多了。。 CPU资源绰绰有余 是否和app下的配置文件设置有关?两个字段{混合区索引}其中一个题标一个是内容 另外还有两个{字段和混合区索引}都是字符型 如果把这些字段...
这个错误应该是 fsockopen() 抛出的,以前有人问过。 多数是因为 SELinux 或 安全模式的 PHP 运行方式,或 php.ini 禁用了 fsockopen 导致的
呃确实存在,这都跟这个词库有关系,是互联网上整理的词库,像“法上”居然是专有名词而且权重很高。。。 可以考虑删除“法上”这个错误的词,外挂一个文本词典把“法上”标记为删除或设成更低权重及词性