1. un 是 unknown, 如果需要你可以自己添加一个”LG集团“的词,这样它会被当作一个整词。 通常 un 是指不存在于词库中的字词,对于你这个情况,你可以修改 libscws/scws.c 第 680 行把 attr_un 改为 attr_en 即可,如果需要严格一点可...
Hi Hightman, 您好! 非常感谢您做的scws分词和xunsearch系统, 最近我们在做网站的搜寻服务, 考察了coreseek, sphinx-for-chinese 和 xunsearch 这三个系统, 觉得还是 xunsearch 比较适合, 因为词典制作和查询的方式都较另外二者灵活. 在今天做...
目前稳定版本:xunsearch-1.4.7,运行稳定功能强大,越来越多的用户采用 xunsearch 定制开发自己的搜索引擎。本贴子长期收集各种经典案例,不论网站名气和流量,只看 xunsearch 开发效果好与坏。 其它用户的案例可以回贴告知我们...
CWS_cli.php - 命令行分词, 读取标准输入 CWS_query.class.php - PHP 访问 cscwsd 的类库 CWS_file.php - 针对文件分词 CWS_test.web.php - 网页测试 [code] cscwsd-0.0.x (PHP版查询交互程序示例...
[quote='hightman' pid='3660' dateline='1280994053'] 这有什么关系呢,AT为NULL时返回0也合乎情理啊。 [/quote] 但是这跟文档的描述有出入啊。 [quote] ·int scws_has_word(scws_t s, char *xattr); 描述:判断text中是包括指定的词性的词汇。参数 xattr ...
...通过以下方式之一取得源代码: ~~~ git clone git://github.com/hightman/xunsearch.git git clone https://github.com/hightman/xunsearch.git ~~~ 如果要编译安装这份源代码,您还必须在主机环境上安装相关的 autoconf, automake 工具,然后运行 下面指令完成...
是不是你启用了 beginRebuild() 却没有 endRebuild() 关闭它? [quote='deling007' pid='1091' dateline='1346655726'] $index->flushIndex(); 或 php Indexer.php --flush -p /var/www/xunsearch/goods.ini 用过后队列数还是没有改变,索引还是没有增加进去,仿佛就...
[quote='mengfanchao' pid='216' dateline='1321349008'] 我晕,要不影响我提问干吗。我用 date 格式化它,显示的是 1970什么的。 [/quote] 直接传给 date 就可以了,不要试图进行 intval 要用就用 floatval 或直接 (float) $var
不会啊,你搞错了吧
...的搜索,所以打算全部的搜索配置都使用utf-8[hr] 很感谢 hightman,很早以前我用了scsw,但是不知道有xunsearch,当时公司使用的是zend lucene和scsw分词,速度相当相当慢,查询总数5万条左右的记录要2秒以上。现在想换xunsearch试试