搜索

大约有 732 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1960秒)

141.RE: 在windows下使用检测工具得到warning的解决方法

发布时间:2012-03-05 10:03 t By hightman

可以用 php -i | grep ini 就可以看到当前命令行所采用的 ini 文件的路径

142.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具!!

更新时间:2009-07-26 12:07 t By hightman

...過 1gb 我有看到 gen_dict.c 但是是有有繁體utf8的 dict.txt 可以讓我自行編輯 麻煩 hightman 大大 [/quote] 这样的错误可能是运行的平台的字节序不一样或者.xdb文件已损坏所导致的. 我发一份我这边正确导出的词库吧.(你可以从附...

143.RE: 建议用户能设置数字不分词

更新时间:2013-06-18 14:06 t By hightman

这是分词的策略问题,这种情况可以自定义分词器来补充。。。 将你的词复制到 [url]http://www.xunsearch.com/scws/demo/v4.php[/url] 进行实测,分割结果为: E14188m E14188 14188 14188m 那么搜索以上4个词都是可以搜索到的,至于你从中提取 e...

144.有没有添加单个或多个词的函数?

更新时间:2010-07-28 18:07 t By backluck

正如之前的帖子描述,scws_has_word这个函数可以用来检测非法词。当前我的项目中禁止词是放在数据库里面(为了方便增删改),如果每次加载词典都要把禁止词写到临时文件,然后添加,觉得有点过于麻烦。是否可以提供添加...

145.RE: 塔里木河的分词问题

更新时间:2013-06-09 13:06 t By wlx

...索引,重启服务,但搜索结果依旧。 好像没有起作用。 可以到 http://www.heihedata.org/search/ 搜索试验[hr] 可以先搜索塔里木,然后再把模糊搜索打开,结果差别很大

146.同义词搜索

... 它们都必须是独立的词汇,也就是最小的索引单位,不可以是多个词组成的短语。 > tip: 独立词汇的意思对于英文来说就是一个单词,对于中文来说必须是 `scws` 词库中的一个词。 > _Xunsearch_ 的同义词不同于 _Xapian_,会智能进...

147.RE: 我想使用系统自动的分词功能,可是只看到有接口

发布时间:2011-11-28 10:11 t By dancebear

这个自己编译下csws的扩展就可以了。他已经带了csws的。去csws的目录里编译下PHP的扩展就可以了。

148.高手们请进关于xunsearch的英文搜索的问题

更新时间:2013-06-17 19:06 t By jeanx

xunsearch能否实现类似mysql like这种模糊搜索? 比如用户只搜索 xunsea 同样能搜索到含有 xunsearch 的内容,搜索的字段属于标题类型的,单条数据量不是很大 如果不可以有什么高效一点可以替代mysql like的方案吗?

149.索引管理器

... 导入索引支持数据源包括:`csv, json, mysql, sqlite` 等,也可以自定义数据源。 运行脚本工具的 --help 选项可查看内置的帮助和说明,如乱码可在选项后加入 -c gbk 试试。 ~~~ $prefix/sdk/php/util/Indexer.php --help ~~~ 主要参数和选项 ------...

150.RE: 关于词频的解释

更新时间:2013-04-15 11:04 t By hightman

加大,前门,缩小,从前 不过这个是词性关系,可以考虑增大 p(1) + n 的权重。 在 etc/rules.ini 和 etc/rules.utf8.ini 的 [attrs] 后方加入 p(1) + n = 5 即可 我们的DEMO已经更新,[url]http://www.xunsearch.com/scws/demo/v4.php[/url] 您也可以参见我们...

  • 时间不限
  • 按相关性排序