搜索

大约有 70 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2902秒)

31.编写第一个配置文件

...为了按版块检索,我们必须对它进行索引,而它也需要分词,所以分词器用内置的 `full`。 - `tid` 内容也是数字的主题ID,我们暂考虑按主题搜索,所以需要索引,也没有排序等要求,所以 只要当作普通字段存储下来即可...

32.xunsearch-1.4.8 (基于 xapian+scws 的开源中文搜索引擎,小问题优化改进)

发布时间:2013-12-11 15:12 t By hightman

...代码兼容性 2. 增加用户案例文档:USERCASE 3. 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 4. 升级 libevent 到 2.x 版 5. 修正中文 stopwords 生效的问题 6. 取消恼人的 NODB(S#506) 错误提示 7. 新增获取文档匹配词表的接口 X...

33.在 Xunsearch 使用 SCWS

...在安装完 `Xunsearch` 后可以通过服务端内置的 scws[1] 实现分词, 而需要另外再安装 scws 的 php 扩展。从 `1.3.1` 版本起,`Xunsearch` 的 PHP-SDK 中加入 [XSTokenizerScws] 类,可通过搜索服务端执行分词功能。 用法简单说明 ---------- 这...

34.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压死锁)

发布时间:2013-03-28 12:03 t By vus520

...现在的问题是想通过XSTokenizerScws来获取指定文本的自定义分词结果。sdk使用了github里最新的版本,词典格式由一楼所示,现在取出来的结果并包含任何自定义词典的关键词,求解。[/code] [php] $text =

35.一点疑惑

更新时间:2013-11-09 15:11 t By 子不语

...据是12345678 我搜索345却也能出结果!为啥?? 默认的分词行,:huh::huh:我用csv导入的 中文全都可以搜索和显示出来 [id] type = id [user] index = both tokenizer = full [q] index = both tokenizer = full [w] index = both tokenizer = full...

36.www.adminlink.net.cn上的xunsearch案例

更新时间:2011-12-08 12:12 t By adminlink

首页说下我为什么安装中文分词和全文搜索。 就是因为提取出更多的页面,让搜索引擎蜘蛛没完没了的爬,达到网页聚合的目的。这样做我估计对优化很有帮助。 选择scws的原因是比较了几个中文分词后,感觉scws是一个错的...

37.xunsearch-1.0.0 正式版

更新时间:2011-09-30 14:09 t By hightman

... C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 500 万网页大约 1.5TB 的数据中检索时间超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支...

38.最新的主要变动

...化代码兼容性 - 增加用户案例文档:USERCASE - 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch:...

39.刚开始使用,项目编码与时间戳问题请教

更新时间:2012-07-05 11:07 t By xilin

...sw,但是知道有xunsearch,当时公司使用的是zend lucene和scsw分词,速度相当相当慢,查询总数5万条左右的记录要2秒以上。现在想换xunsearch试试

40.自定义词库如何使用?

发布时间:2013-05-12 11:05 t By hq22

网页设计 分词后变成 网页设计 网页 设计 我想把网页设计就分为网页设计一个词,需要搜索出含有网页跟设计的内容。 我在dict_user.txt加入 网页设计 这个词,好像并没有效果,还是搜索出来含有网页跟设计的文档。

  • 时间不限
  • 按相关性排序