搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.4898秒)

111.搜索分词只希望第一层怎么办?

发布时间:2014-05-11 00:05 t By dashzhao

因为我的项目是电商网站,所以我自定义了一个词库,把我自己的品牌、商品类目名字给加进去了。 我希望是这样的搜索结果,比如搜索“迪卡侬蓝色货品”: 现在是这样的: [code]Xapian::Query(((迪卡侬:(pos=1) SYNONYM (迪卡:(po...

112.RE: 为何导出txt,里面内容动在创建XDB之后速度变慢很多很多

更新时间:2011-03-13 02:03 t By hit

...用的那种 于是就这样我用小工具创建的XDB比官方下载的分词速度慢 演示版的那个分词 0.06s 用我创建的XDB就到 0.09-0.1s了 我觉得比较奇怪~~ 一切都是按说明操作的 还有xdb没有增加新的词语和减少词语用的官方XDB导出的TXT

113.RE: 搜索总是准确

发布时间:2012-10-25 11:10 t By benq81

我看楼主现在的搜索挺准确的啊,是自己加了分词吗?还是别的办法~

114.RE: 搜索总是准确

发布时间:2012-10-25 13:10 t By hightman

[quote='benq81' pid='1380' dateline='1351136388'] 我看楼主现在的搜索挺准确的啊,是自己加了分词吗?还是别的办法~ [/quote] 当时给他建议后添加了自定义词汇,药到病除。。。

115.为什么提供历史版本的下载呢

发布时间:2011-09-15 14:09 t By yelp

如题,为什么提供历史版本的下载,比较喜欢1.1.2版本的,分词效果感觉比1.1.8要好,希望能提供下载地址。

116.遇到一个分词错误的问题

发布时间:2014-02-08 16:02 t By robinjia

...j ? /un 后来发现可以通过修改rule.utf8.ini里的规则来调整分词结果,知道有没有更好的办法?

117.RE: 搜索建议提供的词相关性

发布时间:2013-05-13 15:05 t By hightman

默认是拿分词结果当初始值的。。。

118.Libscws C API 使用说明

更新时间:2010-12-30 22:12 t By hightman

...33cc]0. 概述[/color][/size][/b] Libscws 代码是当前 SCWS(简易中文分词) 算法使用C语言编写的链接库,目前仅基于 Unix 族的操作系统,可能必须适当修改才能运行在 Windows 平台中。这套 scws 库没有外部扩展依赖,代码力争简洁高效,针对...

119.RE: small50,big161这种词汇搜索

发布时间:2013-06-18 11:06 t By hightman

@FIXME: 先记录一下,这是因为你既是自定义分词器又指定了 non_bool 参与权重计算。 那么 SDK 端先按自定义分词器拆分重新组合成查询语句,发送到 xapian 解析器时由于是 boolean prefix,因此它又会调用内部切词法再次切割。 简...

120.2007简易分词第4版(scws-0.1.x)体验

发布时间:2007-06-06 11:06 t By hightman

...专名自动识别,也支持UTF-8/GBK等同字符集。经评估测试分词准确率在 95% 左右,召回率有 92% 以上。 这套程序的开发其实很早就开始做基础工作了,持续时间和耗费精力都相当大。开始全部采用纯 php 代码编写,功能基本实...

  • 时间不限
  • 按相关性排序