搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1963秒)

91.复合分词的级别"multi" 可以设置分词的长度吗?

发布时间:2012-07-19 11:07 t By calvin

... header("Content-type: text/html; charset=utf-8"); var_dump(SCWS('中文分词解析,我的个神啊')); //中文分词解析 function SCWS($title) { set_time_limit(0); $data = array("data"=>$title,"respond"=>"json","ignore"=>'yes', "multi"=>3); $data = http_build_query($data); $re = w...

92.RE: 怎样才能 字母数字汉字组合 按照词典分成一个词语呢?

更新时间:2013-07-03 11:07 t By shuyinglee

...负有心人,成功的避过了中英文混合,使用字典中的词语分词,我用的是 scws-1.2.1.tar.bz2 这个版本,因为不能发附件,如果大家需要联系我: Email: shuyinglee@126.com[hr] 使用方法: 1.To patch tar xfvj scws-1.2.1.tar.bz2 cd scws-1.2.1 patch ...

93.关于扩展词库的问题

发布时间:2010-06-02 10:06 t By hide3088569

我使用的版本是1.1.2 使用了复合分词且只用了【最短词】来复合 假定我的扩展词库中有:【球面抛光机】、【冰包餐桌】 没有扩展结果分别是: 【球面抛光机】 -> 球面、抛光机、抛光 【冰包餐桌】 -> 餐桌(idf:6.19) ...

94.RE: 求救 强制单字搜索 解决方法

发布时间:2012-02-23 13:02 t By hightman

分词并不影响一字歌的搜索。只要库内有那个“词”。 比如:陈百强-不.mp3 这样分词结果是 [color=red]陈百强 陈百 百强 不[/color] 这样搜索”不“,搜索”陈百强“,”陈百“,”百强“都可以搜索到,怎么会不能搜索单字呢...

95.RE: 请问一下,xdb与txt词库那个读取效率更高

更新时间:2013-06-29 23:06 t By 阿弟2013

我举个例子吧 下面是用csws分词结果,明显csws把email,网址给拆开了,还有标签没有去除,但是中文词是正确的分开了 postgres=# SELECT to_tsvector('zw_simple','pgsql中国社区论坛 http://www.pgsqldb.org:8079 chenaishen@263.net'); ...

96.删除和添加一些新词

发布时间:2013-08-01 11:08 t By kimiduan

...仅为微软创收8.53亿美元,甚至不抵库存调整费用”进行分词结果是“Surface/en 上一/nz 财/n 年仅/n 为/v 微软/nz 创收/v 8.53/en 亿/m 美元/q ,/un 甚至/d 不/d 抵/v 库存/n 调整/vn 费用/n ”。我在dict_extra.txt中添加了“财年 11.82 12.38 n”...

97.编写第一个配置文件

...为了按版块检索,我们必须对它进行索引,而它也不需要分词,所以分词器用内置的 `full`。 - `tid` 内容也是数字的主题ID,我们暂不考虑按主题搜索,所以不需要索引,也没有排序等要求,所以 只要当作普通字段存储下来即可...

98.获取搜索结果

...的部分进行飘红或加粗等高亮处理, 由于其中涉及到了分词等细节处理比较麻烦。因此,我们统一提供了 [XSSearch::highlight] 方法,可以对搜索结果文档中的字段值直接进行处理,匹配关键词部分会自动套上 `em` 标签。 您只要在...

99.http-scws(基于scws的http协议中文分词) 更新至2.0版

更新时间:2011-06-27 20:06 t By smallevil

...只需一个命令即可使新词库生效 4.最大150K文本提交 5.可分词、提取高频词 6.支持GET与POST方式 7.支持短词、二元、主要单字、全部单字(基于scws功能) 8.支持标点过滤(基于scws功能) 简单测试结果: AMD 64位台式机四核CPU,程...

100.开发规范

...,请自行编写 代码和定义时不要也以 `XS` 开头。 自定义分词 --------- Xunsearch 在项目配置时支持针对某些字段自定义分词。每个自定义分词功能单独使用一个 文件名,命名为 `XSTokenizerXyz.class.php`,其中 `Xyz` 是您自己的分词名称...

  • 时间不限
  • 按相关性排序