搜索

大约有 30 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0063秒)

11.SCWS不支持英文和中英文混合分词吗?

更新时间:2010-08-24 20:08 t By fuhehe

我现在想要做屏蔽词,只载入定义的屏蔽词库,但好像英文及中英文混合分词都无效。 譬如: $so = scws_new(); $so->set_charset('utf8'); $so->set_dict('words.txt',SCWS_XDICT_TXT); $so->set_ignore(true); $so->send_text("GMhello指导员"); echo ''; while ($tmp = $so...

12.RE: 批量分词问题

发布时间:2010-06-06 11:06 t By hightman

希望能附上完整的PHP代码以及你的定义词库,以做分析和测试。 从上面少结果的看,应该是词库不生效,而结果只按人名规则合成了2个人名,其它的按无效字符过滤。

13.搜索分词只希望第一层怎么办?

发布时间:2014-05-11 00:05 t By dashzhao

因为我的项目是电商网站,所以我定义了一个词库,把我己的品牌、商品类目名字给加进去了。 我希望是这样的搜索结果,比如搜索“迪卡侬蓝色货品”: 现在是这样的: [code]Xapian::Query(((迪卡侬:(pos=1) SYNONYM (迪卡:(po...

14.RE: [HELP]xunsearch安装好了,搜索没有结果集。。。

发布时间:2011-10-26 15:10 t By vist2007

...有提供scws的api接口,实现短语分词功能 2.是否可以对scws定义中文词典,方便扩展

15.RE: 搜索分词只希望第一层怎么办?

发布时间:2014-05-13 02:05 t By dashzhao

http://bbs.xunsearch.com/showthread.php?tid=2141&pid=4025#pid4025 我找到了这个帖子,不过好像结果更离谱了。 定义的直接搜不到了理想的结果了,而数据库是存在完全匹配的。。。

16.RE: 塔里木河的分词问题

更新时间:2013-06-09 13:06 t By wlx

...塔里木,但搜索塔里木就会找不全数据。 而且,采用定义分词的方法,好像没有效果。 我修改了dict_user.txt,其内容为: 塔里木 12.07 20.38 ns 然后重建索引,重启服务,但搜索结果依旧。 好像没有起作用。 可以到 http://www.h...

17.项目配置文件详解

...创建,字段名建议和您的实际数据库字段一致。 1. ### 定义字段 每个字段用一个区段配置来表示,中括号内的名字即为字段名。每个项目包含若干个字段, 具体由项目搜索需求决定,并不需要一味的与实际源数据库 (如 ...

18.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压不死锁)

发布时间:2013-03-26 16:03 t By vus520

...到相当的说明,希望你有时间能帮我解答一下。 现在定义分词,是不是只能在索引的时候进行,我的项目中需要对内容进行分词,用于生成文章的tag,我己给定了一个用户定义词库,在$tokenizer->getTops()时,不能...

19.“有空间”的分词有问题和扩充词典

更新时间:2013-05-18 14:05 t By lyjkensou

...但实际结果是“有空 间” 即使通过scws_add_dict()添加了定义的txt字典(里面只包含“空间 11.82 12.38”一行),仍然分不出“空间”这个词。 还有如何设置才能识别出网址和邮箱等格式? 另外关于scws-gen-dict,按照github上的...

20.RE: 建议用户能设置数字不分词

更新时间:2013-06-18 14:06 t By hightman

这是分词的策略问题,这种情况可以定义分词器来补充。。。 将你的词复制到 [url]http://www.xunsearch.com/scws/demo/v4.php[/url] 进行实测,分割结果为: E14188m E14188 14188 14188m 那么搜索以上4个词都是可以搜索到的,至于你从中提取 e...

123
  • 时间不限
  • 按相关性排序