搜索

大约有 227 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2946秒)

121.RE: 规则集BUG

发布时间:2014-10-23 16:10 t By hightman

不是无法,而是后面的词出现在词库中导致的。规则识别适用于无法成词的散字,匹配词库则会优先。

122.RE: 10秒 10元 这样的想做为一个词要怎么配置

发布时间:2011-10-31 10:10 t By xjtdy888

[quote='hightman' pid='7103' dateline='1319824645'] 你要用自定义词库 编写一个 dict_extra.txt 里面写上每个词,一个一行 然后调用 add_dict 加入词典 [/quote] 您好,用自定义词库是可以解决但却不是太方便,如果SCWS不能这样的配置,...

123.RE: 搜寻结果乱套

发布时间:2014-06-04 10:06 t By bigxu

...索主键id看看,有没有导入进去。应该不会丢失。 3,繁体词库和简体词库不同。如果觉得不完美,你可以想办法扩展一下。弄好了,共享给大家,谢谢。

124.RE: 请问一下,xdb与txt词库那个读取效率更高

更新时间:2013-06-29 23:06 t By 阿弟2013

我举个例子吧 下面是用csws分词的结果,明显csws把email,网址给拆开了,还有标签没有去除,但是中文词是正确的分开了 postgres=# SELECT to_tsvector('zw_simple','pgsql中国社区论坛 http://www.pgsqldb.org:8079 chenaishen@263.net'); ...

125.xunsearch-1.2.0 (基于xapian/scws/php的开源中文全文搜索,自定义词库、搜索日志管理)

发布时间:2011-12-12 17:12 t By hightman

经过开发给不断的努力和测试,以及吸收了大量网友的反馈意见,很高兴于今天发布 Xunsearch 1.2.0 正式版。 这次修订主要是开发了一些新功能,同时修正了一些 BUG,强烈各位用户建议升级到该最新稳定版本。新增的主要功能...

126.关于中英文混合切词

发布时间:2012-04-01 17:04 t By breeze

比如说我要切割“Adidas/阿迪达斯是一个著名的运动品牌” 在自定义词库里我添加了"Adidas/阿迪达斯" 但结果是Adidas / 阿迪达斯 请问能否判断是一个自定义的整词吗?就是说按我设置的词库来分

127.RE: 三个问题需要求教

更新时间:2011-01-17 16:01 t By hightman

...词,这样它会被当作一个整词。 通常 un 是指不存在于词库中的字词,对于你这个情况,你可以修改 libscws/scws.c 第 680 行把 attr_un 改为 attr_en 即可,如果需要严格一点可以先判断一下 ch 是否为字母, 如以下: ...

128.如何让分词不把“1000元”分成两个词?

发布时间:2013-07-26 22:07 t By 特伦C

对于能够枚举出来的“1天”、“2天”……可以用自定义词库来解决,但对于如题所示的情况,组合太多,不可能在自定义词库里都枚举出来,所以想问下老大,是否有什么解决方案来达到这个效果?

129.scws 分词能否推出php+mysql版本的?

更新时间:2013-12-25 15:12 t By ecpt

既然有php扩展,为什么不推出一个php+mysql版本的,把词库放在mysql中,这样可以更方便我们对词库的扩展和管理,更加降低入门门槛,对scws的发展也会有一定的帮助。

130.RE: [2011] SCWS-1.1.8 发布,提供VC9的php_scws.dll、支持自定义词库

更新时间:2011-09-01 11:09 t By wodeln

楼主,为什么不能发新帖了啊。我用1.18 php_scws.dll(2) 对应的php版本为 5.2.3 完全按照文档目录 php_scws.dll/Win32 安装说明 这个上面做的。而且安装完扩展之后echo phpinfo();也看到了 scws服务已经有了。 在运行时加了 scws.default.charset...

  • 时间不限
  • 按相关性排序