搜索

大约有 278 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.4874秒)

161.自定义 SCWS 词库

... xunsearch 服务端,那么每个服务端独自使用自己的自定义词典文件。 添加删除修改自定义词库只要编辑该文件即可,以下为相关规范: - 文件为纯文本文件,编码必须是 UTF-8,可用任何编辑器修改 - 每行一条记录表示一个词...

162.RE: 建议search.log把dict_user.txt的自定义词也加入

发布时间:2012-05-14 22:05 t By yunxiaoad2

那我将自定义词典的方式变成利用scws提供的方法扩充内置词典,是否就能够让自定义词被search.log记录的可能性增大呢

163.RE: 实时加载字典,服务器严重吃不消,有没有办法?

发布时间:2009-08-03 23:08 t By askie

...么方式,是PHP还是c的API, set_dict 时的第二参数可以指定将词典读入内存的. [/quote] 安装了apache扩展,使用PHP进行调用,也可以设置读入内存? 如果可以的话,每次分词还要设置词典么?

164.RE: Hightman您好,我的分词怎么不对啊

更新时间:2010-08-19 15:08 t By assad

我郁闷了。自己定义的词语调用到了,规则调用到了,词典还是没调用到! 我的词典路径肯定没错!! 但是还是调用不到啊!![hr] 现在是这样的情况,在本地,我测试了一下,程序没半点问题,能正常分词 我用FTP传到服务...

165.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压不死锁)

发布时间:2013-03-27 12:03 t By hightman

你这个词典是在 etc/dict_user.txt 还是项目目录下的 data/app/dict_user.txt ? 如果是后者需要升级到 1.4.6-dev 才支持,前者必须在改词典后重启 xs-searchd

166.scws分词乱码问题,求解

发布时间:2012-07-17 16:07 t By wainilxx7

...页显示编码也是用的gbk。 然后我用记事本打开XDB 格式的词典文件dict.xdb,效果如下: XDB"/B ? ?? 悯H@   % G ! ? ! p # Z  #  ! ? # ? ) ? ! ? !  ! ? % ? ! ? ! ;* # P- # -0 ! ? % ? # ? # 5= # A ! 鰾 ! tG ! bJ ' ㎜ ! 頝 # 稱 ! zT !...

167.RE: 冒昧的问一下——怎么用tf和idf来计算权重?

发布时间:2012-02-22 18:02 t By vanni

同样问题: 新建的词典如何设置权重 比如:相宜本草 (某化妆品品牌) 被分成: 相宜 本草 我通过词典增加的 “相宜本草” 但是不管用 mydict.txt 文件内容如下: 1 相宜本草 2 雅漾 3 舒护 4 活泉水 # scws -A ...

168.RE: daemon server(linux后台程序)和embed(库的形式嵌入程序中)

发布时间:2010-12-10 15:12 t By hightman

...耗费的时间都花费在分词上,反正现在内存也便宜,而且词典不算太大。如果程序偶尔才需要分一下词,那就没必要load到内存里了。 [/quote] 恩,主要是把整个词典load到内存需要一些时间的(不光读取还要转换成xtree结构)

169.RE: 实时加载字典,服务器严重吃不消,有没有办法?

发布时间:2009-08-06 00:08 t By hightman

...么方式,是PHP还是c的API, set_dict 时的第二参数可以指定将词典读入内存的. [/quote] 安装了apache扩展,使用PHP进行调用,也可以设置读入内存? 如果可以的话,每次分词还要设置词典么? [/quote] 这个要的, 仅仅对当前的那个 s...

170.谁在windows下测试通过了,请给写个说明。谢谢了。我是这样做的,但是有错误。

发布时间:2010-10-30 20:10 t By wodeln

...这些我也都照做了。 建立一个本地目录放规则集文件和词典文件,建议使用:C:/program files/scws/etc 从 scws 主页上下载词典文件,解压后将 *.xdb 放到上述目录中 词典系列:http://www.ftphp.com/scws/down/scws-dict-chs-gbk.tar.bz2 ...

  • 时间不限
  • 按相关性排序