搜索

大约有 182 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2907秒)

101.[2013] SCWS-1.2.2 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

...检索的需求 3) 测试脚本自动加载当前目录下的 dict_user.txt 文本词典 4) 修正 scws.c 中 __PARSE_XATTR__ 宏的 BUG 导致 scws_get_tops 和 scws_get_words 的 xattr 参数工作不正常的问题 5) 移除 scws.c 中关于 jabberd2s10 的注释,已不包含它的代码 6)...

102.想手动指定一些不进行分词的词语

发布时间:2013-07-23 16:07 t By seagg

...使得这个词不被分开 我看到有用户自定义词典 dict_user.txt 我在里面写了: 米兔车贴 1.0 1.0 ! 但还是被分了 还看到一个stopwords.txt的文件,但将米兔车贴放到里面了也还是会被分 。。。

103.XSTokenizerScws

... 构造函数 XSTokenizerScws addDict() 添加分词词典, 支持 TXT/XDB 格式 XSTokenizerScws getResult() 获取分词结果 XSTokenizerScws getTokens() XSTokenizer 接口 XSTokenizerScws getTops() 获取重要词统计结果 XSTokenizerScws getVersion() ...

104.【已解决】【感谢hightman帅哥的耐心解答,我是个人站长,要是我做起来了一定赞助您撒,

更新时间:2010-07-15 01:07 t By sulwan

...ini_get("scws.default.fpath").'/dict.xdb'); $cws->add_dict("./dict_extra.txt", SCWS_XDICT_TXT); [/php] 在说说词分词测试: 我的网址:http://sjz.haojishu.com/tools/222.php 官方网址:http://www.ftphp.com/scws/demo/v48.php 同时输入下边的词,大家看看: 石家...

105.自定义词典产生的故障

更新时间:2012-04-29 20:04 t By yunxiaoad2

自定义了dict_user.txt 出现奇怪现象,所有词性都变成了string(3),而且还出现了乱码: array(3) { ["off"]=> int(0) ["attr"]=> string(3) "@�" ["word"]=> string(15) "重庆鸡公煲" } array(3) { ["off"]=> int(0) ["attr"]=> string(3) "ns�" ["word"]=> string(6) "重庆" ...

106.PHP4版 简易中文分词(PSCWS) 第2/3版

发布时间:2007-06-06 09:06 t By hightman

...man.cn/demo/scws/demo.php[/url] 2. 全部下载包,只包括 .cdb 和 .txt 格式词典(cdb 若需要用于 php5 请自行转换词典) [url=http://www.hightman.cn/down/php-scws-v23.tgz]http://www.hightman.cn/down/php-scws-v23.tgz[/url] (5.3MB) 词典转换办法写一个小程...

107.RE: libscws的问题

发布时间:2009-12-04 13:12 t By nftw

...令生成的 /usr/local/scws/bin/gen_scws_dict -c gbk -i etc/dict_chs_gbk.txt -o /usr/local/scws/etc/dict_chs_gbk.xdb 生成的xdb格式词典的大小是438286字节,etc/dict_chs_gbk.txt这个文件有284726行,在里边查找,能找到“中国”这些关键词!

108.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压不死锁)

发布时间:2013-03-27 12:03 t By hightman

你这个词典是在 etc/dict_user.txt 还是项目目录下的 data/app/dict_user.txt ? 如果是后者需要升级到 1.4.6-dev 才支持,前者必须在改词典后重启 xs-searchd

109.RE: 冒昧的问一下——怎么用tf和idf来计算权重?

发布时间:2012-02-22 18:02 t By vanni

... 我通过词典增加的 “相宜本草” 但是不管用 mydict.txt 文件内容如下: 1 相宜本草 2 雅漾 3 舒护 4 活泉水 # scws -A -d /hp/opt/scws/dict/default.utf8.xdb:/home/vanni/scws/mydict.txt -c utf8 "相宜本草洗面奶和雅漾舒护活泉水哪个好"...

110.使用工具导出xdb后出错

发布时间:2011-09-21 16:09 t By lwliangma

请版主帮忙看下,下面是什么错误,,这个dic1.txt 直接从可用的xdb文件用dump导出的,现在不做任何修改直接make_xdb 就会报如下错误: C:\php>php make_xdb_file.php hah11.xdb dic1.txt INFO: Loading text file data ... PHP Notice: Uninitialized string off...

  • 时间不限
  • 按相关性排序