搜索

大约有 80 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0983秒)

41.RE: scws1.1.8为什么第一次都很慢。

发布时间:2011-10-23 23:10 t By hightman

什么方式运行的? 是不是词典的原因啊,用了自定义吗

42.SCWS-php扩展的说明及用法

发布时间:2007-06-07 18:06 t By hightman

...。它为中文而编写,支持 gbk 和 utf-8 字符集,适当的修改词典后也可以支持非中文的多字节语言切词(如日文、韩文等)。除分词外,还提供一个简单的关键词汇统计功能,它内置了一个简单的算法来排序。本扩展内部直接绑绑...

43.scws分词乱码问题,求解

发布时间:2012-07-17 16:07 t By wainilxx7

...页显示编码也是用的gbk。 然后我用记事本打开XDB 格式的词典文件dict.xdb,效果如下: XDB"/B ? ?? 悯H@   % G ! ? ! p # Z  #  ! ? # ? ) ? ! ? !  ! ? % ? ! ? ! ;* # P- # -0 ! ? % ? # ? # 5= # A ! 鰾 ! tG ! bJ ' ㎜ ! 頝 # 稱 ! zT !...

44.scws-1.1.9 发布,明确采用 BSD 协议;改进复合分词修正BUG等

更新时间:2011-12-28 13:12 t By hightman

...求 3) 测试脚本自动加载当前目录下的 dict_user.txt 文本词典 4) 修正 scws.c 中 __PARSE_XATTR__ 宏的 BUG 导致 scws_get_tops 和 scws_get_words 的 xattr 参数工作不正常的问题 5) 移除 scws.c 中关于 jabberd2s10 的注释,已不包含它的代码 6)...

45.1.1.2的 自定义字典无法使用

更新时间:2010-05-23 01:05 t By 逆雪寒

...常. 这个是第一个问题. 第二个问题就是,定义自定义的词典. 看到说1.1.2 支持自定义的 txt 字典.于是我就这样写了 $so->add_dict(ini_get("scws.default.fpath") . '/dict.utf8.xdb'); $so->add_dict("/usr/myapp/dict_extra.txt",SCWS_XDICT_TXT); $so->set_rule(in...

46.RE: [2012] SCWS-1.2.0 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2012-03-31 11:03 t By hightman

txt词库其实也是转换成XDB再调用的,不用担心性能。 你合并词典很简单啊,把 dict.utf8.xdb 导出来嘛

47.scws-1.2.0 发布,支持 PHP5.4 新增用于多线程的 scws_fork()

发布时间:2012-03-29 12:03 t By hightman

...3) libscws 增加 scws_fork() 从既有的 scws 实例产生分支并共享词典/规则集,主要用于多线程开发。 4) 新增部分版本的 win32 的 dll 扩展,详见[url=http://www.ftphp.com/scws/download.php#dll]下载页面[/url] 最新下载地址:[url]http://www.ftphp.com/scw...

48.PHP4版 简易中文分词(PSCWS) 第2/3版

发布时间:2007-06-06 09:06 t By hightman

...没有绝对的谁优谁劣,似乎半斤八两。 两者都是基于词典词频查询,推荐词典格式为 cdb,因为它在 PHP 中有捆绑而且同时支持 windows 和 *Unix* ,只需要在PHP编译时加入 --with-dba --with-cdb 即可,在 windows 中打开 php-dba.dll 扩展就行...

49.RE: 官方和提供的下载不一样,并且官方实例还写了错误代码

更新时间:2010-07-14 21:07 t By sulwan

...因为你用错误词了,48.php 是针对UTF-8的,而你调用了gbk的词典,把你的词典语句改为 dict.utf8.xdb 即可 3. dict_extra.txt 也必须是UTF-8编码 4. 删除词条,因为陈凯歌其实可能是因为人名关系导致切成词,可能会不受词典影响 5. 如果...

50.求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By zouhc

老大,你提过的词典太老了,很多词语都没有。我想自己扩充我的词库,但不知道TF/IDF如何获得。 通过你提过的新词生词的TF/IDF计算器(http://www.xunsearch.com/scws/demo/get_tfidf.php) 结果计算出来的大部分内容都是一样的值,而...

  • 时间不限
  • 按相关性排序