搜索

大约有 20 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0061秒)

1.如何设置“自定义词典”的路径?

更新时间:2010-10-28 14:10 t By johnbaby

本来按照Hightman的说明。我的文件放置的结构是这样的: “etc”:放置“自定义词典” 我的网站的目录结构是这样: [code]www【根目录】 |---mySite【子目录】 |---include【子目录】 |---使用分词功能的页面.php...

2.“有空间”的分词有问题和扩充词典

更新时间:2013-05-18 14:05 t By lyjkensou

...12.38”一行),仍然分不出“空间”这个词。 还有如何设置才能识别出网址和邮箱等格式? 另外关于scws-gen-dict,按照github上的说明,可以进行.xdb到.txt转换,但是实际测试时显示没有-U这个选项,请问是取消了吗?如果是取...

3.ubuntu安装后无法分词

更新时间:2014-03-27 13:03 t By raykwok

...下载词典,用php扩展测试,无法对中文分词,把词典权限设置为777后依旧不行。 还有其他什么要注意的? 例如: [quote]早春装新款2014大码宽松长款韩版蕾丝衫雪纺衫打底衬衫[/quote] 分词结果: [quote]早春装新款 2014 大码宽松长...

4.使用自定义词库的时候,部分词会丢失

更新时间:2014-04-18 17:04 t By tianly

...我自己的词库 //实例化分词插件核心类 $so = scws_new(); //设置分词时所用编码 $so->set_charset('utf8'); //设置分词所用词典(此处使用utf8的词典) $so->set_dict('/usr/local/scws/etc/dict.utf8.xdb'); //设置分词所用规则 $so->set_rule('/usr/local/scws/etc...

5.XSTokenizerScws

... 判断是否包含指定词性的词 XSTokenizerScws setCharset() 设置字符集 XSTokenizerScws setDict() 设置分词词典, 支持 TXT/XDB 格式 XSTokenizerScws setDuality() 设置散字二元组合 XSTokenizerScws setIgnore() 设置忽略标点符号 XSTokeni...

6.RE: 我在Linux下安装成功了,php中也运行了,但是分词不对,不知道为什么?

发布时间:2010-05-10 13:05 t By xyliufeng

设置词典的一个参数没有设置

7.RE: 实时加载字典,服务器严重吃不消,有没有办法?

发布时间:2009-08-03 23:08 t By askie

...的. [/quote] 安装了apache扩展,使用PHP进行调用,也可以设置读入内存? 如果可以的话,每次分词还要设置词典么?

8.RE: 我在Linux下安装成功了,php中也运行了,但是分词不对,不知道为什么?

发布时间:2010-05-09 02:05 t By hightman

词典没有正确放置或设置吧,看看你的 php.ini 中关于 scws.default.fpath 的设置

9.RE: Hightman您好,我的分词怎么不对啊

更新时间:2010-08-19 15:08 t By assad

...开,却成了UTF-8的编码了,显示出乱码了! 不管怎么去设置,每次打开,都成UTF8的,按理说,我的GBK编码的文件,浏览器里应该是也是GBK的,但是却成了UTF8的了 所以我认为分词不正确的,也许是这个问题,但是我不知道为什...

10.RE: 实时加载字典,服务器严重吃不消,有没有办法?

发布时间:2009-08-06 00:08 t By hightman

...的. [/quote] 安装了apache扩展,使用PHP进行调用,也可以设置读入内存? 如果可以的话,每次分词还要设置词典么? [/quote] 这个要的, 仅仅对当前的那个 scws handler 有效, PHP程序一结束资源全部释放了

12
  • 时间不限
  • 按相关性排序