搜索

大约有 50 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0071秒)

11.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压不死锁)

发布时间:2013-03-26 16:03 t By vus520

hightman 辛苦~ 第一时间升级到最新版了。我有一个疑问,找了一些文档,没有找到相当的说明,希望你有时间能帮我解答一下。 现在自定义分词,是不是只能在索引的时候进行,我的项目中需要对内容进行自动分词,用于生...

12.RE: SCWS 能否添加 “中文+英文”和“中文+数字”自定义词

发布时间:2012-08-30 20:08 t By xiaofeng

[quote='hightman' pid='1078' dateline='1346301119'] 支持是支持的,但数字字母最多只支持2位。 你说的情况其实切分成“斯巴鲁+WRX”并不会有多大问题吧。 像 Q币 QQ空间 这样的都是可以支持成词的。 [/quote] 感谢hightman 的回复。 ...

13.xunsearch-1.4.8 (基于 xapian+scws 的开源中文搜索引擎,小问题优化改进)

发布时间:2013-12-11 15:12 t By hightman

...s 接受参数作为复合等级 4. 升级 libevent 到 2.x 版 5. 修正中文 stopwords 不生效的问题 6. 取消恼人的 NODB(S#506) 错误提示 7. 新增获取文档匹配词表的接口 XSSearch::setRequireMatchedTerm 官方网站:[url]http://www.xunsearch.com[/url] 下载地址...

14.关于SCWS基于HTTP/POST的分词API的一个问题

发布时间:2011-04-01 10:04 t By tuzwu

感谢SCWS提供了这么优秀的中文分词库. 我有个问题如下: 文字内容为:"武汉车友会的地盘,听武汉车友的,来这里涂鸦吧" 我希望分词结果为 武汉车友会,武汉车友 ,其他的词都不要.该如何做呢. 传递参数如下: array('data'=>$data, 'igno...

15.PHP4版 简易中文分词(PSCWS) 第2/3版

发布时间:2007-06-06 09:06 t By hightman

[b][size=3]关于 PHP 版简易中文分词[/size][/b] 目前已经发布的PHP版分词有第2版和第3版,这两个版本的用法完全一样,主要区别在于分词的算法,前者采用正向最大匹配2级交叉消岐,而后者采用的是双向匹配综合消岐。并没有绝...

16.复合分词的级别"multi" 可以设置分词的长度吗?

发布时间:2012-07-19 11:07 t By calvin

[php] header("Content-type: text/html; charset=utf-8"); var_dump(SCWS('中文分词解析,我的个神啊')); //中文分词解析 function SCWS($title) { set_time_limit(0); $data = array("data"=>$title,"respond"=>"json","ignore"=>'yes', "multi"=>3); $data = http_build_query($data); $r...

17.xunsearch-1.0.0 正式版 (基于xapian/scws/php的开源中文全文搜索引擎)

发布时间:2011-09-23 13:09 t By hightman

...采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前...

18.中英混合问题

更新时间:2012-10-16 19:10 t By o00ofly

当在中文中加入英文后,英文加头部时,只能得到英文分词,而后面的中文却没用了;英文中间时,仅能得到英文前的汉字的分词;英文放尾部时,英文分词也得不到,这是哪里没配置的原因么? 我在网站上在线分词那输入中...

19.RE: scws1.1.8为什么第一次都很慢。

更新时间:2011-10-24 14:10 t By ci169

...文本: SCWS 是 Simple Chinese Words Segmentation 的缩写,即简易中文分词系统。 ************** 第一次提交 ********************************* No. WordString Attr Weight(times) ------------------------------------------------- 01. 缩写 n 6.72...

20.scws-1.0.0 正式发布 (含php扩展及2文本词典)

更新时间:2010-01-29 13:01 t By hightman

...明节选] SCWS 是 Simple Chinese Words Segmentation 的缩写(简易中文分词系统)。 它是一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的 切分成词,因为词是汉语的基本语素单位,而书写的时候不像英语会在词...

12345
  • 时间不限
  • 按相关性排序