搜索

大约有 80 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.4888秒)

31.RE: 分词初试,结果不对

发布时间:2010-09-18 10:09 t By hightman

中文存成ANSI就相当于是GBK的,存在UNICODE或UTF-8当然就不是

32.xunsearch-1.4.0 (基于xapian+scws的开源中文搜索,大幅改进性能及稳定性)

发布时间:2013-01-22 12:01 t By hightman

...采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅...

33.xunsearch-1.4.6 (基于 xapian 和 scws开源中文搜索引擎,高扛压不再死锁)

更新时间:2013-03-27 13:03 t By hightman

...采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅...

34.ubuntu安装后无法分词

更新时间:2014-03-27 13:03 t By raykwok

....5 按照官方文档安装和下载词典,用php扩展测试,无法对中文分词,把词典权限设置为777后依旧不行。 还有其他什么要注意的? 例如: [quote]早春装新款2014大码宽松长款韩版蕾丝衫雪纺衫打底衬衫[/quote] 分词结果: [quote]早春...

35.对于分词的一些困惑

更新时间:2010-10-13 17:10 t By 逆雪寒

...词 这样来分[hr] 那如果是这样就麻烦了。。怎么能解决 中文+数字 结合的词呢?

36.RE: 二元分词问题

更新时间:2011-11-15 13:11 t By icebolt

...rg,"utf-8"); } return $terms; } hightman可以改成这个,那中文一元切分就也可以了 [hr] 建议:目前开放的都是php api,如果能开放c api和c的一些配置就更好了

37.scws-1.0.0 正式发布 (含php扩展及2文本词典)

更新时间:2010-01-29 13:01 t By hightman

...明节选] SCWS 是 Simple Chinese Words Segmentation 的缩写(简易中文分词系统)。 它是一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的 切分成词,因为词是汉语的基本语素单位,而书写的时候不像英语会在词...

38.共享自己的drupal模块出来,drupal commerce + xunsearch 做出强大的中文搜索,丢掉solr吧

发布时间:2014-03-11 01:03 t By drupal anywhere

今天旗下的http://www.anetb.com需要一个支持中文分词的搜索页,原drupal的太烂了, 我的做法是:结合xunsearch实现drupal commerce下的中文搜索 测试页:http://www.anetb.com/tsearch/demo/commerce/search.php , 可输入“奶粉”,我的站准备做这...

39.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压不死锁)

发布时间:2013-03-28 12:03 t By vus520

[quote='hightman' pid='3722' dateline='1364360180'] 你这个词典是在 etc/dict_user.txt 还是项目目录下的 data/app/dict_user.txt ? 如果是后者需要升级到 1.4.6-dev 才支持,前者必须在改词典后重启 xs-searchd [/quote] 我今天升级到1.4.6了,词典在etc/d...

40.新增“开源捐赠"链接

发布时间:2013-08-15 19:08 t By hightman

我们一直致力于开源的 xunsearch 中文全文检索和 scws 中文分词开发。 我们一直在努力做得更好,如果您对我们的成果表示认同或对您有所帮助, 我们乐意接受您的捐赠。我们的开源事业离不开您的支持。 [url]http://www.xunsearch...

  • 时间不限
  • 按相关性排序