搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

61.RE:1229

发布时间：2007-06-07 11:06 t By 森然

期待C版简易中文分词-cscwsd-0.0.4发布

62.RE:1244

发布时间：2007-07-26 11:07 t By phaeton

为什么我对一串utf-8编码的中文分词，竟得到了下面的效果（只是单纯得到每个字）我在程序里已经设置了编码方式 scws_set_charset(s, "utf-8"); [attach]124[/attach]

63.RE:1234

发布时间：2007-12-30 14:12 t By dos2000

C版简易中文分词-cscwsd-0.0.3 安装很容易就成功了，但是这个pre版本却一直没有安装成功。继续努力中。

64.可以实现搜索纯静态网站吗？

更新时间：2013-09-16 17:09 t By anicca

像蜘蛛爬虫那样去检索指定的网站，把数据存入数据库，然后搜索 [hr] 像 sphider 开源的那个，只不过他没有中文分词

65.一点疑惑

更新时间：2013-11-09 15:11 t By 子不语

...果!为啥？？默认的分词也不行，:huh::huh:我用csv导入的中文全都不可以搜索和显示出来 [id] type = id [user] index = both tokenizer = full [q] index = both tokenizer = full [w] index = both tokenizer = full ~

66.使用

发布时间：2013-11-15 15:11 t By wydky

我的网站采用的是付费的空间,window2003 iis6 php5.3的环境，请问可以使用saws中文分词吗？谢谢！

67.2007简易分词第4版(scws-0.1.x)体验

发布时间：2007-06-06 11:06 t By hightman

... 这套分词目前的速度也超出了我的想象，实测 8万字节的中文文本在我的服务器上最快达 0.07秒（双核双CPU 3.0G），使用 php 扩展速度要略慢了 40% 左右，8万字节大概要 0.4~0.6秒不定。

68.RE: 请问一下，xdb与txt词库那个读取效率更高

更新时间：2013-06-29 23:06 t By 阿弟2013

...明显csws把email,网址给拆开了，还有标签没有去除，但是中文词是正确的分开了 postgres=# SELECT to_tsvector('zw_simple','pgsql中国社区论坛 http://www.pgsqldb.org:8079 chenaishen@263.net'); to_tsve...

69.字典中的条目的意义与来源

发布时间：2009-08-25 22:08 t By peng860215

从CSDN上下载了 CSWS中文分词词典，里面的条目为：频道 14.89 3.91 n 音乐 14.89 3.91 n 软件 14.89 3.91 n 资讯 14.89 3.91 n 。。。。。新浪 14.89 6.26 nz 文学 14.89 3.91 n 二列为词频，三列为词重，可是词频与词重是怎么计算的，单位...

70.php（utf8编码）PSCWS v4.0 是目前最新的版本吗？

发布时间：2013-05-22 21:05 t By zouhc

...？求推荐和指点，谢谢了！ [color=#006400]PHP版简易中文分词第四版(PSCWS v4.0) - 分词核心类库代码[/color]

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索