搜索

大约有 168 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0060秒)

131.基于xunsearch的搜索so.lrcgc.com

更新时间:2013-07-11 11:07 t By daijia

...http://so.lrcgc.com[/url],可通过歌词搜歌名。mysql全文搜索对中文支持太弱,xunsearch又提供了非常方便、简洁的接口,目前测试结果比较理想。 补充:当前总数据量15万条,数据库不到300M,每天增长中。

132.首页的500万应该是500 million(即500百万=5亿)

发布时间:2012-12-19 13:12 t By chinapubmed

中文http://www.xunsearch.com/对应的英文 which offered a search over around [color=#FF0000][size=xx-large][u]500 million[/u][/size][/color] web pages 发现似乎文档也是错的:D

133.RE: 请问一下,xdb与txt词库那个读取效率更高

更新时间:2013-06-29 23:06 t By 阿弟2013

...明显csws把email,网址给拆开了,还有标签没有去除,但是中文词是正确的分开了 postgres=# SELECT to_tsvector('zw_simple','pgsql中国社区论坛 http://www.pgsqldb.org:8079 chenaishen@263.net'); to_tsve...

134.[更新] 修正xdb词典导致生僻汉字被当作符号清除的问题

发布时间:2010-03-19 10:03 t By hightman

原随 scws 一起发布的简体中文 xdb 词典存在部分问题,导致一些冷僻汉字不能做到散字自动二元,甚至被当做标点符号清除。 现已更新词典,修正该问题,强烈建议重新下载新词典。下载地址: [URL]http://www.ftphp.com/scws/download....

135.添加新的分词无效

发布时间:2013-12-04 15:12 t By mengaifan

...;//新增词库 $cws->set_ignore(true); //var_dump($cws); //添加中文分词 $cws->send_text($a); dict_extra.txt 已经增加了一行:享鑫 1 1 n,但是“享鑫金属”还是只有金属被匹配出来

136.英文数字组合字符串分词问题,已结贴。

更新时间:2014-05-14 10:05 t By hpxl

...$prefix/data/项目名称/dict_user.txt 加入H61,但是不起作用,中文词汇是可以的。如果想分词结果中有H61,是不是只能自定义分词了?像这种商品的型号中很多类似的,如华硕主板H87-PLUS,H61、H87分别代表不同的主板芯片组。

137.RE: [HELP]xunsearch安装好了,搜索没有结果集。。。

发布时间:2011-10-27 16:10 t By hightman

...scws的api接口,实现短语分词功能 2.是否可以对scws自定义中文词典,方便扩展 [/quote] 目前没有直接支持自定义词典,而是直接读取 dict.utf8.xdb 你自己改词也必须转换成这个词典文件才能用。 词典转换关于SCWS的网站上有。

138.请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-06-29 21:06 t By 阿弟2013

...高 另外,scws对于中英文分词效果不是很好,即文中的中文分得还可以,但对于页面中的英文部分,包括email,url,host这类处理效果比较差,我们目前采用两个分析器配合使用来达到最好的效果,要是scws能处理得了像email,host,url...

139.字典中的条目的意义与来源

发布时间:2009-08-25 22:08 t By peng860215

从CSDN上下载了 CSWS中文分词词典,里面的条目为: 频道 14.89 3.91 n 音乐 14.89 3.91 n 软件 14.89 3.91 n 资讯 14.89 3.91 n 。。。。。 新浪 14.89 6.26 nz 文学 14.89 3.91 n 二列为词频,三列为词重,可是词频与词重是怎么计算的,单位...

140.php(utf8编码)PSCWS v4.0 是目前最新的版本吗?

发布时间:2013-05-22 21:05 t By zouhc

...? 求推荐和指点,谢谢了! [color=#006400]PHP版简易中文分词第四版(PSCWS v4.0) - 分词核心类库代码[/color]

  • 时间不限
  • 按相关性排序