搜索

大约有 20 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0065秒)

1.RE: mysql 其实支持中文全文检索的

发布时间:2010-05-16 12:05 t By xiaolan

[quote='hightman' pid='3550' dateline='1273972998'] 没有什么太大的问题,但必须存一个冗余字段。以前就有建议过一些朋友这么做。 还有,MYISAM内置的全文也只是一个简单的解决方案,最终效果可能也不是非常好,根据以前的测试50万...

2.mysql 其实支持中文全文检索的

发布时间:2010-05-14 10:05 t By xiaolan

只是。。。 没法用而已。。 因为英文中都是用空格进行分割的 不过如果将ft_min_word_len改为2, 然后在程序里将内容用scws进行分词,然后存入数据库单独的字段里,用空格分开,检索的时候, 用mysql的全文检索,可以检索到...

3.RE: 请问一下,xdb与txt词库那个读取效率更高

更新时间:2013-06-29 23:06 t By 阿弟2013

...明显csws把email,网址给拆开了,还有标签没有去除,但是中文词是正确的分开了 postgres=# SELECT to_tsvector('zw_simple','pgsql中国社区论坛 http://www.pgsqldb.org:8079 chenaishen@263.net'); to_tsve...

4.xunsearch-1.3.0 (基于xapian/scws/php的开源中文全文搜索,新增同义词、修正BUG)

更新时间:2012-01-13 13:01 t By hightman

...工具和应用产品。 [b]主要更新如下:[/b] 1. 内部优化中文复合词的查询分析器,升级整合最新的 xapian-1.2.8、scws-1.1.9 2. 新增自动同义词搜索功能,详见同义词专题文档 [url]http://www.xunsearch.com/doc/php/guide/special.synonym[/url] 3...

5.请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-06-29 21:06 t By 阿弟2013

...高 另外,scws对于中英文分词效果不是很好,即文中的中文分得还可以,但对于页面中的英文部分,包括email,url,host这类处理效果比较差,我们目前采用两个分析器配合使用来达到最好的效果,要是scws能处理得了像email,host,url...

6.编写第一个配置文件

...,分词器当然选用 `full`。 - `author` 作者名字检索,考虑中文名支持,所以建议这个字段保留使用默认内置的 `scws` 分词器。 由于希望在默认不指明字段的情况下也能检索作者字段,所以它的过索引方式应为 `both`。 - `authorid` 作...

7.[求助]如何转换pre版本的xdb为txt格式

发布时间:2007-12-25 17:12 t By hackson

...人。共同学习才能共同提高,取长补短,分词是很重要的中文信息分析基础技术,中国的信息化建设要达到国际水平,分词技术一定不可以少的,一定要有很多的具有奉献精神的有志之士共同努力,hightman就是我学习的榜样:)

8.RE: scws1.1.8为什么第一次都很慢。

更新时间:2011-10-24 14:10 t By ci169

...文本: SCWS 是 Simple Chinese Words Segmentation 的缩写,即简易中文分词系统。 ************** 第一次提交 ********************************* No. WordString Attr Weight(times) ------------------------------------------------- 01. 缩写 n 6.72...

9.搜索建议和纠错

...速度过快或各种原因都很容易造成一两个字母出错。对于中文来说,古代就动不动 出现同音”通假字“,绝大多数现代人也使用拼音输入法,加上方言口音,乱用同音字现象非常普遍。 所以系统在综合分析索引库内的词汇、用...

10.同义词搜索

... > tip: 独立词汇的意思对于英文来说就是一个单词,对于中文来说必须是 `scws` 词库中的一个词。 > _Xunsearch_ 的同义词不同于 _Xapian_,会智能进行字段匹配和转换,您只需维护通用词库。 英文同义词的特殊处理 ------------------ ...

12
  • 时间不限
  • 按相关性排序