搜索

大约有 80 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1005秒)

41.RE: SCWS不支持英文和中英文混合分词吗?

发布时间:2010-08-27 10:08 t By hightman

中文外其余的只按标点符号或空格切分,无缝连在一起的单词字母是不支持的。

42.发现有几种情况会导致分词不准确?

发布时间:2011-09-15 14:09 t By 逆雪寒

scws分词不正确的情况 1、中文夹杂连续两个以上英文或数字(例如:程jj序ii员e 正常,程jjj序ii员e 不正常) 2、英文数字组合中,同时含有连续一个以上英文或数字的组合(例如:w1156k 正常,w16ky不正常) 3、含有任意一个...

43.xunsearch-1.4.7 (基于 xapian+scws 的开源中文搜索引擎,诸多细节改进)

发布时间:2013-07-30 11:07 t By hightman

...采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅...

44.第四版遇到()和中英文混合分词的问题。

发布时间:2008-01-03 11:01 t By kts2tt

...出来。 而且 六灯夜视D502 这样的名称 也只能分出 中文, 英文和数字没有被分出来,是为什么?请教高手。 我用的是SCWS 扩展 PHP 5.2.x 版二进制文件!

45.英文数字组合字符串分词问题,已结贴。

更新时间:2014-05-14 10:05 t By hpxl

...$prefix/data/项目名称/dict_user.txt 加入H61,但是不起作用,中文词汇是可以的。如果想分词结果中有H61,是不是只能自定义分词了?像这种商品的型号中很多类似的,如华硕主板H87-PLUS,H61、H87分别代表不同的主板芯片组。

46.添加新的分词无效

发布时间:2013-12-04 15:12 t By mengaifan

...;//新增词库 $cws->set_ignore(true); //var_dump($cws); //添加中文分词 $cws->send_text($a); dict_extra.txt 已经增加了一行:享鑫 1 1 n,但是“享鑫金属”还是只有金属被匹配出来

47.RE: 不能搜索单个字

发布时间:2013-05-10 09:05 t By hightman

这不为什么,这就是全文检索,中文分词。搜索单字没有实际意义,实在有必要你可以自定义分词器,按字索引。

48.关于 Xunsearch PHP-SDK

关于 Xunsearch PHP-SDK Xunsearch (中文名:迅搜)是一套免费开源的专业中文全文检索解决方案,简单易用而且 功能强大、性能卓越能轻松处理海量数据的全文检索。它包含后端索引、搜索服务程序和前端 脚本语...

49.www.adminlink.net.cn上的xunsearch案例

更新时间:2011-12-08 12:12 t By adminlink

首页说下我为什么安装中文分词和全文搜索。 就是因为提取出更多的页面,让搜索引擎蜘蛛没完没了的爬,达到网页聚合的目的。这样做我估计对优化很有帮助。 选择scws的原因是比较了几个中文分词后,感觉scws是一个不错的...

50.RE: [HELP]xunsearch安装好了,搜索没有结果集。。。

发布时间:2011-10-26 15:10 t By vist2007

...供scws的api接口,实现短语分词功能 2.是否可以对scws自定义中文词典,方便扩展

  • 时间不限
  • 按相关性排序