搜索

大约有 546 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1009秒)

401.SCWS是否可以提供Python扩展?

发布时间:2012-03-05 12:03 t By frostmourn716

HI 在一个项目中使用到了scws PHP的扩展,感觉scws在分词效率和准确率,以及在返回结果的可用性上,显著高于其它的扩展,想问一下,scws是否可以提供Python的扩展?

402.xunsearch-1.0.0 正式版 (基于xapian/scws/php的开源中文全文搜索引擎)

发布时间:2011-09-23 13:09 t By hightman

... C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支...

403.RE: 关于词典中的词性标注

发布时间:2009-08-06 00:08 t By hightman

单字标为 @ 是以前遗留下来的, 未确定词性, 还有一部分被标为 un 了, 建议把 un 改为 '@' ,否则可能导致散字自动聚合成2元分词时会不聚合.

404.RE: 搜索数据丢失

更新时间:2014-07-17 15:07 t By xunsearch飞吧

哦,那我自定义分词吧,但是单字搜的话,有些还是根据地址搜索的,真心纠结,2的n次幂 -1 的组合,这组合太多了,纠结!谢谢你了[hr] [quote='bigxu' pid='8360' dateline='1405578798'] http://www.xunsearch.com/site/search?q=%E5%8D%95%E5%AD%97+%E5%88%86%...

405.XSTokenizerNone

...本 1.0.0 源代码 sdk/php/lib/XSTokenizer.class.php 内置空分词器 Public 方法 隐去继承来的方法 名称描述定义于 getTokens() XSTokenizerNone 方法明细 getTokens() 方法 public void getTokens($value, $doc=NULL) $valu...

406.RE: 导入mysql 数据的时候报错了

发布时间:2013-03-31 13:03 t By hightman

你的分词器分出来的词太长了吧,我在新版SDK里默认过滤了200字节以上的词了。

407.xunsearch-1.4.6 (基于 xapian 和 scws开源中文搜索引擎,高扛压不再死锁)

更新时间:2013-03-27 13:03 t By hightman

.... 修改 XSTokenizerScws 以支持项目级自定义词典的 6. 自定义分词器的字段也能参与权重计算了,在 ini 指定 `non_bool = yes` 7. 采用 bootstrap 框架美化 util.SearchSkel 生成页面效果 官方网站:[url]http://www.xunsearch.com[/url] 下载地址:[url]h...

408.RE: 自定义的 txt 字典 有关问题 求助

发布时间:2010-04-10 13:04 t By lerado

哦,是用tab符分开呀,我还以为用空格分开呢,我又重新生成了一次,看了一下分词效果还不错。 谢谢。

409.RE: 搜索建议提供的词相关性不强

发布时间:2013-05-13 15:05 t By hightman

默认是拿分词结果当初始值的。。。

410.RE:1265

发布时间:2008-06-02 14:06 t By lyhiving

...实用PHP脚本也能作,我忘了放出来呵 [/quote] 急求编辑分词库的php脚本啊

  • 时间不限
  • 按相关性排序