搜索

大约有 300 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0075秒)

131.scws与多线程

更新时间:2010-12-07 23:12 t By lauxinz

...在多线程环境下怎么使用libscws,每一个线程都需要进行分词? typedef struct { xdict_t d; rule_t r; unsigned char *mblen; unsigned int mode; unsigned char *txt; int zis; int len; int off; int wend; scws_res_t res0; scws_res_t res1; word_t **wmap; st...

132.daemon server(linux后台程序)和embed(库的形式嵌入程序中)

更新时间:2010-12-09 23:12 t By lauxinz

...n server指的是这个后台程序使用了scws库,且主要功能就是分词, embed指的就是一个程序使用了scws库,分词只是其中一个环节?daemon server也是embed啊。 另外知道xdb和xtree性能差距有多大?xdb格式没有装入内存,只是在分词过程...

133.构建搜索语句

...部默认采用 `AND` 规则, 也就是说要求列出来的关键词(分词之后)全部匹配,如果您通过 [XSSearch::setFuzzy] 开启了模糊匹配,那么相当于采用 `OR` 规则,只要其中一个关键词匹配即可。 刚刚说的这种搜索的是索引数据库的“混...

134.为何导出txt,里面内容动在创建XDB之后速度变慢很多很多

发布时间:2011-03-03 00:03 t By hit

...面的排序完全改变了 目前的情况是我导出TXT在创建XDB 分词速度比之前慢了2倍 这个问题很想知道原因T-T XDB->TXT这似乎是一个很难逆转或者是无法逆转的过程 (我只是感觉到导出文件的TXT可能有问题)或者创建的XDB文件有...

135.RE: 官方和提供的下载一样,并且官方实例还写了错误代码

发布时间:2010-07-15 01:07 t By sulwan

...东西,对于索引要求比较高,墓前采用的办法是: SCWS分词,sphinx索引,减少索引,和增加的精确度,所索引专门提炼出来独立的数据库!

136.删除和添加一些新词

发布时间:2013-08-01 11:08 t By kimiduan

...仅为微软创收8.53亿美元,甚至抵库存调整费用”进行分词,结果是“Surface/en 上一/nz 财/n 年仅/n 为/v 微软/nz 创收/v 8.53/en 亿/m 美元/q ,/un 甚至/d /d 抵/v 库存/n 调整/vn 费用/n ”。我在dict_extra.txt中添加了“财年 11.82 12.38 n”...

137.xunsearch-1.4.8 (基于 xapian+scws 的开源中文搜索引擎,小问题优化改进)

发布时间:2013-12-11 15:12 t By hightman

...代码兼容性 2. 增加用户案例文档:USERCASE 3. 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 4. 升级 libevent 到 2.x 版 5. 修正中文 stopwords 生效的问题 6. 取消恼人的 NODB(S#506) 错误提示 7. 新增获取文档匹配词表的接口 X...

138.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压死锁)

发布时间:2013-03-28 12:03 t By vus520

...现在的问题是想通过XSTokenizerScws来获取指定文本的自定义分词结果。sdk使用了github里最新的版本,词典格式由一楼所示,现在取出来的结果并包含任何自定义词典的关键词,求解。[/code] [php] $text =

139.关于 SCWS 简易中文分词系统

更新时间:2013-01-10 16:01 t By hightman

SCWS 全称是 Simple Chinese Words Segmentation 即简易中文分词系统。 [url=http://www.xunsearch.com/scws][b][size=5][color=#FFA500]2010/01, scws-1.1.0 发布,支持加载文本词典,下载及介绍请进项目站点 http://www.xunsearch.com/scws[/color][/size][/b][/url] [url=http://w...

140.RE: 实时加载字典,服务器严重吃消,有没有办法?

发布时间:2009-08-03 23:08 t By askie

...ine='1247673062'] [quote='askie' pid='3233' dateline='1247660523'] 如果分词次数太多,很容易引起服务器假死,linux服务器! 请问老大有没有加载到内容进行调用的方法? [/quote] 当然有啊,你看一下说明吧. 我清楚你用的是什么方式,是PH...

  • 时间不限
  • 按相关性排序