搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0082秒)

171.scws-1.1.6 发布

更新时间:2011-04-20 15:04 t By hightman

...词之间时视为同一词而不再强行切开,此时如果激活复合分词的 DUALITY 选项,则仍能将符号切开作为复合词。 4.修正浮点数的识别规则,避免将IPv4地址识别为2个小数的尴尬,比如 192.168.1.1 以前会被切成 192.168 和1.1 2个数字,现...

172.RE: [2011] SCWS-1.1.8 发布,提供VC9的php_scws.dll、支持自定义词库

更新时间:2011-09-01 11:09 t By wodeln

...\DedeAMPZ\WebRoot\Default\tld\dede\getwen.php on line 5 不加呢,又会分词不成功,貌似是词典的问题,能不能告诉我哪里做错了呢? 忘记说了,我用的编码都是utf8 还有就是如果我用 $so->set_dict('C:/Program Files/scws/etc/dict.xdb'); $so->set_rule('C:...

173.XSFieldMeta

...ieldMeta hasCustomTokenizer() 判断当前字段是否采用自定义分词器 XSFieldMeta hasIndex() 判断当前字段是否需要索引 XSFieldMeta hasIndexMixed() 判断当前字段是否需要在混合区索引 XSFieldMeta hasIndexSelf() 判断当前字段是否需...

174.求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By zouhc

...果计算出来的大部分内容都是一样的值,而且也无法用于分词。 另外用这个计算器计算得到的TF和IDF值和词典中原先的不一样。 如:词典中的词语“辣椒油”在词典中是这样的: 辣椒油 13.45 9.22 n 我用计算器得出是这样...

175.求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By zouhc

...果计算出来的大部分内容都是一样的值,而且也无法用于分词。 另外用这个计算器计算得到的TF和IDF值和词典中原先的不一样。 如:词典中的词语“辣椒油”在词典中是这样的: 辣椒油 13.45 9.22 n 我用计算器得出是这样...

176.HDwiki的xunsearch项目安装使用记录【效果刚刚的】

更新时间:2012-11-29 20:11 t By chinapubmed

...搜索) content为词条内容(是用body类型) 全用的默认的分词 以上是用在线生成ini生成的。地址http://www.xunsearch.com/tools/iniconfig 2,建立索引,填充数据 cd /usr/local/xunsearch/sdk/php util/Indexer.php --rebuild --source=mysql://数据库用户名...

177.RE: 官方和提供的下载不一样,并且官方实例还写了错误代码

发布时间:2010-07-15 01:07 t By sulwan

...东西,对于索引要求比较高,墓前采用的办法是: SCWS分词,sphinx索引,减少索引,和增加的精确度,所索引专门提炼出来独立的数据库!

178.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压不死锁)

发布时间:2013-03-28 12:03 t By vus520

...现在的问题是想通过XSTokenizerScws来获取指定文本的自定义分词结果。sdk使用了github里最新的版本,词典格式由一楼所示,现在取出来的结果并不包含任何自定义词典的关键词,求解。[/code] [php] $text =

179.[2013] SCWS-1.2.2 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

...使用开源协议 New BSD License 发布新版本 2) 深度优化复合分词中的 SCWS_MULTISHORT 选项,更为合理有效,符合全文检索的需求 3) 测试脚本自动加载当前目录下的 dict_user.txt 文本词典 4) 修正 scws.c 中 __PARSE_XATTR__ 宏的 BUG 导致 scws_get_t...

180.获取搜索结果

...的部分进行飘红或加粗等高亮处理, 由于其中涉及到了分词等细节处理比较麻烦。因此,我们统一提供了 [XSSearch::highlight] 方法,可以对搜索结果文档中的字段值直接进行处理,匹配关键词部分会自动套上 `em` 标签。 您只要在...

  • 时间不限
  • 按相关性排序