搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0065秒)

61.scws1.2.2 php 扩展问题

发布时间:2013-10-13 02:10 t By kevinwang

...也被编译进去了这是怎么回事,即使不需要set_dict也可以分词 另外这种情况下,set_dict感觉和add_dict一样,我的词典和编译进去的那个词典会一起使用 一些文章带有大量的链接http:// 结果 http com www 这些词 会被放到结果中,...

62.请教:关于地市信息的分词结果,如何更准确?

发布时间:2010-09-21 12:09 t By shallows

我使用scws的C版本提供的接口对省份、地市信息进行分词,发现分词的结果有时不是希望达到的结果。例如: 1 洛阳市廛河华林水席村 希望的结果为:洛阳市 廛 河 华林 水 席 村(词典中有洛阳市,市廛,河华,华林) 实...

63.关于扩展词库的问题

发布时间:2012-12-10 15:12 t By timeage

...生的词库对‘阿斯顿发斯蒂芬罗铭罗大大罗’这段话进行分词 其中结果为: 阿斯顿 阿斯 斯顿 阿 斯 顿 发 斯蒂芬 斯蒂 蒂芬 斯 蒂 芬 [b]罗铭罗 罗铭 铭罗[/b] 罗 铭 罗 大大 大 大 罗 [复合分词选项] 最短词 二元 重要单字 ...

64.RE: 求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By hightman

TF/IDF值不会导致用不到分词,只是靠在一起时需要消岐才用得到。你自定义词典用不了要查查是什么别的原因。 通常问题: 1.词典写的字符集不对,比如把GBK当UTF-8了 2.词典更新后的修改时间由于某些原因比/tmp目录下生成的临...

65.XSTokenizerScws

...本 1.0.0 源代码 sdk/php/lib/XSTokenizer.class.php SCWS - 分词器(与搜索服务端通讯) Public 方法 隐去继承来的方法 名称描述定义于 __construct() 构造函数 XSTokenizerScws addDict() 添加分词词典, 支持 TXT/XDB 格式 ...

66.Libscws C API 使用说明

更新时间:2010-12-30 22:12 t By hightman

...33cc]0. 概述[/color][/size][/b] Libscws 代码是当前 SCWS(简易中文分词) 算法使用C语言编写的链接库,目前仅基于 Unix 族的操作系统,可能必须适当修改才能运行在 Windows 平台中。这套 scws 库没有外部扩展依赖,代码力争简洁高效,针对...

67.RE: 实时加载字典,服务器严重吃不消,有没有办法?

发布时间:2009-08-03 23:08 t By askie

...ine='1247673062'] [quote='askie' pid='3233' dateline='1247660523'] 如果分词次数太多,很容易引起服务器假死,linux服务器! 请问老大有没有加载到内容进行调用的方法? [/quote] 当然有啊,你看一下说明吧. 我不清楚你用的是什么方式,是PH...

68.XSTokenizerScws::setDict

...fpath); unset($this->_setting['add_dict']); return $this;} 设置分词词典, 支持 TXT/XDB 格式

69.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压不死锁)

发布时间:2013-03-28 12:03 t By vus520

...现在的问题是想通过XSTokenizerScws来获取指定文本的自定义分词结果。sdk使用了github里最新的版本,词典格式由一楼所示,现在取出来的结果并不包含任何自定义词典的关键词,求解。[/code] [php] $text =

70.XSTokenizerScws::addDict

...CWS_SET, XS_CMD_SCWS_ADD_DICT, $mode, $fpath); return $this;} 添加分词词典, 支持 TXT/XDB 格式

  • 时间不限
  • 按相关性排序