搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0053秒)

81.RE: 批量分词问题

发布时间:2010-06-06 11:06 t By hightman

希望能附上完整的PHP代码以及你的定义词库,以做分析和测试。 从上面少结果的看,应该是词库不生效,而结果只按人名规则合成了2个人名,其它的按无效字符过滤。

82.RE: scws_has_word没有得到部分指定词库中的词

发布时间:2011-12-26 16:12 t By hightman

你可以正常分词试试,然后打印一下词的 attr 属性到底是不是* 号 我估计是不是你定义词典先于默认词典加载,导致attr属性被覆盖了?

83.RE: 1.1.2的 定义字典无法使用

更新时间:2010-05-23 22:05 t By 逆雪寒

谢谢 hightman 的回答. 不过我确定我市完全按照你说的做的 php.ini 是这样的配置 [scws] extension=scws.so scws.default.charset=utf8 scws.default.fpath=/usr/local/scws/etc 而php 是这样 //分词 $so = scws_new(); $so->set_charset('utf8'); // 这里没有...

84.英文数字组合字符串分词问题,已结贴。

更新时间:2014-05-14 10:05 t By hpxl

....php[/url] 得到的结果为“华硕/主板/H/61/-/PLUS”。尝试过定义词库,$prefix/data/项目名称/dict_user.txt 加入H61,但是不起作用,中文词汇是可以的。如果想分词结果中有H61,是不是只能定义分词了?像这种商品的型号中很多类似...

85.[2013] SCWS-1.2.2 发布,BSD协议、支持定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

...才行。 -- [color]新功能用法示例[/color] (php为例) -- 1. 定义词库,含新增核心库不存在的词汇及删除核心库存在词汇的功能 1) 创建相应字符集的词库文件 dict_extra.txt 2) TF/IDF 参考值查询,为方便大家我作了一个工具...

86.RE: scws_has_word没有得到部分指定词库中的词

更新时间:2011-12-09 11:12 t By michaele

是判断指定词性 我定义词库格式如下: 销售什么 1.0 1.0 * 出售什么 1.0 1.0 * 出售各式 1.0 1.0 * 某词 1.0 1.0 * scws_t s=scws_new(); 用下面这个函数可以分出“某词”, scws_get_tops(s,1000,N...

87.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压不死锁)

发布时间:2013-03-26 16:03 t By vus520

...到相当的说明,希望你有时间能帮我解答一下。 现在定义分词,是不是只能在索引的时候进行,我的项目中需要对内容进行动分词,用于生成文章的tag,我己给定了一个用户定义词库,在$tokenizer->getTops()时,不能...

88.怎么样做到不对数字分词?

发布时间:2011-03-21 20:03 t By zfzeng

定义词库没有数字,可是对含有数字的一段话,还是把数字给分出来了, 怎么样才能忽略对数字的分词呢?

89.RE: 关于分词的错误

发布时间:2012-12-24 12:12 t By hightman

你可以定义词库,去掉“的卡”,加入“单刷”

90.TF/IDF算法

发布时间:2014-07-21 11:07 t By clearchen

想做定义词库的功能。 哪位大侠,是否可以告知, http://www.xunsearch.com/scws/demo/get_tfidf.php 的算法。 谢谢

  • 时间不限
  • 按相关性排序