搜索

大约有 227 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0989秒)

201.英文数字组合字符串分词问题,已结贴。

更新时间:2014-05-14 10:05 t By hpxl

...url] 得到的结果为“华硕/主板/H/61/-/PLUS”。尝试过自定义词库,$prefix/data/项目名称/dict_user.txt 加入H61,但是不起作用,中文词汇是可以的。如果想分词结果中有H61,是不是只能自定义分词了?像这种商品的型号中很多类似的,...

202.关于分词的几个问题

发布时间:2007-06-12 16:06 t By listdo

...在一块呢? 2. 效果相当好 = > 效果 相 当好 不知道在词库中"相"的词性是什么,这里把"相"和"当"分开,却把"当"和"好"分在一块, 明显不是我们想要的结果.

203.RE: 请教:关于地市信息的分词结果,如何更准确?

发布时间:2010-09-26 20:09 t By hightman

由于词库太大干扰所致,建议可以附加一个小词典(目的是删除这些无用词汇,以下我写出来作参考,把下面的文字存成dict.txt,然后在原有的set_dict之后加上 scws_add_dict(s, 'path/to/this_ad_dict.txt', SCWS_XDICT_TXT); 这样使文本词典生效. ...

204.RE: 第四版遇到()和中英文混合分詞的問題。

更新时间:2009-06-16 00:06 t By JamesKG

...ch ($words as $word) { print_r($word); } } 此外, 繁体词库很不完善, 缺词太多而且有一些词也不正确 [/quote] 非常謝謝版主的指導,我的問題已經解決了。 這個程式非常好用,[color=#FF0000]日後希望能夠看到更齊全的繁體...

205.[预告] xunsearch 下一主版本 1.3.x 主要新增功能

更新时间:2011-12-26 10:12 t By hightman

...家参考和建议。 1. 同义词搜索,通过API建立、管理同义词库,检索的时候智能匹配同义词进行搜索。比如设置 “xunsearch”与“迅搜”为同义词,那么搜索 xunsearch也会包含迅搜的记录。 2. 增强的搜索查询与匹配,通常像“管理...

206.关于SCWS基于HTTP/POST的分词API的一个问题

发布时间:2011-04-01 10:04 t By tuzwu

感谢SCWS提供了这么优秀的中文分词库. 我有个问题如下: 文字内容为:"武汉车友会的地盘,听武汉车友的,来这里涂鸦吧" 我希望分词结果为 武汉车友会,武汉车友 ,其他的词都不要.该如何做呢. 传递参数如下: array('data'=>$data, 'igno...

207.求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By zouhc

...提过的词典太老了,很多词语都没有。我想自己扩充我的词库,但不知道TF/IDF如何获得。 通过你提过的新词生词的TF/IDF计算器(http://www.xunsearch.com/scws/demo/get_tfidf.php) 结果计算出来的大部分内容都是一样的值,而且也无法...

208.求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By zouhc

...提过的词典太老了,很多词语都没有。我想自己扩充我的词库,但不知道TF/IDF如何获得。 通过你提过的新词生词的TF/IDF计算器(http://www.xunsearch.com/scws/demo/get_tfidf.php) 结果计算出来的大部分内容都是一样的值,而且也无法...

209.RE: 能否提供字典dict.xdb的生成程序

发布时间:2009-06-28 21:06 t By hightman

.... 地址匹配事实上应该针对地名名词(含缩写,别名)建立词库, 然后将其分词, 提取关键字进行比较, 如果相同即可视为相同. 比如同样是 xx市, 有些人可能只写 xx 而没写市

210.1.1.2的 自定义字典无法使用

更新时间:2010-05-23 01:05 t By 逆雪寒

...th') . '/rules.utf8.ini'); 结果分词无效果.好像是加载不到词库一样...试了很多次.都不行. 路径和权限我确定没有错误. 所以来求救了. hightman help me .谢谢你

  • 时间不限
  • 按相关性排序