搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1934秒)

101.关于SCWS基于HTTP/POST的分词API的一个问题

发布时间:2011-04-01 10:04 t By tuzwu

感谢SCWS提供了这么优秀的中文分词库. 我有个问题如下: 文字内容为:"武汉车友会的地盘,听武汉车友的,来这里涂鸦吧" 我希望分词结果为 武汉车友会,武汉车友 ,其他的词都不要.该如何做呢. 传递参数如下: array('data'=>$data, 'igno...

102.xunsearch-1.4.0 (基于xapian+scws的开源中文搜索,大幅改进性能及稳定性)

发布时间:2013-01-22 12:01 t By hightman

...了搜索服务的性能及稳定性,同时加入了项目级的自定义词库功能。强烈建议所有用户升级到这个最新稳定版本,以便发挥 xunsearch 的最大威力。 主要更新如下: 1. 升级整合最新的 xapian-1.2.13、scws-1.2.1 2. 新增支持项目自定...

103.RE: scws1.1.8为什么第一次都很慢。

更新时间:2011-10-24 00:10 t By ci169

... [/quote] linux Centos5。scws.1.1.8版的。 还没用上自定义的词库。 第一次基本大于0.1秒以上。就很短的几个词也是这么慢。 提交同样的词后面几次就很快了。 一有改变又慢了。 我直接复制官方演示的代码执行的。 http://www.ftphp....

104.1.1.2的 自定义字典无法使用

更新时间:2010-05-23 01:05 t By 逆雪寒

...th') . '/rules.utf8.ini'); 结果分词无效果.好像是加载不到词库一样...试了很多次.都不行. 路径和权限我确定没有错误. 所以来求救了. hightman help me .谢谢你

105.TF/IDF算法

发布时间:2014-07-21 11:07 t By clearchen

想做自定义词库的功能。 哪位大侠,是否可以告知, http://www.xunsearch.com/scws/demo/get_tfidf.php 的算法。 谢谢

106.RE: 第四版遇到()和中英文混合分词的问题。

发布时间:2009-06-14 21:06 t By hightman

楼上你的情况是因为你对API使用不正确, scws_get_result 应该循环调用 while ($words = scws_get_result($sh)) { foreach ($words as $word) { print_r($word); } } 此外, 繁体词库很不完善, 缺词太多而且有一些词也不正确

107.scws 1.2.2的问题,为什么PHP调用c扩展和直接在c语言环境下得到的分词结果不一样?

发布时间:2014-02-24 10:02 t By 562586756

比如说“这本书”,在用C语言编译调用scws分词结果为"这/本书",但是编译为php扩展后调用,结果为"这本书",没有分掉,同一份代码同一个词库同一个规则集,为什么会出现不一样的结果?

108.同义词搜索

...词)。 **同义词搜索** 完全依赖于您事先设置好的同义词库词库内每条记录由“标准词(原词)”和“同义词”组成, 它们都必须是独立的词汇,也就是最小的索引单位,不可以是多个词组成的短语。 > tip: 独立词汇的意思...

109.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压不死锁)

发布时间:2013-03-26 16:03 t By vus520

...,用于生成文章的tag,我自己给定了一个用户自定义词库,在$tokenizer->getTops()时,不能找出我想要的语词,$tokenizer->getResult能获取到所有分词的结果,不知道这个问题的原因是怎么产生的。请指点一下。 以下是我的字典定...

110.英文数字组合字符串分词问题,已结贴。

更新时间:2014-05-14 10:05 t By hpxl

...url] 得到的结果为“华硕/主板/H/61/-/PLUS”。尝试过自定义词库,$prefix/data/项目名称/dict_user.txt 加入H61,但是不起作用,中文词汇是可以的。如果想分词结果中有H61,是不是只能自定义分词了?像这种商品的型号中很多类似的,...

  • 时间不限
  • 按相关性排序